編集履歴

質問編集履歴

文章修正

2020/10/06 14:48

投稿

mn.py

スコア41

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -25,9 +25,9 @@
 for i, data in enumerate(dataset_loader):
     print(data)
 ```
-datasizeは４０個の要素が入ったdata１０００個あるとして、
-下記のような40個の値が入ったベクトルがbatch_size=2なので２組、５００セット返ってくることをイメージしてたのですが、
-[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],1.0]・・・・
+### 出力のイメージ
+datasizeは４０個の要素が入ったベクトルが１０００個、batch_size=2であれば、２組５００セット返ってくることをイメージ
+[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],1.0],[[1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1],0.0]・・・・
 実際出てきたのはこのように２つづつのdataと最後にlabelがくっついたものでした。
 [[tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), ・・・・・・・・・・([0, 0])], tensor([0., 0.], dtype=torch.float64)]

7 514 1051 1161 1508

文章修正

2020/10/06 14:48

投稿

mn.py

スコア41

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -26,8 +26,8 @@
     print(data)
 ```
 datasizeは４０個の要素が入ったdata１０００個あるとして、
-下記のように40このベクトルがbatch_size=2なので２組になって、５００セット返ってくることをイメージしてたのですが、
+下記のような40個の値が入ったベクトルがbatch_size=2なので２組、５００セット返ってくることをイメージしてたのですが、
-[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],1.0]・・・・（×data数分）
+[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],1.0]・・・・
 実際出てきたのはこのように２つづつのdataと最後にlabelがくっついたものでした。
 [[tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), ・・・・・・・・・・([0, 0])], tensor([0., 0.], dtype=torch.float64)]

7 514 1051 1161 1508

改行などを修正

2020/10/06 14:43

投稿

mn.py

スコア41

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -2,19 +2,19 @@
 PyTorchで自作のDetasetを作ってDataLoaderに渡して中身の確認をしています。
 CSVの中身です。
 ID      CLS     VAL (VALに０、１が４０個入っています)
-0	0       1,0,0,0,0,0,0,1,0,0,0,1,0,0,1,1,1,0,1,1,1,1,1,0
+0	　　0       1,0,0,0,0,0,0,1,0,0,0,1,0,0,1,1,1,0,1,1,1,1,1,0
-1	0	1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,1,1,0,1,0,1,1,1,0
+1	　　0	　1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,1,1,0,1,0,1,1,1,0
-2	1	1,0,0,0,1,0,0,0,0,0,0,1,0,0,1,0,1,0,0,1,0,1,1,0
+2	　　1	　1,0,0,0,1,0,0,0,0,0,0,1,0,0,1,0,1,0,0,1,0,1,1,0
-3	0	1,0,0,0,0,0,0,0,0,0,0,1,1,0,1,1,1,0,1,1,1,0,1,0
+3	　　0	　1,0,0,0,0,0,0,0,0,0,0,1,1,0,1,1,1,0,1,1,1,0,1,0
-4	0	1,0,0,1,0,0,0,1,0,0,0,1,1,0,1,1,0,0,1,1,1,1,1,0
+4	　　0	　1,0,0,1,0,0,0,1,0,0,0,1,1,0,1,1,0,0,1,1,1,1,1,0
-...	...	...
+...	　　...	...
-995	0	1,0,0,1,0,0,0,1,0,0,0,1,1,0,1,1,1,0,1,1,1,1,1,0
+995	　0	　1,0,0,1,0,0,0,1,0,0,0,1,1,0,1,1,1,0,1,1,1,1,1,0
-996	1	1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,0,0,0,1,0,1,0,1,0
+996	　1	　1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,0,0,0,1,0,1,0,1,0
-997	0	1,0,0,0,1,0,0,1,0,0,0,1,1,0,1,1,1,0,0,0,1,1,0,0
+997	　0	　1,0,0,0,1,0,0,1,0,0,0,1,1,0,1,1,1,0,0,0,1,1,0,0
-998	1	1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,0,1,0,0,1,1,1,0,0
+998	　1	　1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,0,1,0,0,1,1,1,0,0
-999	1	1,0,0,0,1,0,0,1,0,0,0,1,1,0,1,1,0,1,0,1,1,0,0,0
+999	　1	　1,0,0,0,1,0,0,1,0,0,0,1,1,0,1,1,0,1,0,1,1,0,0,0
-IDとVALをdataとしてlistに[[1, 0, 1, 0, 0, ・・・・0, 1, 0, 1, 0, 1]、[1, 0, 0, ・・・・0, 0, 0,]・・ ]]
+[ID]と[VAL]を[data]としてlistに-->[[1, 0, 1,・・・・0, 1, 0, 1, 0, 1]、[1, 0, 0, ・・・・0, 0, 0,]・・ ]]
-CLSをlabelとしてlistに[[0],[1],[0],・・・・・・]]
+[CLS]をlabelとして[list]に-->[[0],[1],[0],・・・・・・]]
 Datasetでは、　returnで　data,label　を１組ずつ返してます。
 下記のコードでprintして、

7 514 1051 1161 1508

csvの中身について追記しました。説明不足ですみません。

2020/10/06 14:41

投稿

mn.py

スコア41

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,5 +1,21 @@
 # DataLoaderのふるまいの正解がわからない
 PyTorchで自作のDetasetを作ってDataLoaderに渡して中身の確認をしています。
+CSVの中身です。
+ID      CLS     VAL (VALに０、１が４０個入っています)
+0	0       1,0,0,0,0,0,0,1,0,0,0,1,0,0,1,1,1,0,1,1,1,1,1,0
+1	0	1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,1,1,0,1,0,1,1,1,0
+2	1	1,0,0,0,1,0,0,0,0,0,0,1,0,0,1,0,1,0,0,1,0,1,1,0
+3	0	1,0,0,0,0,0,0,0,0,0,0,1,1,0,1,1,1,0,1,1,1,0,1,0
+4	0	1,0,0,1,0,0,0,1,0,0,0,1,1,0,1,1,0,0,1,1,1,1,1,0
+...	...	...
+995	0	1,0,0,1,0,0,0,1,0,0,0,1,1,0,1,1,1,0,1,1,1,1,1,0
+996	1	1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,0,0,0,1,0,1,0,1,0
+997	0	1,0,0,0,1,0,0,1,0,0,0,1,1,0,1,1,1,0,0,0,1,1,0,0
+998	1	1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,0,1,0,0,1,1,1,0,0
+999	1	1,0,0,0,1,0,0,1,0,0,0,1,1,0,1,1,0,1,0,1,1,0,0,0
+IDとVALをdataとしてlistに[[1, 0, 1, 0, 0, ・・・・0, 1, 0, 1, 0, 1]、[1, 0, 0, ・・・・0, 0, 0,]・・ ]]
+CLSをlabelとしてlistに[[0],[1],[0],・・・・・・]]
+Datasetでは、　returnで　data,label　を１組ずつ返してます。
 下記のコードでprintして、
 ```Python

7 514 1051 1161 1508

文章を直しました

2020/10/06 14:28

投稿

mn.py

スコア41

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -10,7 +10,7 @@
     print(data)
 ```
 datasizeは４０個の要素が入ったdata１０００個あるとして、
-下記のように40このベクトルがbatch_size=2なので２セットになって５００セット返ってくることをイメージしてたのですが、
+下記のように40このベクトルがbatch_size=2なので２組になって、５００セット返ってくることをイメージしてたのですが、
 [[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],1.0]・・・・（×data数分）
 実際出てきたのはこのように２つづつのdataと最後にlabelがくっついたものでした。

7 514 1051 1161 1508