質問編集履歴
5
文章修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -25,9 +25,9 @@
|
|
25
25
|
for i, data in enumerate(dataset_loader):
|
26
26
|
print(data)
|
27
27
|
```
|
28
|
-
|
29
|
-
|
30
|
-
[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],1.0]・・・・
|
28
|
+
### 出力のイメージ
|
29
|
+
datasizeは40個の要素が入ったベクトルが1000個、batch_size=2であれば、2組500セット返ってくることをイメージ
|
30
|
+
[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],1.0],[[1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1],0.0]・・・・
|
31
31
|
|
32
32
|
実際出てきたのはこのように2つづつのdataと最後にlabelがくっついたものでした。
|
33
33
|
[[tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), ・・・・・・・・・・([0, 0])], tensor([0., 0.], dtype=torch.float64)]
|
4
文章修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -26,8 +26,8 @@
|
|
26
26
|
print(data)
|
27
27
|
```
|
28
28
|
datasizeは40個の要素が入ったdata1000個あるとして、
|
29
|
-
下記のよう
|
29
|
+
下記のような40個の値が入ったベクトルがbatch_size=2なので2組、500セット返ってくることをイメージしてたのですが、
|
30
|
-
[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],1.0]・・・・
|
30
|
+
[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],1.0]・・・・
|
31
31
|
|
32
32
|
実際出てきたのはこのように2つづつのdataと最後にlabelがくっついたものでした。
|
33
33
|
[[tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), tensor([0, 0]), ・・・・・・・・・・([0, 0])], tensor([0., 0.], dtype=torch.float64)]
|
3
改行などを修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -2,19 +2,19 @@
|
|
2
2
|
PyTorchで自作のDetasetを作ってDataLoaderに渡して中身の確認をしています。
|
3
3
|
CSVの中身です。
|
4
4
|
ID CLS VAL (VALに0、1が40個入っています)
|
5
|
-
0
|
5
|
+
0 0 1,0,0,0,0,0,0,1,0,0,0,1,0,0,1,1,1,0,1,1,1,1,1,0
|
6
|
-
1
|
6
|
+
1 0 1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,1,1,0,1,0,1,1,1,0
|
7
|
-
2
|
7
|
+
2 1 1,0,0,0,1,0,0,0,0,0,0,1,0,0,1,0,1,0,0,1,0,1,1,0
|
8
|
-
3
|
8
|
+
3 0 1,0,0,0,0,0,0,0,0,0,0,1,1,0,1,1,1,0,1,1,1,0,1,0
|
9
|
-
4
|
9
|
+
4 0 1,0,0,1,0,0,0,1,0,0,0,1,1,0,1,1,0,0,1,1,1,1,1,0
|
10
|
-
...
|
10
|
+
... ... ...
|
11
|
-
995
|
11
|
+
995 0 1,0,0,1,0,0,0,1,0,0,0,1,1,0,1,1,1,0,1,1,1,1,1,0
|
12
|
-
996
|
12
|
+
996 1 1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,0,0,0,1,0,1,0,1,0
|
13
|
-
997
|
13
|
+
997 0 1,0,0,0,1,0,0,1,0,0,0,1,1,0,1,1,1,0,0,0,1,1,0,0
|
14
|
-
998
|
14
|
+
998 1 1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,0,1,0,0,1,1,1,0,0
|
15
|
-
999
|
15
|
+
999 1 1,0,0,0,1,0,0,1,0,0,0,1,1,0,1,1,0,1,0,1,1,0,0,0
|
16
|
-
IDとVALをdataとしてlistに[[1, 0, 1,
|
16
|
+
[ID]と[VAL]を[data]としてlistに-->[[1, 0, 1,・・・・0, 1, 0, 1, 0, 1]、[1, 0, 0, ・・・・0, 0, 0,]・・ ]]
|
17
|
-
CLSをlabelとしてlistに[[0],[1],[0],・・・・・・]]
|
17
|
+
[CLS]をlabelとして[list]に-->[[0],[1],[0],・・・・・・]]
|
18
18
|
Datasetでは、 returnで data,label を1組ずつ返してます。
|
19
19
|
|
20
20
|
下記のコードでprintして、
|
2
csvの中身について追記しました。説明不足ですみません。
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,5 +1,21 @@
|
|
1
1
|
# DataLoaderのふるまいの正解がわからない
|
2
2
|
PyTorchで自作のDetasetを作ってDataLoaderに渡して中身の確認をしています。
|
3
|
+
CSVの中身です。
|
4
|
+
ID CLS VAL (VALに0、1が40個入っています)
|
5
|
+
0 0 1,0,0,0,0,0,0,1,0,0,0,1,0,0,1,1,1,0,1,1,1,1,1,0
|
6
|
+
1 0 1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,1,1,0,1,0,1,1,1,0
|
7
|
+
2 1 1,0,0,0,1,0,0,0,0,0,0,1,0,0,1,0,1,0,0,1,0,1,1,0
|
8
|
+
3 0 1,0,0,0,0,0,0,0,0,0,0,1,1,0,1,1,1,0,1,1,1,0,1,0
|
9
|
+
4 0 1,0,0,1,0,0,0,1,0,0,0,1,1,0,1,1,0,0,1,1,1,1,1,0
|
10
|
+
... ... ...
|
11
|
+
995 0 1,0,0,1,0,0,0,1,0,0,0,1,1,0,1,1,1,0,1,1,1,1,1,0
|
12
|
+
996 1 1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,0,0,0,1,0,1,0,1,0
|
13
|
+
997 0 1,0,0,0,1,0,0,1,0,0,0,1,1,0,1,1,1,0,0,0,1,1,0,0
|
14
|
+
998 1 1,0,0,0,0,0,0,1,0,0,0,1,1,0,1,0,1,0,0,1,1,1,0,0
|
15
|
+
999 1 1,0,0,0,1,0,0,1,0,0,0,1,1,0,1,1,0,1,0,1,1,0,0,0
|
16
|
+
IDとVALをdataとしてlistに[[1, 0, 1, 0, 0, ・・・・0, 1, 0, 1, 0, 1]、[1, 0, 0, ・・・・0, 0, 0,]・・ ]]
|
17
|
+
CLSをlabelとしてlistに[[0],[1],[0],・・・・・・]]
|
18
|
+
Datasetでは、 returnで data,label を1組ずつ返してます。
|
3
19
|
|
4
20
|
下記のコードでprintして、
|
5
21
|
```Python
|
1
文章を直しました
title
CHANGED
File without changes
|
body
CHANGED
@@ -10,7 +10,7 @@
|
|
10
10
|
print(data)
|
11
11
|
```
|
12
12
|
datasizeは40個の要素が入ったdata1000個あるとして、
|
13
|
-
下記のように40このベクトルがbatch_size=2なので2
|
13
|
+
下記のように40このベクトルがbatch_size=2なので2組になって、500セット返ってくることをイメージしてたのですが、
|
14
14
|
[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],1.0]・・・・(×data数分)
|
15
15
|
|
16
16
|
実際出てきたのはこのように2つづつのdataと最後にlabelがくっついたものでした。
|