cifar10はpythonバージョンとバイナリデータ版のファイルがダウンロードできます。
バイナリデータの形式は
<1 x label><3072 x pixel> ... <1 x label><3072 x pixel>
となっていますが、これはpythonでは下記のデータ構造と同じでしょうか?
これは[ラベル値(label),画像値(image)]のリストです。
リスト([label,image])
[6, array([ 59, 43, 50, ..., 140, 84, 72], dtype=uint8)] [9, array([154, 126, 105, ..., 139, 142, 144], dtype=uint8)] [9, array([255, 253, 253, ..., 83, 83, 84], dtype=uint8)] [4, array([28, 37, 38, ..., 28, 37, 46], dtype=uint8)] [1, array([170, 168, 177, ..., 82, 78, 80], dtype=uint8)] [1, array([159, 150, 153, ..., 14, 17, 19], dtype=uint8)] [2, array([164, 105, 118, ..., 29, 26, 44], dtype=uint8)] [7, array([ 28, 30, 33, ..., 100, 99, 96], dtype=uint8)] [8, array([134, 131, 128, ..., 136, 137, 138], dtype=uint8)] [3, array([125, 110, 102, ..., 82, 84, 86], dtype=uint8)] [4, array([53, 54, 56, ..., 39, 46, 41], dtype=uint8)] [7, array([142, 172, 176, ..., 105, 106, 111], dtype=uint8)] [7, array([164, 162, 162, ..., 108, 107, 100], dtype=uint8)] [2, array([17, 17, 17, ..., 20, 18, 16], dtype=uint8)]```
単純にopen()とread()を利用する方法ではだめなのでしょうか?
https://www.cs.toronto.edu/~kriz/cifar.html にbinary/python 各データ形式およびpython読込方法が明記されておりますが、具体的に何が分からないのでしょうか?
掲載のデータ形式と等しいpythonでのデータ形式は質問内容のデータ形式でよろしいでしょうか?回答よろしくお願いします
arrayのshapeとdtypeがバイナリと同じか資料と確認すれば明らかと思うのですが、確認した結果はいかがでしょうか?
shapeは同じなのですが、2つのリストが要素のリスト[[labelのリスト(10000,)],[imageリスト(10000,3072)]]なのか、質問内容の形のどちらなのでしょうか?初歩的内容ですが、よろしくお願いします
あなたが質問文で提示されているとおりに解釈すると[label,image]が10000?個のリストだと思われるのですが、違いますでしょうか?
はいそうです、[label(1,),image(3072)]の10000のリストです
結論出たようですので、自己回答をお勧めします。
回答1件
あなたの回答
tips
プレビュー