Pythonに限らないのですが、プログラム言語の初心者です。
雑誌のCIFAR10の画像データを使ったディープラーニングAI超入門、 画像認識AI..
の記事に興味を持ち、記載リストどおりに入力しました。かなり時間がかかりましたが何とか最終ページのGPUを利用した解析ができました。今度はオリジナルの画像(JPG)を使い、記事コードの最小限の変更にとどめて実際に動かしたいと思っています。
画像データファイルは用意できるのですが、ローカルなPC環境と違いすぎて、フォルダを何処にどのように作るのかさえ分かりません。ファイルの移動やプログラムへの画像ファイル形式の異なるデータの読み込み法も分かりません。どなたかアドバイスをください。
記事ではGoogle ColaboratoryというWEBブラウザベースの開発環境の中で、Pytorchを使うメリットが高いと説明されているので、この環境で実際にオリジナル画像をAI解析してみたいのです。
過去のteratailの質問回答をみたり、ネットで探したのですが、質問の仕方や探し方が悪いのか解決に至っていません
画像の種類によって異なることなど状況によって異なるらしいのですが、理解できていません。データ保存のためにディレクトリをマウントするとの記述もあり、下記のコードの実行はできます。このことと何か、関係があるのでしょうか。
条件
windows10
64ビット オペレーティングシステム
Google Colaboratory 20210802 時点での最新版インストール
Pytorch 20210802 時点の最新版で開始
◆データ保存に関する記述
from google.colab import drive
drive.mount(‘/content/drive’)
◆記事記載の読み込みと思えるプログラムコードは下記のとおりです。
import torch
import torchvision
import torchvision.transforms as transforms
transform=transforms.Compose(
[transforms.ToTensor(),
transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))])
trainset=torchvision.datasets.CIFAR10(root=’./data’, train=True,
download=True, transform=transform)
trainloader=torch.utils.data.DataLoader(trainset,batch_size=4,
shuffle=True, num_workers=2)
testset=torchvision.datasets.CIFAR10(root=’data’, train =False,
download=True, transform=transform)
testloader=torch.utils.data.DataLoader(testset,batch_size=4,
shuffle=False, num_workers=2)
classes= (‘plane’, ‘car’,’bird’,’cat’, ‘deer’,’dog’, ‘frog’,’horse’,’ship’,’truck’)
◆雑誌記載の訓練データの一部表示するコードは次のとおりでした。
import matplotlib.pyplot as plt
import numpy as np
def imshow(img):
img=img/2+0.5
npimg=img.numpy()
plt.imshow(np.transpose(npimg,(1,2,0)))
plt.show()
dataiter = iter(trainloader)
images,labels= dataiter.next()
imshow(torchvision.utils.make_grid(images))
print(‘ ‘.join(‘%5s’ % classes[labels[j]] for j in range(4)))
以上