現在、DeepLearningの勉強をしています。mnistサンプルコードを応用(?)して、自分で取り込んだ画像に書いてある数字を当てるモノを作ることを目的としました。
参考にしたサイトはpythorchでDeep Learningです。
この、「2018番目の画像データを推論してみる」の入力を自分で入手した画像の変えれば目的を達成できるのかと思い、以下のコードを作成しました。
以下が作成したコードです。
python
1from sklearn.datasets import fetch_mldata 2 3mnist = fetch_mldata('MNIST original', data_home=".") 4X = mnist.data / 255 5y = mnist.target 6import matplotlib.pyplot as plt 7 8 9plt.imshow(X[0].reshape(28, 28), cmap='gray') 10print("This is {:.0f}".format(y[0])) 11import torch 12from torch.utils.data import TensorDataset, DataLoader 13 14from sklearn.model_selection import train_test_split 15X_train, X_test, y_train, y_test = train_test_split( 16 X, y, test_size=1/7, random_state=0) 17 18X_train = torch.Tensor(X_train) 19X_test = torch.Tensor(X_test) 20y_train = torch.LongTensor(y_train) 21y_test = torch.LongTensor(y_test) 22 23ds_train = TensorDataset(X_train, y_train) 24ds_test = TensorDataset(X_test, y_test) 25 26loader_train = DataLoader(ds_train, batch_size=64, shuffle=True) 27loader_test = DataLoader(ds_test, batch_size=64, shuffle=False) 28 29from torch import nn 30 31model = nn.Sequential() 32model.add_module('fc1', nn.Linear(28*28, 100)) 33model.add_module('relu1', nn.ReLU()) 34model.add_module('fc2', nn.Linear(100, 100)) 35model.add_module('relu2', nn.ReLU()) 36model.add_module('fc3', nn.Linear(100, 10)) 37 38print(model) 39from torch import optim 40 41loss_fn = nn.CrossEntropyLoss() 42 43optimizer = optim.Adam(model.parameters(), lr=0.01) 44 45from torch.autograd import Variable 46 47def train(epoch): 48 model.train() 49 for data, target in loader_train: 50 data, target = Variable(data), Variable(target) 51 optimizer.zero_grad() 52 output = model(data) 53 loss = loss_fn(output, target) 54 loss.backward() 55 optimizer.step() 56 print("epoch{}:end\n".format(epoch)) 57 58def test(): 59 model.eval() 60 correct = 0 61 for data, target in loader_test: 62 data, target = Variable(data), Variable(target) 63 output = model(data) 64 pred = output.data.max(1, keepdim=True)[1] 65 correct += pred.eq(target.data.view_as(pred)).sum() 66 data_num = len(loader_test.dataset) 67 print('\n answer: {}/{} ({:.0f}%)\n'.format(correct,data_num, 100. * correct / data_num)) 68 69for epoch in range(3): 70 train(epoch) 71 72test() 73 74import cv2 75img1 = cv2.imread('awa.jpg') 76gray = cv2.cvtColor(img1, cv2.COLOR_RGB2GRAY) 77data = Variable(gray) 78output = model(data) 79pred = output.data.max(0, keepdim=True)[1] 80print("I think {}".format(pred)) 81コード
動かしたところ、以下のエラーが検出されました。
variable data has to be a tensor, but got numpy.ndarray
使用した画像はPNGイメージで、画像の大きさは225×225、サイズは1.63 KBです。
入力データがテンソルではないといわれているのだと思いますが、どのように形を合わせればよいかわかりません。
データセットの画像ではなく自分が用意した画像をDeepLearningにかけるというような内容のもので、よい文献等教えていただきたいです。
また、上記のエラーについても教えていただけると助かります
あなたの回答
tips
プレビュー