Neural networkで何か作ってみたいと思い、チュートリアルを参考にして、自分で実装しようと思いました。
チュートリアルと同じことをやっても嫌だなと思ったので固有抽出表現というラベル付けの識別を自分で実装しています。チュートリアルと変わることは、入力するデータ型とくらいです。
チュートリアルでは入力は手書き文字の28x28の画像ベクトルでした。今回はそれが各単語をword2vecにより単語をベクトル化した300次元のベクトルとしました。ラベルに関してはラベル名をid化した18この数字です。
python
1import tensorflow as tf 2import numpy as np 3 4batch_size = 100 # バッチの数 5#それぞれのtensorを作成する 6x = tf.placeholder(tf.float32, [None,len(Xvec[0])]) 7W = tf.Variable(tf.zeros([len(Xvec[0]),len(set(label))])) 8b = tf.Variable(tf.zeros([len(set(label))])) 9 10#モデルの作成 11y = tf.nn.softmax(tf.matmul(x, W) + b) 12#正解を入れるための箱を宣言 13y_ = tf.placeholder(tf.float32, [None,len(set(Y))]) 14#学習の方法を交差エントロピーの減少と設定。 15cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices=[1])) 16#学習方法を勾配降下法と設定 17train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy) 18 19#sessionを起動 20sess = tf.InteractiveSession() 21tf.global_variables_initializer().run() 22 23#batchごとに学習開始 24for i in range(0, len(Xvec), batch_size): 25 x_batch = Xvec[i:i+batch_size] 26 y_batch = label[i:i+batch_size] 27→ sess.run(train_step, feed_dict={x: x_batch, y_: y_batch}) 28#ここで下エラーが出る 29#ValueError: setting an array element with a sequence.
調べたところnumpyのところでエラーが出てると書いてありました。
データ型がおかしいのかと思い、調べましたがXvecもlabelもどちらもfloat32になっていました。
他に考えられる原因はfeed.dictで与える型がfloat32ではダメなのかと思いました。
また、x_batchの中身が配列になっているのもダメなのではないかと思います。
いろいろ考えたら頭の中がぐちゃぐちゃしてしまいました。解決策がございましたらお願いいたします。
データについて参考となりそうなものを載せておきます。
python
1> Xvec.dtype 2dtype('O') 3> Xvec[0].dtype 4dtype('float32') 5>len(Xvec) 616015 7>label.dtype 8dtype('float32') 9>Xvec.shape 10(16009,) 11>Xvec[0] 12array([ -2.01150000e-01, 1.67799994e-01, -1.45109996e-01, 13 -1.99019998e-01, 2.93040007e-01, 2.08790004e-01, 14 3.25360000e-01, ... -4.27370012e-01, 15 -9.79190022e-02, 2.06489995e-01], dtype=float32) 16>label 17array([ 1., 9., 9., ..., 16., 16., 16.], dtype=float32)
長くなりましたが、よろしくお願いいたします。
他にも必要なデータがございましたら、いってください。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/03/29 02:36