TensorFlowでの訓練データについて(自然言語処理)

Neural networkで何か作ってみたいと思い、チュートリアルを参考にして、自分で実装しようと思いました。
チュートリアルと同じことをやっても嫌だなと思ったので固有抽出表現というラベル付けの識別を自分で実装しています。チュートリアルと変わることは、入力するデータ型とくらいです。

チュートリアルでは入力は手書き文字の28x28の画像ベクトルでした。今回はそれが各単語をword2vecにより単語をベクトル化した300次元のベクトルとしました。ラベルに関してはラベル名をid化した18この数字です。

python
1import tensorflow as tf
2import numpy as np
3
4batch_size = 100 # バッチの数
5#それぞれのtensorを作成する
6x = tf.placeholder(tf.float32, [None,len(Xvec[0])])
7W = tf.Variable(tf.zeros([len(Xvec[0]),len(set(label))]))
8b = tf.Variable(tf.zeros([len(set(label))]))
9
10#モデルの作成
11y = tf.nn.softmax(tf.matmul(x, W) + b)
12#正解を入れるための箱を宣言
13y_ = tf.placeholder(tf.float32, [None,len(set(Y))])
14#学習の方法を交差エントロピーの減少と設定。
15cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices=[1]))
16#学習方法を勾配降下法と設定
17train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)
18
19#sessionを起動
20sess = tf.InteractiveSession()
21tf.global_variables_initializer().run()
22
23#batchごとに学習開始
24for i in range(0, len(Xvec), batch_size):
25    x_batch = Xvec[i:i+batch_size]
26    y_batch = label[i:i+batch_size]
27→    sess.run(train_step, feed_dict={x: x_batch, y_: y_batch})
28#ここで下エラーが出る
29#ValueError: setting an array element with a sequence.

調べたところnumpyのところでエラーが出てると書いてありました。
データ型がおかしいのかと思い、調べましたがXvecもlabelもどちらもfloat32になっていました。
他に考えられる原因はfeed.dictで与える型がfloat32ではダメなのかと思いました。
また、x_batchの中身が配列になっているのもダメなのではないかと思います。

いろいろ考えたら頭の中がぐちゃぐちゃしてしまいました。解決策がございましたらお願いいたします。

データについて参考となりそうなものを載せておきます。

python
1> Xvec.dtype
2dtype('O')
3> Xvec[0].dtype
4dtype('float32')
5>len(Xvec)
616015
7>label.dtype
8dtype('float32')
9>Xvec.shape
10(16009,)
11>Xvec[0]
12array([ -2.01150000e-01,   1.67799994e-01,  -1.45109996e-01,
13        -1.99019998e-01,   2.93040007e-01,   2.08790004e-01,
14         3.25360000e-01,              ...             -4.27370012e-01, 
15           -9.79190022e-02,   2.06489995e-01], dtype=float32)
16>label
17array([  1.,   9.,   9., ...,  16.,  16.,  16.], dtype=float32)

長くなりましたが、よろしくお願いいたします。
他にも必要なデータがございましたら、いってください。

行動規範の内容に同意します

回答1件

ベストアンサー

TensorFlowはほとんど初心者ですが、MNISTチュートリアルを確認したところ
labelのshapeが気になります。（１-ホットベクトルになっていない）

つまりlabelは

[  1.,   9.,   9., ...,  16.,  16.,  16.]

ではなく、以下のような形になっていないといけないのではないでしょうか？

[[ 1.  0.  0. ...,  0.  0.  0.] # １番目のみ1
 [ 0.  0.  0. ...,  1.  0.  0.] # ９番目のみ1
 [ 0.  0.  0. ...,  1.  0.  0.]
 ..., 
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  1.  0.]]

ちなみにMNISTチュートリアルで利用されているデータ内容の確認結果は以下のようになっています。

Python
1mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
2# 確認表示
3print("image:shape=%s)"%(repr(mnist.train.images.shape)))
4print(mnist.train.images)
5print("label:shape=%s)"%(repr(mnist.train.labels.shape)))
6print(mnist.train.labels)

上記の結果

image:shape=(55000, 784))
[[ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 ..., 
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]]
label:shape=(55000, 10))
[[ 0.  0.  0. ...,  1.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 ..., 
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  1.  0.]]

投稿2017/03/28 09:24