質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.47%

  • Python 3.x

    10255questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • 機械学習

    985questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • Keras

    508questions

kerasでSyntaxErrorがでます。

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 435

yep

score 39

自力で単純なautoencoderを頑張って書いてみました。
しかし、
File "C:\Users\yudai\Desktop\keras_AE.py", line 53
encoded_h1 = Dense(128, activation='relu')(input_word)
^
SyntaxError: invalid syntax
と出力されます。
もし原因がわかる方やもっとこうしたらいいのに、というご意見がある方は、
何卒、ご教授宜しくお願い致します。

from keras.layers import Input, Dense
from keras.models import Model
import numpy as np
import io
#学習結果の図式化用モジュール
from keras.utils.visualize_util import plot

#データの前処理
#データの読み込み
path = get_file('C:\Users\hoge\Desktop\poem.txt')
with io.open(path, encoding='utf-8') as f:
    text = f.read()
#コーパスの長さ
print('corpus length:', len(text))
#文字数を数えるため、textをソート
chars = sorted(list(set(text)))
#全文字数の表示
print('total chars:', len(chars))
#文字をID変換
char_indices = dict((c, i) for i, c in enumerate(chars))
#IDから文字へ変換
indices_char = dict((i, c) for i, c in enumerate(chars))
#テキストを一行ずつ読み込む
maxlen = f.readline()
#サンプルバッチ数
step = 3
sentences = []
next_chars = []
for i in range(0, len(text) - maxlen, step):
    sentences.append(text[i: i + maxlen])
    next_chars.append(text[i + maxlen])
#学習する文字数を表示
print('Sequences:', len)

#ベクトル化する
print('Vectorization...')
x = np.zeros((len(sentences), maxlen, len(chars)), dtype=np.bool)
y = np.zeros((len(sentences), len(chars)), dtype=np.bool)
for i, sentence in enumerate(sentences):
    for t, char in enumerate(sentence):
        x[i, t, char_indices[char]] = 1
    y[i, char_indices[next_chars[i]]] = 1

#モデルを構築する工程に入る
print('Build model...')
#encoderの次元
encoding_dim = 128
#入力用の変数
input_word = Input(shape=(x ,y)
#入力された語がencodeされたものを格納する
encoded_h1 = Dense(128, activation='relu')(input_word)
encoded_h2 = Dense(64, activation='relu')(encoded_h1)
encoded_h3 = Dense(32, activation='relu')(encoded_h2)
#潜在変数(実質的な主成分分析)
latent = Dense(8, activation='relu')(encoded_h3)
#encodeされたデータを再構成
decoded_h1 = Dense(32, activation='relu')(latent)
decoded_h2 = Dense(64, activation='relu')(decoded_1)
decoded_h3 = Dense(128, activation='relu')(encoded_2)

output = Dense(100, activation)

autoencoder = Model(input=input_word, output=decoded)
#Adamで最適化、loss関数をcategorical_crossentropy
autoencoder.compile(optimizer='Adam', loss='categorical_crossentropy')

plot(autoencoder, to_file='AE_model.png')
#autoencoderの実行
autoencoder.fit(x_train,
                epoch=1000,
                batch_size=256,
                shuffle=True,
                validation_data=(test_word)
#モデルの構造を保存
model_json = autoencoder.to_json()
with open('keras_AE.json', 'w') as json_file:
    json_file.write(model_json)
#学習済みモデルの重みを保存
autoencoder.save_weights('AE.h5')

decoded_word = autoencoder.predict(word_test)

X_embedded = model.predict(X_train)
autoencoder.fit(X_embedded,X_embedded,epochs=10,
            batch_size=256, validation_split=.1)


C:\Users\hoge\Desktop\poem.txtは、webから2万9000件の俳句を一文ずつ抽出し、MeCabで形態素解析を行っています。
例:かき くえば かね が なる なり ほうりゅうじ

環境

Windows 10

python 3.7.0
tensorflow-gpu 1.9.0
keras 2.2.4

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+1

SyntaxErrorはkerasとは一切関係ない、ただのpythonの構文エラーです。

input_word = Input(shape=(x ,y)

カッコの閉じ忘れ。

75行目あたりにも同じミスがありますね。

autoencoder.fit(x_train,
                epoch=1000,
                batch_size=256,
                shuffle=True,
                validation_data=(test_word)

SyntaxErrorはこれで終わりですが(コピペして確認した限りでは)、まだまだたくさんエラーが出るみたいなので頑張ってデバッグしてください。

静的解析ツールを使える開発環境を利用することをおすすめします。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/10/22 16:19

    今のところ、
    プレフィックスに'r'を付けunicode errorを修正
    ライブラリをimport codecsなどにしてやっとkerasがでてきました。
    input_word = Input(shape=(x ,y))で
    TypeError: Error converting shape to a TensorShape: only size-1 arrays can be converted to Python scalars.
    となります。
    x, yを入力させるはずなのですが。

    キャンセル

  • 2018/10/22 16:25

    shapeは配列の次元数(numpy配列のshapeと同様)を指定する引数なので、データらしきものを渡しているのがそもそもおかしいです
    私はkerasに詳しくないのと、質問文のコードを読み込んでいないので、これ以上の適切な回答はすぐにはできません。別に質問を立てた方が迅速に解決するかと思います

    キャンセル

  • 2018/10/22 16:48

    そうだったんですね。
    丁寧なご回答ありがとうございました。
    とりあえずですが、Input(shape=(x ,y)を
    Input(shape=(32, )で通りはしましたが、まだまだエラーが頻発しているので直していきたいです。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.47%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • Python 3.x

    10255questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • 機械学習

    985questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • Keras

    508questions