質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.47%

  • Python 3.x

    10250questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

テキストを一行ずつ読み込みたい

解決済

回答 3

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 415

yep

score 39

下記のようなデータを一行ずつ読み込みたいと考えています。
そこで、コードの9行目、

poems = f.read().splitlines()


poems = f.readlines().splitlines()


に変えると、

Traceback (most recent call last):
File "/home/yudai/Desktop/keras_AE.py", line 9, in <module>
poems = f.readlines().splitlines()
AttributeError: 'list' object has no attribute 'splitlines'

と出ます。

朝霧 の 中 に 九段 の ともし 哉
あたたか な 雨 が 降る なり 枯葎
菜の花 や は つと 明るき 町 は づれ
秋風 や 伊予 へ 流る る 汐 の 音
長閑 さ や 障子 の 穴 に 海 見え て

# coding:utf-8
import numpy as np
import codecs
from keras.layers import Activation, Dense, Input
from keras.models import Model

#データの読み込み
with open(r'/home/yudai/Desktop/poem.txt', encoding='utf-8') as f:
    poems = f.read().splitlines()
text = poems[0]  # 1個目のデータ
print(text)
# コーパスの長さ
print('corpus length:', len(text))
# 文字数を数えるため、textをソート
chars = sorted(list(set(text)))
# 全文字数の表示
print('total chars:', len(chars))
# 文字をID変換
char_indices = dict((c, i) for i, c in enumerate(chars))
# IDから文字へ変換
indices_char = dict((i, c) for i, c in enumerate(chars))
#テキストを17文字ずつ読み込む
maxlen = 1
#サンプルバッチ数
step = 1
sentences = []
next_chars = []
for i in range(0, len(text) - maxlen, step):
    sentences.append(text[i: i + maxlen])
    next_chars.append(text[i + maxlen])
#学習する文字数を表示
print('Sequences:', sentences)
print('next_chars:', next_chars)
#ベクトル化する
print('Vectorization...')
x = np.zeros((len(sentences), maxlen, len(chars)), dtype=np.bool)
y = np.zeros((len(sentences), len(chars)), dtype=np.bool)
for i, sentence in enumerate(sentences):
    for t, char in enumerate(sentence):
        x[i, t, char_indices[char]] = 1
    y[i, char_indices[next_chars[i]]] = 1
#モデルを構築する工程に入る
print('Build model...')
#encoderの次元
encoding_dim = 128
#入力用の変数
input_word = Input(shape=(maxlen, len(chars)))
#入力された語がencodeされたものを格納する
encoded = Dense(128, activation='relu')(input_word)
encoded = Dense(64, activation='relu')(encoded)
encoded = Dense(32, activation='relu')(encoded)
#潜在変数(実質的な主成分分析)
latent = Dense(8, activation='relu')(encoded)
#encodeされたデータを再構成
decoded = Dense(32, activation='relu')(latent)
decoded = Dense(64, activation='relu')(decoded)
decoded = Dense(12, activation='relu')(encoded)
ae = Model(input=input_word, output=decoded)
# #Adamで最適化、loss関数をcategorical_crossentropy
ae.compile(optimizer='Adam', loss='categorical_crossentropy')
ae.summary()

print(x.shape)
# #autoencoderの実行
ae.fit(x, x,
       epochs=500,
       batch_size=256,
       shuffle=False)

#モデルの構造を保存
model_json = ae.to_json()
with open('keras_AE.json', 'w') as json_file:
    json_file.write(model_json)
#学習済みモデルの重みを保存
ae.save_weights('AE.h5')
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • y_waiwai

    2018/10/24 21:50

    で、しつもんはなんでしょうか。

    キャンセル

  • yep

    2018/10/24 22:45

    コードを一行ずつ読み込むためには、どうすればよいでしょうか?

    キャンセル

回答 3

checkベストアンサー

+1

1行づつ読むなら、readline (readlinesではない)を使えばどうでしょうか


といいながらコピペ可能バージョン

with open(r'/home/yudai/poem.txt', encoding='utf-8') as f:
  poems = f.readline()
  while poems:
    print (poems)
    poems = f.readline()

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/10/24 23:05

    一文字しか読めませんでした。

    キャンセル

  • この投稿は削除されました

  • 2018/10/24 23:07

    それは使い方が間違ってます
    「python readline」でぐぐってみましょう。使い方が出てきます

    キャンセル

  • 2018/10/24 23:12

    with open(r'/home/yudai/poem.txt', encoding='utf-8') as f:
    poems = f.readline()
    while poems:
    print (poems)

    一つの行が無限に出力されました。

    キャンセル

  • 2018/10/24 23:16

    readline 関数はファイルから1行だけ、を読み出す関数です
    次の行を読むなら、繰り返しreadlneを実行する必要があります

    poems = f.readline()
    while poems:
     print (poems)
     poems = f.readline()

    キャンセル

  • 2018/10/24 23:51

    File "/home/yudai/Desktop/keras_AE.py", line 11
     print(poems)
    ^
    SyntaxError: invalid character in identifier
    と出力されます。

    キャンセル

  • 2018/10/24 23:55

    コピペで済まさないで、手で打ってください
    全角スペースが入ってるのでコピペではエラーでます

    提示したコードを理解して利用しましょう

    キャンセル

  • 2018/10/25 17:06 編集

    確かに一行ずつ読めました。手で打ちました。ありがとうございました。

    キャンセル

+1

求める処理に合っているかちゃんと確認できていませんが
以下にて行毎に空白で区切られた単語のリストを取得できます。

with open( 'poem.txt', encoding='utf-8') as f:
    poems = f.readlines()
    print( poems) # ['朝霧 の 中 に 九段 の ともし 哉\n', 'あたたか な 雨 が 降る なり 枯葎\n', '菜の花 や は つと 明るき 町 は づれ\n', '秋風 や 伊予 へ 流る る 汐 の 音\n', '長閑 さ や 障子 の 穴 に 海 見え て\n']
    for p in poems:
        s = p.rstrip() # 改行を除去
        s = s.split(' ')
        print( s) # ['朝霧', 'の', '中', 'に', '九段', 'の', 'ともし', '哉']

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/10/24 22:46

    なぜ、print( s)のように前に空間を置くのですか?

    キャンセル

  • 2018/10/24 22:50

    とくにい
    みはあり
    ませんじ
    ぶんある
    いはにん
    げんにと
    ってのみ
    やすさで
    すコンピ
    ュータに
    とっては
    くうはく
    のうむは
    かんけい
    ありませ

    キャンセル

  • 2018/10/24 22:52

    kasi
    koma
    rima
    sita

    キャンセル

  • 2018/10/24 22:54

    Таныг ойлгож байгаад би баяртай байна.

    キャンセル

0

f.readlines()の時点で一行ずつ分割されたlistになっています。文字列に対するメソッドのsplitlines()は呼べません。そのままpoems = f.readlines()とすれば良いです。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/10/24 23:02

    ValueError: Error when checking target: expected dense_7 to have shape (2, 12) but got array with shape (2, 13)やはり、エラーが出ます。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.47%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • Python 3.x

    10250questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。