質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

Q&A

解決済

2回答

1246閲覧

ファイルの入力について

yone_yone

総合スコア28

Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

0グッド

0クリップ

投稿2018/07/03 06:22

ファイルの読み込みの順番についての質問になります。

入力としてのファイルが4つあるのですが、このなかの2つを先に入力として読み込み、ある処理をした後、今度は残りの2つを入力として読み込みたいこ考えています。

現在、a.txtというラベルが記入されているファイルがあります。

#a.txt BED003916 BED620259

このラベルに引っかかるファイルが同じディレクトリ内に4つあります。(これが入力ファイルとなります。)

#ディレクトリ内のファイル a.txt test_BED003916.txt train_BED003916.txt test_BED620259.txt train_BED620259.txt

この4つのtrainとtestのファイルを以下のようにしたいと考えています。

#やりたい処理の流れ 0. a.txtの読み込みから引っかかるファイルの呼び出し 1. test_BED003916.txtとtrain_BED003916.txtの入力 2. 処理と評価 3. test_BED620259.txtとtrain_BED620259.txtの入力 4. 処理と評価

現在使っているコードはこのようになっています。

python

1if __name__ == '__main__': 2 with open('a.txt', 'r') as label: 3 a_list = [line.rstrip() for line in label] 4 print(a_list) 5 6 file_list = [] 7 for a_elem in a_list: 8 file_list += glob.glob('*{}*.txt'.format(a_elem)) 9 print(file_list) 10 11for filename in file_list: 12 #print(filename) 13 ds_tmp = [] 14 with open(filename, 'r') as f: 15 for i in f: 16 txt = i.split() 17 txt = [ float(s) for s in txt] 18 ds_tmp.append(txt) 19 20 ds = np.array(ds_tmp)

これだとファイル1つずつしか入力されないです...
環境はpython2系を使っています。

※ご回答いただいた内容に質問させていただくこともあるかと思いますので、
※よろしければご返信いただければと思います。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

質問のコードは、

python

1if __name__ == '__main__': 2 with open('a.txt', 'r') as label: 3 a_list = [line.rstrip() for line in label] 4 print(a_list) 5 6 file_list = [] 7 for a_elem in a_list: 8 file_list += glob.glob('*{}*.txt'.format(a_elem)) 9 print(file_list) 10 11for filename in file_list: 12 #print(filename) 13 ds_tmp = [] 14 with open(filename, 'r') as f: 15 for i in f: 16 txt = i.split() 17 txt = [ float(s) for s in txt] 18 ds_tmp.append(txt) 19 20 ds = np.array(ds_tmp)

せめて下半分はif __name__ == '__main__':の中に入れましょう(モジュールとしてimportされない限り、逐次実行されて動いちゃうんだけど・・・)。


私なら、各処理を切り分けて関数にします。そうしないと扱いづらいからです。

python

1def read_file(filename): 2 # たぶんこんな感じ。もしかしたら間違ってるかも 3 with open(filename, 'r') as f: 4 for i in f: 5 txt = i.split() 6 txt = [ float(s) for s in txt] 7 ds_tmp.append(txt) 8 9 ds = np.array(ds_tmp) 10 return ds 11 12def process(label): 13 train_filename = "train_{}.txt".format(label) 14 test_filename = "test_{}.txt".format(label) 15 train_data = read_file(train_filename) 16 test_data = read_file(test_filename) 17 # ... 18 19def main(): 20 with open('a.txt', 'r') as label: 21 a_list = [line.rstrip() for line in label] 22 print(a_list) 23 24 for label in a_list: 25 process(label) 26 27if __name__ == '__main__': 28 main()

そのまま動くかどうかはわかりませんが、これくらいに切り分ければ、それなりに上手く行きそうです。ただし、BED003916のデータに対する処理とBED620259のデータに対する処理で使い回すオブジェクト等があると、微妙に工夫が要るかもしれません。

投稿2018/07/03 07:10

編集2018/07/03 07:34
hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yone_yone

2018/07/03 07:20

回答ありがとうございます。 python初心者なのでわからないことだらけなのですが、 # dosomething のところには何も入れなくて大丈夫なのでしょうか? File "<ipython-input-7-a94e5c6ab8dd>", line 15 def process(label): ^ IndentationError: expected an indented block このようなエラーメッセージがでてしまいまして...
hayataka2049

2018/07/03 07:33

当然自分で書く必要があります。 質問文のコードの下の方のループの中身をコピペして(インデント等は整える必要があると思いますが)、dsをreturnすればとりあえずは動くと思いますが、それで意図した結果になるか、ちゃんと処理できるかは私にはわかりません。
hayataka2049

2018/07/03 07:35

とりあえず上のコメントどおりの内容を追記してみました
yone_yone

2018/07/03 07:40

わかりました。 やはり、そこは書く必要があったんですね。 知識不足ですみません。 中身を書いてやってみようと思います。 回答ありがとうございます。 また、エラー等でたら恐縮ですが回答いただけたらと思います。
yone_yone

2018/07/03 07:41

追記までして頂いてありがとうございます。
yone_yone

2018/07/03 16:33

上のコードを実行してみたところ、入力がきちんとされていました。 ありがとうございます。助かりました。
guest

0

ds_tmp = []ds = np.array(ds_tmp) はループの外に置かないとダメじゃないでしょうか?

投稿2018/07/03 06:28

KojiDoi

総合スコア13669

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yone_yone

2018/07/03 06:54 編集

回答ありがとうございます。 やってみましたが、私の入れ込む場所が悪いのか、 上手く処理されませんでした...
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問