ファイルから特定の単語をもつタイトルを一行ごとに抽出するのですがその際に特定の単語以外で必ずある単語が出るようにしたいです。
python
1from pprint import pprint 2f = open('all.txt',encoding="utf-8_sig") 3print(f.read(),sep='\n') 4f.close() 5pprint(f)
結果
<h1>file:1941 55.txt</h1> the textile research conference combination of silk fibroin with acid and with base ・ ・ <h1>file:1942 99.txt</h1> they want research research activities ・ ・ <h1>file:1943 91.txt</h1> ・ ・ と年代ごとで自分なりに分けているファイルを読み取るのですが ここから特定の単語(この場ではcotton)を抽出するようなプログラミングにした場合 ```python from pprint import pprint with open('all.txt',encoding="utf-8_sig") as f: lines = f.read().splitlines() lines = [l for l in lines if "cotton" in l] print('\n'.join(lines)) ``` 結果 the variation of raw cotton con stituents with physical properties microscopic structure of the cotton fiber base-combining capacity of cotton direct processing of whole cotton shrinkage and cell wall structure of cotton fibers ・ ・ ・ という風になってしまい 1941.1942の数字が消えてしまいどの年にあったものかわからなくなってしまいます。 なにか良い方法はないでしょうか? よろしくお願いいたします。回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/11/05 14:30