pythonでテキストファイルの中で条件を満たす行を抽出するやり方について

ATOM 2 CA PRO A 4 29.341 -18.244 23.236 1.00112.52 C
ATOM 9 CA LYS A 5 28.103 -17.550 19.692 1.00 91.13 C
ATOM 18 CA PRO A 6 29.134 -14.592 19.578 1.00 63.64 C
ATOM 1605 CA LYS B 5 8.357 5.403 38.590 1.00 58.36 C
ATOM 1614 CA PRO B 6 6.423 2.744 36.650 1.00 49.68 C
ATOM 1621 CA PHE B 7 7.816 1.954 33.187 1.00 42.38 C

上のようなテキストファイルがあったとして、ATOM、CA、Aという文字を含む行（上三行）をすべて抽出したいのですが、下記のようにjupyter notebookでコードを書いてもすべて抽出してしまいます。なにが駄目なのでしょうか。教えてくださいお願いいたします。*pdb3asy.entは上のテキストファイルです。
そして、上から三行を抽出するやり方ではなく、ATOM、CA、Aを含む行の条件で絞り込むやり方でお願いいたします。

自分の予想としてはATOMにもCAにもAが含まれているのでATOMとCAのみで絞り込みをしているのと同じことになっているのはないかと思っています。

path = 'pdb3asy.ent'

with open(path) as f:
    lines = f.readlines()
    
lines_strip = [line.strip() for line in lines]
    
ATOM_CA_A_and = [line for line in lines_strip if (('ATOM' in line) and ('CA' in line) and ('A' in line))]
for A_CA in ATOM_CA_A_and:
    print(A_CA)

行動規範の内容に同意します

回答2件

Python
1for l in lines:
2    l=l.split()
3    if l[0] == 'ATOM' and l[2] == 'CA' and l[4] == 'A':
4        print(l)

一つの文字列を配列に変換し、指定の場所に指定の文字が入っているかどうか判別するように変更することで、可能です。

投稿2020/12/17 03:53

norapomu

総合スコア224

yusuke1818

2020/12/17 04:08

なるほど！そういうのもあるんですね！ありがとうございます！！

yusuke1818

2020/12/17 07:02

重ねて質問させてください。それらが出来て、 ['ATOM', '2', 'CA', 'PRO', 'A', '4', '29.341', '-18.244', '23.236', '1.00112.52', 'C'] ['ATOM', '9', 'CA', 'LYS', 'A', '5', '28.103', '-17.550', '19.692', '1.00', '91.13', 'C'] ['ATOM', '18', 'CA', 'PRO', 'A', '6', '29.134', '-14.592', '19.578', '1.00', '63.64', 'C'] となったのですが、これはリスト型が1つずつ出来ているのですが、これらを1つの二次元配列のリスト型としてつくりたいのですがそれは出来ますか？

norapomu

2020/12/17 07:14

for l in lines: li.append(l.split()) とすることで可能です。（liは仮でリスト型です）最初の回答は、 lines に入った文字列を、改行コードを区切りとして l に格納し、それを split を使ってリストとして分けてます。こちらは、リストとして仕分けるところまでは同じですが、そのリストをさらにリストに追加することで二次元配列を生成してます。という風に思っているのですが、もしかすると説明間違いや不足があるかもしれません。かけ離れていることはないと思いますが、自分でも調べていただければと思います。

yusuke1818

2020/12/17 07:19

ありがとうございますそれをはじめの質問の時に書いたコードのどこに書けばよいのでしょうか。お願い致します。

norapomu

2020/12/17 07:22

それはわからないです。質問者さんが、どこでどういう風にこの二次元配列を使うのかがそもそもわからないので、答えようがないです。

yusuke1818

2020/12/17 07:24

すいませんありがとうございます。

行動規範の内容に同意します