python 出力したリスト内の数値から最大値を抽出する

text
1>YP_009518834.1 putative uncharacterized protein YjiT [Escherichia coli str. K-12 substr. MG1655]
2MGQSEYISWVKCTSWLSNFVNLRGLRQPDGRPLYEYHATNDEYTQLTQLLRAVGQSQSNICNRDFAACFV
3LFCSEWYRRDYERQCGWTWDPIYKKIGISFTATELGTIVPKGMEDYWLRPIRFYESERRNFLGTLFSEGG
4LPFRLLKESDSRFLAVFSRILGQYEQAKQSGFSALSLARAVIEKSALPTVFSEDTSVELISHMADNLNSL
5VLTHNLINHKEPVQQLEKVHPTWRSEFPIPLDDETGTHFLNGLLCAASVEAKPRLQKNKSTRCQFYWSEK
6HPDELRVIVSLPDEVSFPVTSEPSTTRFELAICEDGEEVSGLGPAYASLENRQATVRLRKSEVRFGRQNP
7SAGLSLVARAGGMIVGSIKLDDSEIAIGEVPLTFIVDADQWLLQGQASCSVRSSDVLIVLPRDNSNVAGF
8DGQSRAVNVLGLKALPVKGCQDVTVTANETYRIRTGREQISIGRFALNGKRASWVCHPDETFIGVPKVIS
9TLPDIQSIDVTRYTC
10
11
12>YP_009518833.1 uncharacterized protein YtiA [Escherichia coli str. K-12 substr. MG1655]
13MKEFLFLFHSTVGVIQTRKALQAAGMTFRVSDIPRDLRGGCGLCIWLTCPPGEEIQWVIPGLTESIYCQQ
14DGVWRCIAHYGVSPR
15

python
1with open("short.sequ.txt") as f:
2    a = []
3    for line in f:
4        if line.startswith(">"):
5            print(line)
6            seq = ""
7            a = []
8        else:
9            seq += "".join(line.split())
10            count = 0
11            count += len(seq)
12            a.append(len(seq))
13            print(a)

結果は

YP_009518834.1 putative uncharacterized protein YjiT [Escherichia coli str. K-12 substr. MG1655]

[70]
[70, 140]
[70, 140, 210]
[70, 140, 210, 280]
[70, 140, 210, 280, 350]
[70, 140, 210, 280, 350, 420]
[70, 140, 210, 280, 350, 420, 490]
[70, 140, 210, 280, 350, 420, 490, 505]
[70, 140, 210, 280, 350, 420, 490, 505, 505]
[70, 140, 210, 280, 350, 420, 490, 505, 505, 505]

YP_009518833.1 uncharacterized protein YtiA [Escherichia coli str. K-12 substr. MG1655]

[70]
[70, 85]
[70, 85, 85]

これです

”＞YP”で始まる文字列は出力し、そうでない文字列は計算し、リストに格納
その時に最後のリストの最大値（これでゆうと５０５、８５）を
max=505と出力する方法を定義したいのですが（textはもっと本来続く）どのように組み込んだらいいでしょうか？
そしてこの計算が複数あった場合に最も大きい数字を持つ「＞YP」で始まる文章を出したいです
できればこのままのコードに付け加えてたいですが、無理でしたら改変も考えています。
よろしくお願いします。

＞YPあ
１０
＞YPい
２０
＞YPう
３０

max=(＞YPう,30）
といった感じです

LouiS0616

2018/12/08 04:50

私の以前の回答 https://teratail.com/questions/161562#reply-241709 では要件に合わないのですか？

22Go

2018/12/08 06:36 編集

以前の回答に付け加えて、最大値は>YP_009518834.1 putative uncharacterized protein YjiT [Escherichia coli str. K-12 substr. MG1655]＝505といった感じで、すべての計算結果（20種類など）を出した後にどの文字列が最も大きい数字かを出したいです。

行動規範の内容に同意します

回答1件

ベストアンサー

最大値と最大値をとる「>～」を保持しておくと以下のように書けます。

Python
1with open("short.sequ.txt") as f:
2
3    max_len = 0  # 最大値
4    max_line= "" # 最大値をとる「>～」
5
6    # ブロックの切り替わりの処理
7    def block_func(cur_line, seq):
8        global max_len,max_line
9
10        seq_len = len(seq)
11        if seq_len <= 0:
12            return
13
14        print(len(seq))
15        if seq_len > max_len:
16            max_len = seq_len
17            max_line= cur_line
18
19    cur_line = "" # 現在のブロックの「>～」行
20    seq = "" # 現在のブロック内の文字列
21    for line in f:
22        line = line.rstrip('\n')
23        if len(line) <= 0:
24            continue
25
26        if line.startswith(">"):
27            cur_line = line
28            block_func(cur_line, seq)
29            seq = ""
30
31            print(line)
32        else:
33            seq += "".join(line.split())
34
35    block_func(cur_line, seq)
36    print(max_len, max_line)