text
1>YP_009518834.1 putative uncharacterized protein YjiT [Escherichia coli str. K-12 substr. MG1655] 2MGQSEYISWVKCTSWLSNFVNLRGLRQPDGRPLYEYHATNDEYTQLTQLLRAVGQSQSNICNRDFAACFV 3LFCSEWYRRDYERQCGWTWDPIYKKIGISFTATELGTIVPKGMEDYWLRPIRFYESERRNFLGTLFSEGG 4LPFRLLKESDSRFLAVFSRILGQYEQAKQSGFSALSLARAVIEKSALPTVFSEDTSVELISHMADNLNSL 5VLTHNLINHKEPVQQLEKVHPTWRSEFPIPLDDETGTHFLNGLLCAASVEAKPRLQKNKSTRCQFYWSEK 6HPDELRVIVSLPDEVSFPVTSEPSTTRFELAICEDGEEVSGLGPAYASLENRQATVRLRKSEVRFGRQNP 7SAGLSLVARAGGMIVGSIKLDDSEIAIGEVPLTFIVDADQWLLQGQASCSVRSSDVLIVLPRDNSNVAGF 8DGQSRAVNVLGLKALPVKGCQDVTVTANETYRIRTGREQISIGRFALNGKRASWVCHPDETFIGVPKVIS 9TLPDIQSIDVTRYTC 10 11 12>YP_009518833.1 uncharacterized protein YtiA [Escherichia coli str. K-12 substr. MG1655] 13MKEFLFLFHSTVGVIQTRKALQAAGMTFRVSDIPRDLRGGCGLCIWLTCPPGEEIQWVIPGLTESIYCQQ 14DGVWRCIAHYGVSPR 15
python
1with open("short.sequ.txt") as f: 2 a = [] 3 for line in f: 4 if line.startswith(">"): 5 print(line) 6 seq = "" 7 a = [] 8 else: 9 seq += "".join(line.split()) 10 count = 0 11 count += len(seq) 12 a.append(len(seq)) 13 print(a)
結果は
YP_009518834.1 putative uncharacterized protein YjiT [Escherichia coli str. K-12 substr. MG1655]
[70]
[70, 140]
[70, 140, 210]
[70, 140, 210, 280]
[70, 140, 210, 280, 350]
[70, 140, 210, 280, 350, 420]
[70, 140, 210, 280, 350, 420, 490]
[70, 140, 210, 280, 350, 420, 490, 505]
[70, 140, 210, 280, 350, 420, 490, 505, 505]
[70, 140, 210, 280, 350, 420, 490, 505, 505, 505]
YP_009518833.1 uncharacterized protein YtiA [Escherichia coli str. K-12 substr. MG1655]
[70]
[70, 85]
[70, 85, 85]
これです
”>YP”で始まる文字列は出力し、そうでない文字列は計算し、リストに格納
その時に最後のリストの最大値(これでゆうと505、85)を
max=505と出力する方法を定義したいのですが(textはもっと本来続く)どのように組み込んだらいいでしょうか?
そしてこの計算が複数あった場合に最も大きい数字を持つ「>YP」で始まる文章を出したいです
できればこのままのコードに付け加えてたいですが、無理でしたら改変も考えています。
よろしくお願いします。
>YPあ
10
>YPい
20
>YPう
30
max=(>YPう,30)
といった感じです
回答1件
あなたの回答
tips
プレビュー