質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1107閲覧

python 出力したリスト内の数値から最大値を抽出する

22Go

総合スコア55

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2018/12/08 04:34

編集2018/12/08 06:39

text

1>YP_009518834.1 putative uncharacterized protein YjiT [Escherichia coli str. K-12 substr. MG1655] 2MGQSEYISWVKCTSWLSNFVNLRGLRQPDGRPLYEYHATNDEYTQLTQLLRAVGQSQSNICNRDFAACFV 3LFCSEWYRRDYERQCGWTWDPIYKKIGISFTATELGTIVPKGMEDYWLRPIRFYESERRNFLGTLFSEGG 4LPFRLLKESDSRFLAVFSRILGQYEQAKQSGFSALSLARAVIEKSALPTVFSEDTSVELISHMADNLNSL 5VLTHNLINHKEPVQQLEKVHPTWRSEFPIPLDDETGTHFLNGLLCAASVEAKPRLQKNKSTRCQFYWSEK 6HPDELRVIVSLPDEVSFPVTSEPSTTRFELAICEDGEEVSGLGPAYASLENRQATVRLRKSEVRFGRQNP 7SAGLSLVARAGGMIVGSIKLDDSEIAIGEVPLTFIVDADQWLLQGQASCSVRSSDVLIVLPRDNSNVAGF 8DGQSRAVNVLGLKALPVKGCQDVTVTANETYRIRTGREQISIGRFALNGKRASWVCHPDETFIGVPKVIS 9TLPDIQSIDVTRYTC 10 11 12>YP_009518833.1 uncharacterized protein YtiA [Escherichia coli str. K-12 substr. MG1655] 13MKEFLFLFHSTVGVIQTRKALQAAGMTFRVSDIPRDLRGGCGLCIWLTCPPGEEIQWVIPGLTESIYCQQ 14DGVWRCIAHYGVSPR 15

python

1with open("short.sequ.txt") as f: 2 a = [] 3 for line in f: 4 if line.startswith(">"): 5 print(line) 6 seq = "" 7 a = [] 8 else: 9 seq += "".join(line.split()) 10 count = 0 11 count += len(seq) 12 a.append(len(seq)) 13 print(a)

結果は

YP_009518834.1 putative uncharacterized protein YjiT [Escherichia coli str. K-12 substr. MG1655]

[70]
[70, 140]
[70, 140, 210]
[70, 140, 210, 280]
[70, 140, 210, 280, 350]
[70, 140, 210, 280, 350, 420]
[70, 140, 210, 280, 350, 420, 490]
[70, 140, 210, 280, 350, 420, 490, 505]
[70, 140, 210, 280, 350, 420, 490, 505, 505]
[70, 140, 210, 280, 350, 420, 490, 505, 505, 505]

YP_009518833.1 uncharacterized protein YtiA [Escherichia coli str. K-12 substr. MG1655]

[70]
[70, 85]
[70, 85, 85]

これです

”>YP”で始まる文字列は出力し、そうでない文字列は計算し、リストに格納
その時に最後のリストの最大値(これでゆうと505、85)を
max=505と出力する方法を定義したいのですが(textはもっと本来続く)どのように組み込んだらいいでしょうか?
そしてこの計算が複数あった場合に最も大きい数字を持つ「>YP」で始まる文章を出したいです
できればこのままのコードに付け加えてたいですが、無理でしたら改変も考えています。
よろしくお願いします。

>YPあ
10
>YPい
20
>YPう
30

max=(>YPう,30)
といった感じです

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

22Go

2018/12/08 06:36 編集

以前の回答に付け加えて、最大値は>YP_009518834.1 putative uncharacterized protein YjiT [Escherichia coli str. K-12 substr. MG1655]=505といった感じで、すべての計算結果(20種類など)を出した後にどの文字列が最も大きい数字かを出したいです。
guest

回答1

0

ベストアンサー

最大値と最大値をとる「>~」を保持しておくと以下のように書けます。

Python

1with open("short.sequ.txt") as f: 2 3 max_len = 0 # 最大値 4 max_line= "" # 最大値をとる「>~」 5 6 # ブロックの切り替わりの処理 7 def block_func(cur_line, seq): 8 global max_len,max_line 9 10 seq_len = len(seq) 11 if seq_len <= 0: 12 return 13 14 print(len(seq)) 15 if seq_len > max_len: 16 max_len = seq_len 17 max_line= cur_line 18 19 cur_line = "" # 現在のブロックの「>~」行 20 seq = "" # 現在のブロック内の文字列 21 for line in f: 22 line = line.rstrip('\n') 23 if len(line) <= 0: 24 continue 25 26 if line.startswith(">"): 27 cur_line = line 28 block_func(cur_line, seq) 29 seq = "" 30 31 print(line) 32 else: 33 seq += "".join(line.split()) 34 35 block_func(cur_line, seq) 36 print(max_len, max_line)

投稿2018/12/08 09:30

can110

総合スコア38266

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問