前提・実現したいこと
下記のテキストファイルのうち,">"を含む行ではない,Mから始まる大文字の文字数(106, 109, 109)を測定したいのですが,以下のエラーが出ました.
文字数の出力にどのように繋げればいいのか,お知恵を貸していただけますと幸いです.宜しくお願いします.
尚,このファイルは約1000行のファイルを縮小・簡略化したものである為,行の指定含め自動化してくれるような完成形の一例を示していただけますと幸いです.宜しくお願いします.
エラー
File "seq_length.py", line 7 output_line = '%s\t%i' % \ (seq_record.id, len(seq_record)) ^ SyntaxError: unexpected character after line continuation character
該当のソースコード
python
1#!/usr/bin/python 2# -*- coding: utf-8 -*- 3from Bio import SeqIO 4import sys 5cmdargs = str(sys.argv) 6for seq_record in SeqIO.parse(str(sys.argv[1]), "test.fasta"): 7 output_line = '%s\t%i' % \ (seq_record.id, len(seq_record)) 8 print(output_line)
使用ファイル
test.fasta
1>sp|A5EVF4|HFQ_DICNV RNA-binding protein Hfq OS=Dichelobacter nodosus (strain VCS1703A) OX=246195 GN=hfq PE=3 SV=1 2MSKSQSLQDPYLNALRKERVPVSIYLVNGIKLQGQIESFDAFVILLRNNISQMVYKHAVS 3TIVPSRNIHLSREEMGLEDEAGEEISAEYTPNAEGQAEATADPLYD 4>sp|B0TZB1|HFQ_FRAP2 RNA-binding protein Hfq OS=Francisella philomiragia subsp. philomiragia (strain ATCC 25017) OX=484022 GN=hfq PE=3 SV=1 5MSRISSLQDPFLNALRKEKVSVSVYLVNGIKLQGQVEAFDQFCIVLRNTVNQMVYKHAIS 6TIVPAKSVRMVYSSFNPYHQNANDDQDENVDDIHSDELEVQENQENINE 7>sp|Q5NH41|HFQ_FRATT RNA-binding protein Hfq OS=Francisella tularensis subsp. tularensis (strain SCHU S4 / Schu 4) OX=177416 GN=hfq PE=3 SV=1 8MSRISSLQDPFLNALRKEKVSVSVYLVNGIKLQGQVEAFDQFCIVLRNTVNQMVYKHAIS 9TIVPAKSVRMIYNSFNPYHQNSNDEQDENVDDIHSDDLEIQENEGNIHE 10
補足情報(FW/ツールのバージョンなど)
macOS10.15.4 Python3.7.3 Atom