前提・実現したいこと
以下のような、ファイルから、指定した特定の要素(gene_name)をもつ行だけを抽出して保存したいです。
$ head -3 fantom_cat_stringent_kd.gtf| sort -f -k 6 -t ";" |awk -F\" '{print $0}'| less chr8 FANTOM gene 144623796 144624570 . + . gene_id "ENSG00000254144.2"; geneSuperClass "all_lncRNA"; geneClass "lncRNA_divergent"; geneSubClass "divergent_promoters"; gene_type "antisense"; gene_name "7SK"; coding_status "nonCoding"; cumulative_support "FANTOM:GENCODE"; geneCategory "p_lncRNA_divergent"; DHS_type "DHS_promoter"; chr21 FANTOM gene 26473444 26475653 . + . gene_id "ENSG00000232512.2"; geneSuperClass "all_lncRNA"; geneClass "lncRNA_intergenic"; geneSubClass "far_from_coding_genes"; gene_type "lincRNA"; gene_name "7SK"; coding_status "nonCoding"; cumulative_support "GENCODE:HUBDMAP"; geneCategory "__na"; DHS_type "not_DHS"; chr19 FANTOM gene 58856544 58864858 . - . gene_id "ENSG00000121410.7"; geneSuperClass "all_mRNA"; geneClass "coding_mRNA"; geneSubClass "protein_coding"; gene_type "protein_coding"; gene_name "A1BG"; coding_status "coding"; cumulative_support "FANTOM:GENCODE"; geneCategory "coding_mRNA"; DHS_type "DHS_promoter";
抽出したい要素のリストを、例えば以下のように用意した時の方法をご教授いただけると幸いです。
bash
1$ cat gene_list.txt 2EXOC1 3NOC2L 4BCKDK 5NPEPPS 6SNX5 7DNAJC30 8CCR2 9AP2A1 10LIPA 11PNKP
試したこと
grep -f
を用いてやってみたのですが検索元、クエリ共に行数が多いために時間がかかることなどから他の方法があれば、教えていただきたいです。
$ grep -f gene_list.txt fantom_cat_stringent_kd.gtf
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/06/21 03:41