質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
terminal

Terminalは、Apple社のmacOSに標準で付属しているUNIX端末エミュレータ。UNIXコマンドによってMacの操作および設定を行うことができます。

MacOS(OSX)

MacOSとは、Appleの開発していたGUI(グラフィカルユーザーインターフェース)を採用したオペレーションシステム(OS)です。Macintoshと共に、市場に出てGUIの普及に大きく貢献しました。

Q&A

解決済

1回答

421閲覧

RNASeqでcufflinksが終わらない、コマンドが合っているか分かりません

raichu

総合スコア37

terminal

Terminalは、Apple社のmacOSに標準で付属しているUNIX端末エミュレータ。UNIXコマンドによってMacの操作および設定を行うことができます。

MacOS(OSX)

MacOSとは、Appleの開発していたGUI(グラフィカルユーザーインターフェース)を採用したオペレーションシステム(OS)です。Macintoshと共に、市場に出てGUIの普及に大きく貢献しました。

0グッド

0クリップ

投稿2019/04/18 05:48

前提

生物学におけるDRY解析を行なっています。(DRY解析教本 Level2 ②発現解析です)
具体的には、RNA-Seqのデータから遺伝子の発現解析を行なっています。

FASTQファイル → QC → マッピング まで進んでおり、FPKM値の計算のため
cufflinksを実行していますが、cufflinksに非常に時間がかかっています。

その後、cuffmerge → cuffdiff まで行い、Rでヒートマップを描くつもりなのですが、
cufflinksで、以下のような表示が出ており、進歩が非常に遅くなかなか先に進めません。

発生しているメッセージ

BAM record error: found spliced alignment without XS attribute > Processing Locus 3:46958357-47021034 [*** ] 15%BAM record error: found spliced alignment without XS attribute

状況と質問

上記のような表示が出ていますが、これは正常に進んでいるのでしょうか?

また、以下のような状況ですが、cufflinksの実行は何時間もかかるものなのでしょうか?
1時間に10%程度しか進んでいませんが、これくらいが普通なのでしょうか?

  ・MacBook Pro, mac OS Mojave
・メモリ:8GB
・CPU:2.9GHz, Intel Core i7, 2コア
・アノテーションのgtfファイル:102MB
・マッピング結果のBAMファイル:3.7GB

また以下が実際に打ったコマンドなのですが、間違い等がございましたら、
ご指摘いただけると幸いです。

マッピングはTophatが古いためHISAT2で実行しており(DRY解析教本とはここが異なります)、
日本語での検索結果が少なかったので、ここで質問させていただきました。

打ったコマンド

cufflinks -p 2 -g [アノテーションを含むgtfファイル] [bamファイル] -o [出力先のフォルダ]

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

たまたまちょっと知っている分野なので分かるところだけ書いてみますが、こういう専門的な質問はまずteratailでは無理です。最終的には英語からは逃げられないと思いますよ。公式サイトやbiostarsなんかですね。

BAM record errorと出ているので、まずいことが起こっていると判断すべきでしょうね。

HISAT2が吐き出したBAMと言うやつがTOPHATのそれと同じなのか違うのか私は知らないので、はっきりしたことが言えませんが、そのエラーメッセージをまるごとgoogleに突っ込むと次のような記事が見つかりました。参考になりませんか?

https://www.biostars.org/p/118904/

以下のような状況ですが、cufflinksの実行は何時間もかかるものなのでしょうか?

参考データとして、CPU=Intel Xeon E5-2660 v4 @ 2.00GHzメモリ搭載量=750GBというそれなりに満艦飾なマシン上で-p 50なんてオプションをつけcufflinkで18GBのBAM(tophat起源)解析させたところ、所要時間14時間という記録が手元にあります。まあ時間がかかるのは確かなのでアカラサマにエラーが出てないなら待ってみましょう。ただ8GB・2コアだと流石に厳しいかもしれませんね。

投稿2019/04/18 06:51

KojiDoi

総合スコア13671

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

raichu

2019/04/18 07:02

ご回答に加え、アドバイスまで頂きありがとうございます。 とりあえず、cufflinksによるファイルの生成は進んでいるようなので、最後まで待ってみることにします。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問