バイオインフォマティクスの場面で、ゲノムを制限酵素で切ったときの断片長を求めたいです。
例えば
ACAGCCGCATTATGGGGATCCTCAACTGTGAGGAGGCTCGGATCCATTTAAAGCAA
という塩基配列に酵素BamHIを用いると、GGATCCを認識し、GとGの間で切れて
ACAGCCGCATTATGGG GATCCTCAACTGTGAGGAGGCTCG GATCCATTTAAAGCAA
という3つの断片になります。3つの断片それぞれの長さを求めようとしております。
次のように実装しようと考えました:
・塩基配列が書かれたテキストファイル(拡張子は.fna)を受け取る
・上述のテキストファイルを読み込み、文字列sとして保存
ここまでを準備として行い、そのうえで
・入力を上述の文字列sとする
・文字列sから、GGATCCを検索する
・そのうえで、GGATCC上でGとGの間を切断し、断片を作る
・断片の文字列の長さを求め、出力する
これを実行する関数int BamHIを作り、main()内で実行しようと考えました。
しかしこのような関数の作り方がわかりません。
文字列の検索の実装がわかりません、切断方法もわかりません。
ご教示のほどお願いいたします。
なお、当方の環境はcygwinでgccでコンパイルしています。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2015/09/19 05:52
2015/09/19 06:18
2015/09/19 13:00
2015/09/19 14:20
2015/09/19 15:03