マッピング結果からリードカウントデータを取得する方法

発現量取得

Bowtie や TopHat などのマッピングプログラムを利用して、RNA-seq のリードをリファレンスゲノム上へマッピングしたとき、その結果は BAM または SAM とよばれる形式のファイルとして出力される。BAM と SAM は同一ものであるが、SAM は人が見てもわかるテキスト形式で記載されている。また、BAM は機械が速く読めるようにバイナリ形式(2 進数)で記載されている

トランスクリプトーム解析では、マッピングを行った後に、どの遺伝子にどれぐらいのリード数がマッピングされたかを数えることになる。このようなリードのカウントは遺伝子の発現量を測る指標として利用される。リードをカウントするソフトウェアとして HTSeq と featureCounts がよく使われている。