はじめに
RNA-seq(RNA sequencing)は、次世代シーケンサー(NGS)を用いて細胞内の転写産物(RNA)の全体像を網羅的に解析する技術です。これにより、遺伝子の発現量、スプライシングのパターン、融合遺伝子、非コードRNA まで幅広く調べることが可能です。従来のマイクロアレイを超える解像度と柔軟性を持ち、基礎研究から臨床応用まで広く利用されています。
RNA-seqの実験原理
RNA-seqの基本的な考え方はシンプルで、細胞内のRNAをcDNAに変換し、断片化したDNAライブラリとしてシーケンサーに読み込ませることです。大きく以下の流れで進みます。
1. RNA抽出
細胞や組織から全RNAを抽出します。このとき、解析目的に応じて以下の選択が行われます:
- poly(A)選択:mRNAのみを濃縮(真核生物の遺伝子発現解析に多い)
- rRNA除去:リボソームRNAを取り除き、残りの転写産物を解析
- total RNA解析:非コードRNAを含め、幅広いRNA種を対象に
2. cDNA合成と断片化
RNAはそのままでは不安定でシーケンスもできないため、逆転写酵素でcDNA(相補的DNA)に変換します。
次に、シーケンサーが読み取りやすいサイズ(100–300 bp程度)に断片化します。
3. ライブラリ調製
断片化したcDNAに、アダプター配列を付加します。
- アダプターはシーケンサーがDNA断片を認識する「タグ」の役割を果たします。
- ここでサンプルごとに異なるバーコード配列を導入することで、多数の試料を同時にシーケンス可能になります。
4. シーケンス(次世代シーケンサー)
完成したライブラリをシーケンサーにかけ、数千万〜数億リードを取得します。
- Illuminaのシーケンサーが主流(短鎖リード、高精度)。
- PacBioやOxford Nanoporeなどのロングリードシーケンサーでは、アイソフォーム解析やスプライシングの直接検出が可能。
5. データ解析
得られた膨大なリードをバイオインフォマティクスで処理します。
- マッピング:リードをリファレンスゲノムやトランスクリプトームに割り当てる
- 定量化:各遺伝子のリード数をカウントし、発現量を推定
- 差次的発現解析:条件間で発現変動を統計的に評価
- スプライシングや融合遺伝子解析も可能
RNA-seqの強みと限界
強み
- 網羅的な発現解析が可能
- 新規転写産物やスプライシングイベントを検出できる
- 定量性が高い(マイクロアレイよりも精度良く発現差を捉えられる)
限界
- 実験バイアス(ライブラリ調製、逆転写効率の差)
- 高コスト、大容量データ解析の負担
- 生物学的解釈には追加実験(qPCR, ウエスタンブロットなど)が必須
まとめ
RNA-seqは、細胞の遺伝子発現を網羅的に、かつ高解像度で理解するための強力なツールです。原理をしっかり理解することで、実験計画の立案や得られたデータの解釈が格段にスムーズになります。
大学院生の皆さんは、単に「シーケンサーにかけるとデータが出てくる」ではなく、RNA抽出からデータ解析までの流れを一貫してイメージできることが重要です。