t-SNE mapとは?
シングルセルRNA-seq解析では、数千〜数万の遺伝子発現データを1細胞ごとに取得します。しかし、そのままでは「次元数が多すぎて」直感的な解釈ができません。
そこで用いられるのが 次元削減法。t-SNE(t-distributed Stochastic Neighbor Embedding)は、その代表的な可視化手法であり、細胞集団を2次元平面上にプロットして直感的に理解できるようにするものです。
シングルセル解析におけるt-SNEの流れ
- 前処理
- QC(低品質細胞の除去)
- 正規化(遺伝子発現値のスケーリング)
- 高変動遺伝子の選定
- 次元削減(PCA)
- まずPCAで数千遺伝子を数十次元に圧縮
- t-SNEはこのPCAの出力を基に計算されることが多い
- t-SNEマッピング
- 各細胞を2Dマップ上に配置
- 似た発現パターンを持つ細胞は近くに、異なる細胞は離れて配置される
- クラスタリング
- Louvain法やLeiden法などでクラスタを同定し、t-SNE map上に色分け表示
t-SNE mapでできること
- 細胞集団の同定
マップ上に現れるクラスタは、細胞型やサブタイプを反映していることが多い。 - 新規細胞群の発見
既知のマーカー遺伝子と照合することで、新しい細胞集団を見つけられる。 - 治療や刺激による変化の可視化
薬剤処理や病態条件下で細胞集団の分布がどう変わるかを直感的に把握できる。
注意点
- クラスタ間の距離は必ずしも意味しない
t-SNEは局所的な構造を重視するため、クラスタ間が近くても「似ている」とは限らない。 - 再現性が低い
ランダム初期化に依存するため、実行ごとに異なる配置になることがある。 - パラメータ依存性
perplexity や learning rate の設定でマップの形が変わるため、結果解釈には注意が必要。
t-SNEとUMAPの比較(シングルセル解析において)
- t-SNE:クラスタの分離を強調。細胞群が「存在すること」を示すのに有効。
- UMAP:クラスタ間の関係や分化の連続性を表現。発生や可塑性研究に適する。
多くのscRNA-seq研究では、t-SNEとUMAPの両方を併用し、細胞集団の特徴を多角的に解析しています。
まとめ
- t-SNE mapはシングルセルRNA-seq解析の「標準的な可視化ツール」。
- 細胞集団を直感的に把握できるが、解釈には注意点がある。
- UMAPとの補完的な利用が推奨される。
大学院生にとって、t-SNEは論文を理解する上で必須の知識です。仕組みを理解しておけば、scRNA-seq研究をより深く読み解くことができるでしょう。
👉 本記事は教育目的の解説です。実際の解析では使用するソフトウェア(Seurat, Scanpy など)のマニュアルや最新の論文を必ず参照してください。