空間トランスクリプトミクス(ST)の多くは、1スポットが複数の細胞を混在した バルク的なシグナル を持っています。
そのため、「スポット内にどの細胞型がどれくらい存在するか」 を推定する技術が不可欠です。
この推定が デコンボリューション(Deconvolution) であり、
scRNA-seq の高解像度データを参照しながら ST の解釈力を一気に引き上げます。
1. デコンボリューションが必要な理由
■ 1スポット=単一細胞ではない(Visiumでは直径約55 µm)
- 実際には 5〜20個の細胞が混在
- mRNA量も細胞ごとに大きく異なるため、細胞型の混合比は不明
■ scRNA-seq は「細胞型のライブラリ」を提供する
- 各細胞型固有の遺伝子発現プロファイル
- ST のスポット発現は、これらプロファイルの線形和とみなせる
→ scRNA-seq を教師データとして ST を分解するのがデコンボリューション
2. デコンボリューションの原理:線形モデル
ST スポットの発現ベクトル Y は、
scRNA-seq で得られた細胞型の平均発現 X と、混合比 W の積で表される:Y≈XW
- Y:STスポット(遺伝子 × スポット)
- X:scRNA-seq の「細胞型 × 遺伝子」発現
- W:推定したい「スポット × 細胞型構成比」
各手法で最適化方法は異なるが、本質的にはこの線形モデルを解く問題。
3. 主要デコンボリューション手法(比較付き)
🔹 Cell2location(scVIベースのベイズモデル)
現時点で最も広く使われる手法の一つ。
- scRNA-seq と ST のバッチ差を階層ベイズでモデル化
- 空間内で細胞が存在しうる「確率密度」を推定
- 空間内ニッチ解析にも強い
強み:発現量差やバッチ補正にきわめて強い
弱み:GPU が推奨、計算が重い
🔹 RCTD(Robust Cell Type Decomposition)
- scRNA-seq を参照し、ST スポットの細胞型混合比を推定
- シンプルな統計モデルでロバスト
強み:高速で導入が簡単
弱み:細胞型が似ている場合は分離が難しい
🔹 SPOTlight(NMF + Deconvolution)
- 事前に NMF(行列分解)で特徴マトリクスを作る
- Seuratとの統合が容易
強み:使いやすく、多くのワークフローに組み込みやすい
弱み:NMFの事前処理が結果に影響
🔹 Tangram(深層学習ベース)
- scRNA-seq の細胞を ST へ “マッピング”
- 空間的に最も整合的な細胞配置を探す
- 細胞単位で座標を割り当てる点が革新的
強み:単一細胞空間再構築ができる
弱み:解釈性は限定的、ハイリソ計算が必要
🔹 DestVI(scVIフレームワーク)
- スポット中の細胞型だけでなく
細胞型内部の状態変化(substates)も推定 - 病態モデルで強みがある
強み:細胞型の“状態”まで空間で解析可能
弱み:実装・解釈がやや難しい
4. デコンボリューション実装の実際(解析フロー)
ステップ 1:scRNA-seq で細胞型アノテーション
- クラスタリング(Seurat/Scanpy)
- マーカー遺伝子で精密に細胞型同定
- サブタイプ整理(例:腫瘍細胞クラスターは1つにまとめる等)
ステップ 2:scRNA-seq 発現マトリクスを「参照」化
よくやる処理:
- 低品質細胞の除去
- 細胞型ごとの pseudobulk を作成
- 必要に応じて DEGs を抽出
ステップ 3:ST データの前処理
- 正規化
- スポット品質のフィルタリング
- 高可変遺伝子の選択
ステップ 4:デコンボリューション実行
例:Cell2location(python/scanpy)
例:RCTD、SPOTlight(R/Seurat)
ステップ 5:可視化
- 細胞型存在確率ヒートマップ
- スポット上の細胞型割合マップ
- 隣接する細胞の量的関係を見る(第6回の内容につながる)
5. デコンボリューションの注意点(実験計画にも重要)
1. scRNA-seq の細胞型バイアス
腫瘍などでは酵素処理が強いと、上皮系が生き残りにくい
→ scRNA-seq の参照に上皮が少ない → デコンボリューションに影響
2. scRNA と ST のプラットフォーム差
- 10x scRNA vs 10x Visium は比較的相性良い
- Smart-seq2 vs Visium はバッチ差が大きい
- Cell2location のようなバッチ補正が必須
3. 遺伝子の「ドロップアウト」
scRNA-seq はドロップアウトが多いため、
低発現遺伝子を使うと誤推定される可能性がある
4. 空間的に“存在しない”細胞が混ざるケース
例:血液細胞、脈管系細胞は局所的にしか存在しない
→ モデルが誤って全域に割り当てることがある
→ cell2location が比較的解決しやすい
6. デコンボリューションで研究がどう変わるか?(応用例)
■ がん腫瘍微小環境(TME)の構築図が得られる
- CAF、内皮、マクロファージなどの局在
- 腫瘍細胞の分布と相互作用
■ niche の境界が分かる
例:
- 肝臓:門脈域 vs 中間帯 vs 中心静脈帯
- 腸管:crypt vs villus
■ scRNA-seq では得られない spatial signature
デコンボリューションは
「細胞型 × 空間位置」の新しい軸を作る
→ 第6回の「近接解析」、第7回の「空間パスウェイ解析」へ直接つながる
まとめ
デコンボリューションとは:
- 空間データのスポットに対して
「どの細胞型がどれだけ存在するか」を推定する技術 - scRNA-seq を参照として用い、線形モデル or ベイズモデルで推定
- cell2location、RCTD、SPOTlight、Tangram、DestVI など多数の手法がある
- 空間生物学の基盤であり、
TME解析、ニッチ解析、がん幹細胞探索、臓器アトラス構築などに必須