第5回:scRNA-seq統合(デコンボリューション)─ 空間データに“細胞型情報”を与える核心技術─

  • このエントリーをはてなブックマークに追加
Pocket

空間トランスクリプトミクス(ST)の多くは、1スポットが複数の細胞を混在した バルク的なシグナル を持っています。
そのため、「スポット内にどの細胞型がどれくらい存在するか」 を推定する技術が不可欠です。

この推定が デコンボリューション(Deconvolution) であり、
scRNA-seq の高解像度データを参照しながら ST の解釈力を一気に引き上げます。


1. デコンボリューションが必要な理由

■ 1スポット=単一細胞ではない(Visiumでは直径約55 µm)

  • 実際には 5〜20個の細胞が混在
  • mRNA量も細胞ごとに大きく異なるため、細胞型の混合比は不明

■ scRNA-seq は「細胞型のライブラリ」を提供する

  • 各細胞型固有の遺伝子発現プロファイル
  • ST のスポット発現は、これらプロファイルの線形和とみなせる

→ scRNA-seq を教師データとして ST を分解するのがデコンボリューション


2. デコンボリューションの原理:線形モデル

ST スポットの発現ベクトル Y は、
scRNA-seq で得られた細胞型の平均発現 X と、混合比 W の積で表される:YXWY \approx XWY≈XW

  • Y:STスポット(遺伝子 × スポット)
  • X:scRNA-seq の「細胞型 × 遺伝子」発現
  • W:推定したい「スポット × 細胞型構成比」

各手法で最適化方法は異なるが、本質的にはこの線形モデルを解く問題。


3. 主要デコンボリューション手法(比較付き)


🔹 Cell2location(scVIベースのベイズモデル)

現時点で最も広く使われる手法の一つ。

  • scRNA-seq と ST のバッチ差を階層ベイズでモデル化
  • 空間内で細胞が存在しうる「確率密度」を推定
  • 空間内ニッチ解析にも強い

強み:発現量差やバッチ補正にきわめて強い
弱み:GPU が推奨、計算が重い


🔹 RCTD(Robust Cell Type Decomposition)

  • scRNA-seq を参照し、ST スポットの細胞型混合比を推定
  • シンプルな統計モデルでロバスト

強み:高速で導入が簡単
弱み:細胞型が似ている場合は分離が難しい


🔹 SPOTlight(NMF + Deconvolution)

  • 事前に NMF(行列分解)で特徴マトリクスを作る
  • Seuratとの統合が容易

強み:使いやすく、多くのワークフローに組み込みやすい
弱み:NMFの事前処理が結果に影響


🔹 Tangram(深層学習ベース)

  • scRNA-seq の細胞を ST へ “マッピング”
  • 空間的に最も整合的な細胞配置を探す
  • 細胞単位で座標を割り当てる点が革新的

強み:単一細胞空間再構築ができる
弱み:解釈性は限定的、ハイリソ計算が必要


🔹 DestVI(scVIフレームワーク)

  • スポット中の細胞型だけでなく
    細胞型内部の状態変化(substates)も推定
  • 病態モデルで強みがある

強み:細胞型の“状態”まで空間で解析可能
弱み:実装・解釈がやや難しい


4. デコンボリューション実装の実際(解析フロー)


ステップ 1:scRNA-seq で細胞型アノテーション

  • クラスタリング(Seurat/Scanpy)
  • マーカー遺伝子で精密に細胞型同定
  • サブタイプ整理(例:腫瘍細胞クラスターは1つにまとめる等)

ステップ 2:scRNA-seq 発現マトリクスを「参照」化

よくやる処理:

  • 低品質細胞の除去
  • 細胞型ごとの pseudobulk を作成
  • 必要に応じて DEGs を抽出

ステップ 3:ST データの前処理

  • 正規化
  • スポット品質のフィルタリング
  • 高可変遺伝子の選択

ステップ 4:デコンボリューション実行

例:Cell2location(python/scanpy)
例:RCTD、SPOTlight(R/Seurat)


ステップ 5:可視化

  • 細胞型存在確率ヒートマップ
  • スポット上の細胞型割合マップ
  • 隣接する細胞の量的関係を見る(第6回の内容につながる)

5. デコンボリューションの注意点(実験計画にも重要)


1. scRNA-seq の細胞型バイアス

腫瘍などでは酵素処理が強いと、上皮系が生き残りにくい
→ scRNA-seq の参照に上皮が少ない → デコンボリューションに影響


2. scRNA と ST のプラットフォーム差

  • 10x scRNA vs 10x Visium は比較的相性良い
  • Smart-seq2 vs Visium はバッチ差が大きい
  • Cell2location のようなバッチ補正が必須

3. 遺伝子の「ドロップアウト」

scRNA-seq はドロップアウトが多いため、
低発現遺伝子を使うと誤推定される可能性がある


4. 空間的に“存在しない”細胞が混ざるケース

例:血液細胞、脈管系細胞は局所的にしか存在しない
→ モデルが誤って全域に割り当てることがある
→ cell2location が比較的解決しやすい


6. デコンボリューションで研究がどう変わるか?(応用例)


■ がん腫瘍微小環境(TME)の構築図が得られる

  • CAF、内皮、マクロファージなどの局在
  • 腫瘍細胞の分布と相互作用

■ niche の境界が分かる

例:

  • 肝臓:門脈域 vs 中間帯 vs 中心静脈帯
  • 腸管:crypt vs villus

■ scRNA-seq では得られない spatial signature

デコンボリューションは
「細胞型 × 空間位置」の新しい軸を作る
→ 第6回の「近接解析」、第7回の「空間パスウェイ解析」へ直接つながる


まとめ

デコンボリューションとは:

  • 空間データのスポットに対して
    「どの細胞型がどれだけ存在するか」を推定する技術
  • scRNA-seq を参照として用い、線形モデル or ベイズモデルで推定
  • cell2location、RCTD、SPOTlight、Tangram、DestVI など多数の手法がある
  • 空間生物学の基盤であり、
    TME解析、ニッチ解析、がん幹細胞探索、臓器アトラス構築などに必須
  • このエントリーをはてなブックマークに追加

SNSでもご購読できます。

コメントを残す

*