研究

遺伝子工学とオミクス技術:生命の設計図を自在に操る力

分子生物学は今や「見る科学」から「操る科学」へと進化しています。第9章では、生命現象を理解・改変するための遺伝子工学とオミクス技術について学びます。

遺伝子工学:DNAを切って貼って操る技術

遺伝子工学は、DNAを精密に操作して目的のタンパク質を発現させたり、遺伝子の機能を解析したりする技術です。

DNAクローニング

DNA断片をベクター(プラスミドなど)に組み込み、細胞内で増やす手法です。制限酵素とDNAリガーゼを用いる古典的な方法から、近年ではGibson AssemblyGolden Gate Assemblyといった高効率な方法も登場しています。

PCR:DNAのコピー機

Polymerase Chain Reaction(PCR)は、特定のDNA配列を指数関数的に増幅する技術です。実験の入り口でもあり、ゲノム解析、診断、遺伝子導入など多くの応用に使われています。

CRISPR-Cas9:ゲノム編集の革命

今もっとも注目されている遺伝子工学技術が、CRISPR-Cas9システムです。これはバクテリア由来の防御機構を応用したもので、狙ったDNA配列を正確に切断・修復できるため、ノックアウトやノックインが容易に行えます。今後の医療や農業、基礎研究のブレイクスルーとなる可能性を秘めています。


オミクス技術:網羅的に見る生命システム

「オミクス(-omics)」とは、ある生体分子の全体像を一括して捉えるアプローチを指します。これは細胞や生物の全体像を一枚のスナップショットとして捉える技術群とも言えます。

ゲノミクス(Genomics)

ゲノム(全DNA配列)を網羅的に解析します。次世代シーケンシング(NGS)技術により、1人のゲノム全体を数日で読むことが可能になりました。ヒトゲノム計画では10年かかっていた解析が、今ではラボで日常的に行える時代です。

トランスクリプトミクス(Transcriptomics)

RNA(主にmRNA)の発現状態を網羅的に解析する技術です。代表的なのが**RNA-seq(RNAシーク)**で、発現量の定量だけでなく、スプライシングバリアントや融合遺伝子の検出も可能です。

単一細胞レベルのscRNA-seqも登場し、細胞の多様性や分化過程を高解像度で追跡できるようになりました。

プロテオミクス(Proteomics)

mRNAの発現だけでは実際の細胞機能は予測できません。そこで重要になるのがタンパク質の網羅的解析です。質量分析(MS)を用いて、**タンパク質の種類、発現量、翻訳後修飾(リン酸化など)**まで解析できます。

メタボロミクス(Metabolomics)

細胞内の代謝物(低分子)を網羅的に解析する分野です。プロテオミクスと合わせることで、生命活動の最終的なアウトプット(代謝変化)まで捉えることができます。


技術の融合と未来

これらの技術は単独でも強力ですが、ゲノミクス×トランスクリプトミクス×プロテオミクス×メタボロミクスといった多層的なデータの統合により、**生命現象をシステムとして理解する「システム生物学」**へと進化しています。

また、AIやビッグデータ解析と組み合わせることで、新たな発見の創出や創薬、個別化医療、人工生命設計などへの応用が進んでいます。


まとめ

遺伝子工学とオミクス技術は、現代の生物学・生命科学を根本から変えました。
もはや単なる観察ではなく、「設計し、操作し、予測する」時代が到来しています。

これらの技術を正しく理解し、実験デザインに組み込むことで、分子レベルから細胞、個体、集団に至るまで、生命の謎に迫ることが可能になります。

【第1回】細胞とは何か?分子生物学の基本単位「細胞とゲノム」を理解しよう

🟢 細胞とは何か?——生命の最小単位

私たちの体は、数十兆個の「細胞」からできています。
細胞は生命の基本単位であり、単独でも生命活動を営むことができる構造です。細胞が自己複製し、物質代謝を行う能力を持つことが、生命の最小条件といえるのです。


🟢 原核細胞と真核細胞の違い

🔹 原核細胞(Prokaryotes)

  • 小型で構造が単純(1〜5µm程度)
  • 核膜がない(DNAは細胞質内にむき出しの状態)
  • 代表例:大腸菌、枯草菌などの細菌類

🔹 真核細胞(Eukaryotes)

  • 核膜で囲まれた「核」を持つ
  • ミトコンドリアやゴルジ体などの膜構造を持つ細胞小器官が存在
  • 動物・植物・真菌など、私たちの体もすべて真核細胞から構成される

🟢 すべての細胞は共通祖先から進化した

現存するすべての細胞は、**約38億年前に誕生した共通祖先細胞(LUCA)**から進化したと考えられています。
その証拠として、すべての細胞は

  • DNAを遺伝物質として使い
  • ATPをエネルギー通貨として用い
  • リボソームでタンパク質を合成する

といった、基本的な仕組みを共有しています。


🟢 ゲノムとは何か?その役割と進化

「ゲノム」とは、ある細胞が持つ**すべての遺伝情報(DNA)**のことを指します。
真核生物では染色体の形で核内に保存されており、そこにはタンパク質をつくる設計図だけでなく、

  • 発現タイミングの調整
  • 細胞の分化やシグナル応答
  • 遺伝子同士の調和的な制御

といった、生命を制御する高度な情報も含まれています。

🔹 ヒトゲノムの特徴

  • 約30億塩基対のDNAから成る
  • 2万〜2万5千個の遺伝子
  • たった1.5%のみがタンパク質をコード(残りは調節領域やノンコーディングRNAなど)

🟢 細胞の多様性とモデル生物

細胞は同じ基本構造を持ちつつ、驚くほど多様な形や機能を持ちます。

例えば:

  • 神経細胞:長い軸索を持ち、電気信号を伝える
  • 筋細胞:収縮して運動を起こす
  • 植物細胞:細胞壁と葉緑体を持つ

このような細胞の研究には「モデル生物」が使われます。代表例は:

  • 大腸菌(E. coli):原核細胞の代表
  • 出芽酵母(S. cerevisiae):真核細胞の基本構造を持つ
  • 線虫(C. elegans):発生・神経・細胞死の研究に最適
  • マウス:哺乳類モデル、生体レベルの研究が可能

🟢 まとめ

  • 細胞はすべての生命の基本単位である
  • 原核細胞と真核細胞の違いは、構造と複雑さにある
  • ゲノムはDNAから構成され、生命活動を制御する情報の宝庫
  • 細胞は共通祖先から進化し、多様な機能を獲得している
  • モデル生物は細胞の仕組みを理解する上で重要なツール

🟢 次回予告|第2章「Cell Chemistry and Bioenergetics(細胞の化学とエネルギー)」

次回は、細胞を形づくる化学的要素(水、炭素、分子間結合)と、細胞が生きていくためのエネルギー代謝の基本を解説していきます。

【保存版】SeuratとScanpyによるscRNA-seqデータ解析手順を徹底解説!

はじめに:SeuratとScanpyとは?

  • Seurat:R言語ベースのシングルセルRNA-seq解析パッケージ。豊富な可視化と柔軟なクラスタリング機能が特徴。
  • Scanpy:Pythonベースで高速処理が得意。大規模データ解析や自動化に向く。

両者は解析の目的や使用環境に応じて使い分けられます。


【共通】解析ワークフローの全体像

  1. データ読み込み
  2. 前処理(フィルタリング、正規化、スケーリング)
  3. 次元圧縮(PCA, UMAP, t-SNE)
  4. クラスタリング
  5. マーカー遺伝子の抽出
  6. 注釈(細胞タイプの同定)
  7. 差次的発現解析(DEG)
  8. 可視化

Seurat(R)の解析手順(例:10xデータ)

rコピーする編集するlibrary(Seurat)

# 1. データ読み込み
data <- Read10X(data.dir = "path/to/data")
seurat_obj <- CreateSeuratObject(counts = data)

# 2. 前処理
seurat_obj <- subset(seurat_obj, subset = nFeature_RNA > 200 & percent.mt < 5)
seurat_obj <- NormalizeData(seurat_obj)
seurat_obj <- FindVariableFeatures(seurat_obj)

# 3. 次元圧縮とクラスタリング
seurat_obj <- ScaleData(seurat_obj)
seurat_obj <- RunPCA(seurat_obj)
seurat_obj <- FindNeighbors(seurat_obj, dims = 1:10)
seurat_obj <- FindClusters(seurat_obj, resolution = 0.5)
seurat_obj <- RunUMAP(seurat_obj, dims = 1:10)

# 4. 可視化
DimPlot(seurat_obj, reduction = "umap", label = TRUE)

# 5. マーカー遺伝子と注釈
markers <- FindAllMarkers(seurat_obj)

Scanpy(Python)の解析手順(例:h5ファイル)

pythonコピーする編集するimport scanpy as sc

# 1. データ読み込み
adata = sc.read_10x_h5("path/to/data.h5")

# 2. 前処理
sc.pp.filter_cells(adata, min_genes=200)
sc.pp.filter_genes(adata, min_cells=3)
adata.var['mt'] = adata.var_names.str.startswith('MT-')
sc.pp.calculate_qc_metrics(adata, inplace=True)
adata = adata[adata.obs.pct_counts_mt < 5, :]

sc.pp.normalize_total(adata)
sc.pp.log1p(adata)
sc.pp.highly_variable_genes(adata, n_top_genes=2000)
adata = adata[:, adata.var.highly_variable]

# 3. 次元圧縮とクラスタリング
sc.pp.scale(adata)
sc.tl.pca(adata)
sc.pp.neighbors(adata)
sc.tl.umap(adata)
sc.tl.leiden(adata)

# 4. 可視化
sc.pl.umap(adata, color=['leiden'])

# 5. マーカー遺伝子
sc.tl.rank_genes_groups(adata, 'leiden', method='t-test')
sc.pl.rank_genes_groups(adata, n_genes=10)

Seurat vs Scanpy:どっちがオススメ?

項目Seurat(R)Scanpy(Python)
言語RPython
学習コストRユーザー向きPython経験者向き
データ規模中規模(数万細胞まで)大規模(数十万細胞以上もOK)
可視化洗練されたグラフィックカスタマイズ性高い
処理速度やや遅い(とくに大規模)高速
外部ツール連携Rパッケージとの連携強いNumPy/Pandasとの相性が良い

まとめ:まずは使いやすい方から始めよう!

  • 少数~中規模データで直感的に解析したい人 → Seurat
  • Pythonが得意で大規模データや自動化を視野に入れたい人 → Scanpy

どちらも無料でドキュメントが豊富なので、まずはチュートリアルを動かしながら覚えていくのが最短ルートです!

【初心者向け】代表的なシングルセルRNA-seq法の比較:10x Genomics・Smart-seq・Drop-seq

はじめに:なぜscRNA-seqには複数の手法があるのか?

シングルセルRNA-seqは、1細胞ごとの遺伝子発現プロファイルを解析するための強力な技術です。
しかしその目的(例:大量の細胞をざっくり見る vs 少数細胞を高精度で解析)や、使用する機器、予算によって最適な手法が異なります。
そのため、現在では複数のscRNA-seq法が存在しています。

本記事では代表的な以下3手法を比較します:

  • 10x Genomics Chromium(ドロップレット法)
  • Smart-seq2(プレート法)
  • Drop-seq(ドロップレット法)

比較表:scRNA-seq主要法の特徴一覧

特徴10x Genomics ChromiumSmart-seq2Drop-seq
原理ドロップレット内でバーコード付与各細胞をプレートで個別処理ドロップレット内でバーコード付与
必要機材専用マイクロフルイディクス装置ピペット操作とPCR機材のみ自作ドロップレット生成装置
対象細胞数数千~数十万細胞数十~数百細胞数千~万細胞
感度中~高(UMIで定量性◎)非常に高い(全長mRNA)低~中
検出範囲mRNAの3’末端中心全長mRNAmRNAの3’末端中心
コスト高(1サンプル数十万円)やや高(1細胞あたり高)低コストだが開発要素多
定量精度高(UMIあり)非常に高(全長+高感度)
アプリケーション例細胞集団の網羅的解析少数の稀少細胞の詳細解析自作装置による大規模スクリーニング

それぞれの技術の解説

1. 10x Genomics Chromium:業界標準のハイパフォーマンス技術

  • 仕組み:1細胞とバーコード付きビーズを油滴(ドロップレット)内で一緒に閉じ込め、cDNAを合成。
  • 特徴
    • 一度に数万細胞を処理可能
    • 高スループットで操作も簡便(専用機器が必要)
    • 3’ or 5’ 末端を検出するライブラリ構築が可能
    • クローズドシステムだが再現性・精度は非常に高い
  • おすすめ:網羅的な細胞タイプの分類・クラスタリング解析

2. Smart-seq2:全長トランスクリプトを高精度で取得

  • 仕組み:1細胞を96 or 384ウェルプレートに分注し、mRNAを逆転写・PCR増幅。全長cDNAを得る。
  • 特徴
    • 非常に高感度・高精度(全長mRNA検出可能)
    • SNP解析やアイソフォーム解析にも対応
    • 自由度が高く、特殊な遺伝子を狙いやすい
  • 欠点:UMIがないため定量性はやや劣る
  • おすすめ:希少細胞(幹細胞など)の詳細発現解析、遺伝子構造の変化解析

3. Drop-seq:コスパ重視のオープンソース技術

  • 仕組み:1細胞とバーコード付きビーズを油滴内で閉じ込める。10xと似ているがオープンなシステム。
  • 特徴
    • 低コストで大量細胞の解析が可能
    • 自作装置が必要だが、自由度が高い
    • 3’末端しか検出できないため一部の解析には不向き
  • おすすめ:大規模スクリーニングや自作システムでの低予算研究

まとめ:どのscRNA-seq法を使うべき?

目的推奨手法
網羅的に数万細胞を解析したい10x Genomics
少数の細胞を高感度で解析したいSmart-seq2
低予算で大規模スクリーニングしたいDrop-seq

【初心者向け】RT-qPCRとは?RNAの定量をリアルタイムで行う方法をやさしく解説!

はじめに:RT-qPCRって何?

RT-qPCR(アールティー・キューピーシーアール)とは、

「RNAをDNAに変換し、それをリアルタイムで定量するPCR」

のことです。
正式には「Reverse Transcription quantitative PCR(逆転写定量PCR)」と呼ばれ、RNAの量を正確に測るために使われています。


どういうときにRT-qPCRを使うの?

  • ウイルスRNA(例:新型コロナウイルス)を検出
  • 細胞の**遺伝子発現量(mRNA)**を調べる
  • 遺伝子治療や創薬の効果検証など、医療・バイオ研究の必須技術

RNAはそのままではPCRできないため、まずDNA(cDNA)に変換してからPCRを行うのがポイントです。


RT-qPCRの基本ステップ

RT-qPCRは、以下の2段階の反応で行われます:

① 逆転写(RT:Reverse Transcription)

RNAからDNA(cDNA)を作るステップ
→ 酵素「逆転写酵素(リバーストランスクリプターゼ)」を使用

② qPCR(リアルタイムPCR)

cDNAを蛍光を使ってリアルタイムに増幅・定量するステップ
→ 蛍光色素(SYBR Green)やプローブ(TaqMan)を使用


RNA → cDNA → DNAをリアルタイムで測定!

RNA(例:mRNA)
 ↓ 逆転写(RT)
cDNA(一本鎖のDNA)
 ↓ qPCR
定量(Ct値で評価)

RNAの量が多いほど、できるcDNAも多くなり、qPCRでのCt値は小さくなります


Ct値(Cycle threshold)とは?

qPCRと同様に、RT-qPCRでもCt値が重要です。これは、

「蛍光が検出され始めるサイクル数」

のことで、Ct値が小さいほど、もともとのRNA量が多かったことを意味します。


RT-qPCRでよく使う試薬と装置

  • 逆転写酵素(例:SuperScript, ReverTra Aceなど)
  • SYBR Green:DNAに結合して蛍光を発する色素
  • TaqManプローブ:特異的なDNAにだけ反応する蛍光プローブ
  • サーマルサイクラー(リアルタイムPCR装置)

RT-qPCRの用途まとめ

✅ 感染症検査(ウイルスRNAの検出)
✅ 遺伝子発現解析(mRNAの比較)
✅ miRNA解析、lncRNA解析など
✅ 治療効果・薬剤反応のモニタリング


RT-qPCRとqPCR、通常のPCRの違い

項目通常のPCRqPCRRT-qPCR
測定対象DNADNARNA(→ cDNA)
測定定性(ある/なし)定量(量)定量(RNA量)
特徴DNAを増やすDNAの量を測るRNAをDNAに変えて測る

まとめ:RT-qPCRはRNAの“量”を測る技術!

🔹 RT-qPCRはRNA(特にmRNA)をリアルタイムで定量する方法
🔹 逆転写 → qPCRの2段階で行う
🔹 Ct値でRNA量の差を比較できる
🔹 感染症、がん研究、遺伝子発現解析に欠かせない


よくある質問(FAQ)

Q. RNAはそのままPCRできますか?
→ できません。必ずcDNAに変換(逆転写)してからPCRします。

Q. RNAの定量は何に使えるの?
→ 遺伝子の「発現量」がわかるため、病気の診断や治療効果の確認に使われます。

Q. qPCRとRT-qPCRの違いは?
→ 測定対象が違います。qPCRはDNA、RT-qPCRはRNA(をcDNAにして)を測ります。

『Molecular Biology of the Cell』(第7版)全24章解説

タイトル(日本語訳)内容概要
1Cells and Genomes(細胞とゲノム)全ての生命体に共通する細胞の基本構造とゲノムの進化的背景。
2Cell Chemistry and Bioenergetics(細胞の化学と生体エネルギー学)化学結合、水と分子、代謝とエネルギーの基本。
3Proteins(タンパク質)タンパク質の構造、フォールディング、機能、ドメイン。
4DNA, Chromosomes, and Genomes(DNA、染色体、ゲノム)真核生物の染色体構造とゲノムの構成。
5DNA Replication, Repair, and Recombination(DNAの複製、修復、組換え)高精度なDNA維持の機構。
6How Cells Read the Genome: From DNA to Protein(DNAからタンパク質への読み取り)転写、RNAプロセシング、翻訳の概要。
7Control of Gene Expression(遺伝子発現の制御)転写因子、エピジェネティクス、遺伝子調節回路。
8Analyzing Cells, Molecules, and Systems(細胞・分子・システムの解析法)光学・電子顕微鏡、オミクス解析、ライブセル観察。
9Visualizing Cells(細胞を「見る」技術)蛍光標識、免疫染色、共焦点・2光子顕微鏡。
10Membrane Structure(膜構造)脂質二重層、膜流動性、膜タンパク質の配置。
11Membrane Transport of Small Molecules and the Electrical Properties of Membranes(膜輸送と膜電位)担体、チャネル、膜電位とその制御。
12Intracellular Compartments and Protein Sorting(細胞内小器官とタンパク質のソーティング)ER、ゴルジ体、核、ミトコンドリアへのタンパク輸送。
13Intracellular Membrane Traffic(細胞内膜トラフィック)小胞輸送、エンドサイトーシス、エクソサイトーシス。
14Energy Conversion: Mitochondria and Chloroplasts(エネルギー変換:ミトコンドリアと葉緑体)呼吸鎖、ATP合成、光合成の概要。
15Cell Signaling(細胞シグナル伝達)受容体、Gタンパク、酵素型受容体、MAPK経路など。
16The Cytoskeleton(細胞骨格)アクチン、微小管、中間径フィラメントとその動的制御。
17The Cell Cycle(細胞周期)G1, S, G2, M、チェックポイントとCDK制御。
18Cell Death(細胞死)アポトーシス、ネクローシス、細胞死シグナル。
19Cell Junctions and the Extracellular Matrix(細胞接着と細胞外マトリクス)カドヘリン、インテグリン、ECMの構成と機能。
20Cancer(がん)発がん機構、変異、がん遺伝子と抑制遺伝子、治療標的。
21Development of Multicellular Organisms(多細胞生物の発生)形態形成、分化、組織の空間構築。
22Specialized Tissues, Stem Cells, and Tissue Renewal(幹細胞と組織再生)幹細胞ニッチ、恒常性、再生医療の基礎。
23Pathogens and Infection(病原体と感染)ウイルス、細菌、寄生虫と宿主細胞との関係。
24The Adaptive Immune System(適応免疫系)B細胞・T細胞、抗体、免疫記憶と抗原提示。

今後これらについて1章ずつ簡単にまとめた解説を投稿していきます。

シングルセルRNA-seqとは?──1細胞レベルで遺伝子発現を読み解く最先端技術

シングルセルRNA-seqとは?

シングルセルRNAシーケンス(single-cell RNA sequencing / scRNA-seq)は、個々の細胞におけるmRNA(メッセンジャーRNA)発現を網羅的に解析する次世代シーケンス技術です。

従来のRNA-seqでは、組織全体や細胞群から抽出したRNAをまとめて解析するため、細胞間の違いは“平均化”されてしまいます。対してscRNA-seqは、1細胞単位でRNA発現を可視化できるため、同じ組織内でも異なる遺伝子プロファイルを持つ細胞の存在を明らかにできます。


シングルセルRNA-seqの特徴

  • 🔬 個々の細胞の遺伝子発現を明らかに
  • 🧠 細胞の多様性や分化状態を把握可能
  • 🧬 細胞系譜(クローン)や発生過程を解析できる
  • 🧪 がんや免疫系、神経系などの研究で革命的ツール

scRNA-seqの基本的な流れ

1. 単一細胞の分離

細胞を1つずつ分離する必要があります。方法には以下があります:

  • FACS(蛍光活性細胞分取)
  • マイクロ流体チップ(10x Genomicsなど)
  • マイクロマニピュレーター

2. 細胞ごとのmRNA抽出・逆転写

各細胞からmRNAを抽出し、逆転写酵素(RT)でcDNA(相補DNA)へ変換します。

このとき、細胞ごとのバーコードや**UMI(Unique Molecular Identifier)**を付加することで、後からどのcDNAがどの細胞・どのmRNA由来かを識別できるようにします。

3. cDNAの増幅とライブラリ調製

得られたcDNAをPCRで増幅し、次世代シーケンサー(NGS)に適したライブラリを調製します。

4. シーケンス(配列決定)

IlluminaなどのNGSを用いて、バーコード付きcDNAをシーケンスします。

5. データ解析

  • 各リードから細胞バーコードとUMIを認識
  • マッピング(リファレンスゲノムへの位置合わせ)
  • UMIによる重複排除遺伝子ごとのカウント
  • 発現マトリックス作成
  • クラスタリング・次元圧縮(tSNE, UMAP)
  • 細胞型推定や軌跡解析(trajectory analysis)

バルクRNA-seqとの違い

特徴バルクRNA-seqシングルセルRNA-seq
対象細胞集団単一細胞
感度平均化される細胞ごとの差異が見える
データ量少なめ非常に多い
難易度比較的簡単技術的に高度

scRNA-seqが切り開く未来

  • がん研究:がん幹細胞や薬剤耐性クローンの同定
  • 再生医療:分化・発生の軌跡の解析
  • 免疫学:免疫細胞の多様性と状態の把握
  • 脳科学:神経細胞の分類やネットワーク理解

おわりに

シングルセルRNA-seqは、**「細胞レベルで生命を理解する」**ための強力なツールです。高感度・高解像度での遺伝子発現解析が可能になったことで、従来の見方を一変させる研究成果が次々と生まれています。

この技術を正しく理解し、目的に応じた設計や解析を行うことで、より深い生命現象の理解が進むでしょう。

次世代シーケンスにおける「ライブラリ」と「アダプター」とは?——初心者にもわかる仕組みと役割

はじめに

次世代シーケンサー(NGS)による解析は、がん研究から微生物叢の解析まで幅広く活用されています。その中で欠かせない工程が「ライブラリ調製」と「アダプター配列の付加」です。

「ライブラリって何?」「アダプターってなぜ必要なの?」
そう思ったことがある方へ向けて、本記事ではライブラリとアダプターの基本構造、役割、使用される技術まで、図解つきで丁寧に解説します。


ライブラリとは?

● ライブラリ=「シーケンスにかけるためのDNA断片のセット」

NGSでは、解析対象となるDNAやRNAを短い断片に切断し、アダプターを付加した状態で次世代シーケンサーにかけます。このアダプター付き断片の集合体が「ライブラリ」と呼ばれます。

● ライブラリを作る目的

  • DNA断片化:解析対象の遺伝子やトランスクリプトを短く切断(例:200–500 bp)
  • アダプター付加:PCR増幅やシーケンサーへの読み込みのために必要
  • 均一な増幅・配列決定:断片の長さや構造を揃えることで、安定したシーケンスが可能になる

アダプターとは?

● アダプターは“タグ”や“取っ手”のようなもの

アダプターは人工的に合成された短いDNA配列で、ライブラリの両端に付加されます。

● アダプターの主な役割

役割説明
プライマー結合部位PCR増幅のためのプライマーがここに結合します
フローセルへの結合シーケンサー(例:Illumina)のフローセルにDNAを固定するため
バーコード(オプション)複数サンプルを同時に解析するための識別コード(インデックス)
シーケンス開始点リーディング開始のための“導入部”の役割も果たす

● 代表的なアダプターの例(Illumina)

  • P5 / P7領域:フローセルへの結合部
  • Read 1 / Read 2 プライマー結合部位:リードの配列読み取り開始点
  • Index(インデックス):サンプル識別用バーコード

ライブラリ調製の流れ(例:RNA-seq)

  1. RNA抽出
     ↓
  2. mRNA選別(poly-A精製 or rRNA除去)
     ↓
  3. 断片化・逆転写(RNA→cDNA)
     ↓
  4. アダプター付加(ライゲーション or tagmentation)
     ↓
  5. PCR増幅
     ↓
  6. ライブラリ完成・品質確認(バイオアナライザーなど)
     ↓
  7. シーケンサーへ投入

Tagmentationとは?(補足)

最近のNGSキットでは、トランスポザー酵素を使って一度に断片化+アダプター付加を行う「Tagmentation」という方法が使われることもあります。
→ より高速・簡便にライブラリを作製できる技術です。


まとめ

  • ライブラリとは「解析対象のDNA/RNA断片にアダプターを付加した集合体」
  • アダプターは、PCR・シーケンサー固定・バーコード化など、解析の鍵を握る配列
  • NGSでは、ライブラリとアダプターの設計が解析精度を大きく左右する

初心者がNGSを理解する上で、この「ライブラリとアダプター」の概念は絶対に外せません。正しく理解することで、RNA-seqやWGSの実験設計もより深く考察できるようになります。

次世代シーケンサー(NGS)におけるシーケンス・マッピング・定量解析の流れを徹底解説

はじめに

次世代シーケンサー(Next Generation Sequencing:NGS)は、ゲノムやトランスクリプトームの網羅的な解析を可能にした革新的な技術です。特にRNA-seqやDNA-seqでは、「シーケンス」「マッピング」「定量解析」の3ステップが基本的な解析フローとなります。

この記事では、それぞれのステップについて、バイオインフォマティクス初心者でも理解できるように、丁寧に解説します。


ステップ①:シーケンス(Sequencing)

目的:

DNAやRNA由来の断片を読み取り、**塩基配列(リード)**として取得する。

概要:

NGSでは、まずライブラリ化されたDNA断片(アダプターが付いた状態)をシーケンサーで読み取ります。代表的なプラットフォームとしてIllumina(短鎖リード)やOxford Nanopore(長鎖リード)があります。

流れ:

  1. ライブラリ調製:断片化 → アダプター付加 → 増幅
  2. クラスター生成(Illumina):フローセル上で同一DNA断片が増幅される
  3. シーケンシング
    • Illumina:リバーシブルターミネータ法
    • Nanopore:ナノポアを通過する電流変化で塩基を読み取る
  4. FASTQファイル出力:リード配列とクオリティ情報が含まれる

ステップ②:マッピング(Mapping)

目的:

得られたリードを、**既知のリファレンスゲノムやトランスクリプトームに位置づける(アラインメント)**こと。

使用ツール:

  • DNA-seq:BWA, Bowtie2
  • RNA-seq:STAR, HISAT2 など(スプライスサイトの処理も対応)

ポイント:

  • リード品質の確認(FastQCなど)
  • トリミング(低品質な塩基やアダプター除去)
  • マルチマッピング:同じリードが複数の場所に当たる場合の処理
  • 出力形式:SAM/BAMファイルとして保存

補足:

RNA-seqでは、スプライシングを考慮したアラインメントが重要です。例えば、STARはイントロンをスキップしてエクソンをつなぐリードにも対応できます。


ステップ③:定量解析(Quantification)

目的:

遺伝子やトランスクリプトの発現量を定量化する。

方法:

  • カウントベース法
    • featureCounts(遺伝子ごとのリード数をカウント)
    • HTSeq-count
  • 確率モデルベース
    • RSEM, Salmon, Kallisto(高速でトランスクリプトレベルの定量が可能)

正規化の重要性:

  • TPM(Transcripts Per Million)
  • FPKM(Fragments Per Kilobase of transcript per Million reads mapped)
  • DESeq2やedgeRでは、生データからライブラリサイズ補正を加味

応用解析への発展

定量解析後は、差次的発現解析(DEG解析)、クラスタリング、経路解析、Gene Set Enrichment Analysis(GSEA)などに進むのが一般的です。


まとめ

ステップ内容主なツール出力
シーケンス塩基配列を読むIllumina, NanoporeFASTQ
マッピングリードをゲノムに配置STAR, HISAT2BAM
定量解析発現量の計算featureCounts, Salmonカウント行列(TSVなど)

NGS解析は一見複雑ですが、上記の3ステップを理解することで、解析の全体像がつかめます。今後、RNA-seq、ATAC-seq、ChIP-seqなど、さまざまなオミクス解析にも応用可能です。

【初心者向け】バルクRNA-seqとは?遺伝子発現を網羅的に調べる次世代技術を解説!

はじめに:RNA-seqって何?

RNA-seq(RNAシーケンシング)」とは、細胞の中でどの遺伝子がどれだけ発現しているかを、網羅的に調べることができる次世代シーケンス(NGS)技術です。

その中でも「バルクRNA-seq(bulk RNA-seq)」は、複数の細胞のRNAをまとめて解析する方法で、最も一般的かつコストパフォーマンスの良い解析手法です。


バルクRNA-seqとは?

バルクRNA-seqとは、

組織や細胞集団から抽出したRNAを一括で解析して、全体の遺伝子発現量を調べる方法

です。1細胞ごとではなく、**「集団の平均的な発現情報」**が得られます。


何がわかるの?バルクRNA-seqの目的

✅ どの遺伝子が発現しているか(有無)
✅ どのくらいの量で発現しているか(発現量)
✅ 病気や処理の有無での発現変化(DEG:差次的発現遺伝子)

例:正常 vs がん細胞で、がん特異的に高発現している遺伝子を同定できる


バルクRNA-seqの基本ステップ

  1. RNA抽出
     細胞や組織からトータルRNAを取り出します。
  2. mRNAの濃縮(またはrRNA除去)
     → poly(A)選択やrRNA除去キットを使用して、解析対象のRNAに絞ります。
  3. cDNA合成
     → RNAをDNA(cDNA)に逆転写します。
  4. ライブラリ調製
     → シーケンスに適した断片化・アダプター付加を行います。
  5. 次世代シーケンサー(NGS)で解析
     → Illuminaなどの装置で数百万〜数千万リードを読み取ります。
  6. データ解析(バイオインフォマティクス)
     → マッピング、カウント、正規化、差次的発現解析(DESeq2, edgeRなど)

バルクRNA-seqのメリットとデメリット

✅ メリット

  • 比較的安価・簡便
  • 細胞集団全体の発現傾向がつかめる
  • 組織レベルや動物モデルでも使いやすい

⚠ デメリット

  • 細胞ごとの違いはわからない(平均化される)
  • 少数派の細胞の情報は埋もれてしまう可能性がある

シングルセルRNA-seqとの違いは?

項目バルクRNA-seqシングルセルRNA-seq
対象細胞集団全体一細胞ごと
解像度低い(平均)高い(細胞ごと)
コスト安い高い
難易度低〜中高(専門機器・解析スキル)

どんな研究で使われている?

  • ✅ がん研究(正常 vs 腫瘍の遺伝子発現比較)
  • ✅ 創薬・薬剤応答の評価
  • ✅ 発生・分化の過程の発現変化の把握
  • ✅ 疾患バイオマーカー探索

バルクRNA-seqの解析でよく使うツール

  • FastQC:リードの品質チェック
  • STAR, HISAT2:リードのマッピング
  • featureCounts, HTSeq:遺伝子ごとのカウント
  • DESeq2, edgeR:差次的発現解析
  • Enrichr, GSEA:経路・機能解析

まとめ:バルクRNA-seqは発現変化を見る強力なツール!

🔹 バルクRNA-seqは、細胞集団全体のRNA発現を網羅的に測定する技術
🔹 遺伝子のON/OFFや発現量の変化が数値でわかる
🔹 がんや感染症、分化など、あらゆる生物学的現象の解析に使われている
🔹 シングルセルと比べてコストが安く、汎用性が高い


よくある質問(FAQ)

Q. RNA-seqはRT-qPCRとどう違いますか?
→ RNA-seqは網羅的に全遺伝子の発現を一度に見る方法、RT-qPCRは特定の遺伝子のみを高精度に定量する方法です。

Q. なぜRNAをDNAに変えるのですか?
→ 次世代シーケンサーはRNAを直接読めないため、一度**cDNAに変換(逆転写)**してから解析します。

Q. 組織サンプルでも使えますか?
→ はい、可能です。ただし細胞の混在に注意が必要です。