
エピゲノム情報解析
エピゲノム・立体構造情報を全ゲノム的に調査するエピゲノム情報解析の全体像を解説した。
- 発行予定日
- 2025/07/中旬
- 判型
- A5
- 予定ページ数
- 192ページ
- ISBN
- 978-4-339-02737-2

- 内容紹介
- まえがき
- 目次
【書籍の特徴】
次世代シークエンサーを用いた全ゲノム解析は今日極めて一般的なものになっています。その中にはChIP-seq, ATAC-seq, Hi-Cなど様々な分野(アッセイ)があり,それぞれで用いられている解析技術は異なりますが,そのような情報解析技術の全体について詳細が書かれた書籍は多くありません。本書ではそのようなエピゲノム解析の全体像を把握するための入門書となることを目指し,エピゲノム解析,ゲノム立体構造解析を中心に情報解析の概要と要点について解説しています(一部シングルセル解析も含みます)。各アッセイの詳細なプロトコルや具体的なツールの利用法などは割愛し,その背後にあるゲノムデータの特性,その解析で認識しておくべき普遍的な考え方や歴史的な潮流を紹介することに注力しています。エピゲノム解析に関する講義の参考図書として利用していただければ幸いです。
【各章について】
1章:エピゲノム情報とは(エピゲノム解析及び次世代シークエンサーについて)
2章:ヒストン修飾,転写因子結合(ChIP-seq解析とその下流解析)
3章:DNAメチル化(MeDIP-seq,バイサルファイトシークエンシングなど)
4章:オープンクロマチン, ヌクレオソーム(ATAC-seq,scATAC-seq, MNase-seqなど)
5章:ゲノム三次元構造(Hi-C, Hi-ChIP,ポリマーシミュレーションなど)
6章:エピゲノムデータベースと大規模解析(データベースの紹介とそれらを利用した大規模解析)
【読者へのメッセージ】
本書は初学者でも読めるよう配慮し,また解析経験者にも学びがあるものとなるように書きました。また,生命系,理論系いずれのバックグラウンドを持つ人にとっても有用なものとなるように努力したつもりです。本書をきっかけにエピゲノム情報解析研究を志す学生や研究者が増えることを願っています。
【本書のキーワード】
エピゲノム,転写因子,ヒストン修飾,オープンクロマチン,DNAメチル化,ゲノム立体構造,データベース,大規模解析,バイオインフォマティクス
☆発行前情報のため,一部変更となる場合がございます
生物のゲノム配列には複雑な生命情報がどのように書き込まれているのか?この魅力的な問いは我々を惹きつけて離さない。ゲノムはその配列情報のみならず,配列の修飾状態(エピゲノム)や核内における立体的構造などを利用してその機能を適切に発現させている。シークエンサーを用いてそのようなエピゲノム・立体構造情報を全ゲノム的に調査するエピゲノム情報解析は,ゲノムに潜むそのような謎を解明するための手段となりうる。エピゲノム情報解析分野は近年急速に発展しており,統計学,配列解析,機械学習,分子シミュレーション,数理モデルなどさまざまな手法を取り入れながら,分野横断的で多彩な研究が展開されている。この多彩さがエピゲノム情報解析の魅力であるが,エピゲノム自体の種類の多さも相まって,その全体像を把握することがやや難しい側面がある。
本書はそのようなエピゲノム情報解析の全体像を把握するための入門書となることを目指して執筆した。本書は初学者でも読むことができ,また中級者にも学びがあるものとなっている。生命系,理論系いずれのバックグラウンドを持つ方にとっても有用なものとなるように努力したつもりである。エピゲノム情報解析はきわめて進歩が速い分野であり,トレンド変化も激しい。本書を長く有用なものとするため,個々のサンプル調製プロトコルやツールの紹介などは最小限とし,その背後にあるより普遍的な考え方や歴史的な潮流について説明することに注力した。文献については歴史的に重要なものを押さえながら,深層学習手法など最新のアプローチも適宜取り入れるようにしている。教科書的な位置づけも意識しており,講義の教材として使っていただければ大変嬉しく思う。
本書は全6章から構成される。1章は導入であり,ゲノム・エピゲノム情報とは何か,どのような種類があるかについて,またエピゲノム情報解析に必須の技術であるシークエンサーの基本的なデータ解析方法について概説している。続く2章では転写因子結合,ヒストン修飾解析,3章ではDNAメチル化解析,4章ではオープンクロマチン・ヌクレオソーム解析を解説している。これらの解析では共通した考え方・解析法も多く,たがいに内容が関連しているため,組み合わせて読むことで理解が深まるだろう。一方,5章のゲノム三次元構造は内容がやや独立しており,解析法も他とは大きく異なる。立体構造解析についての詳細を記した和書はまだ数少ないと思われるので,ぜひ活用していただきたい。6章では国際的なエピゲノムデータベースについて解説し,それらを用いた大規模解析の例について紹介している。
なお,特に断りがない場合,本書は筆者が普段親しんでいるヒトやマウスなどの哺乳類を対象にしている。初学者にとってのわかりやすさを重視したため,個々の用語の厳密な説明については不正確な表現になっている箇所があるかもしれない。多くの文献を引用してあるので,個々のトピックに興味を持たれた読者においてはぜひそれらの文献を参照していただきたい。そのような理解の入口として使っていただき,本書をきっかけにエピゲノム情報解析研究を志す学生や研究者が増えれば筆者望外の喜びである。
本書の執筆の機会を与えていただいた早稲田大学理工学術院の浜田道昭先生にこの場を借りて感謝申し上げる。また本書の執筆にあたり,数多くの先生方の助言をいただいた。東京大学定量生命科学研究所の岸雄介先生,札幌厚生病院の牧野吉倫博士には全章通じてレビューいただき,たくさんの有益なコメントをいただいた。また,千葉大学大学院医学研究院の岡部篤史先生,東京大学先端科学技術研究センターの永江玄太先生,東京大学大学院新領域創成科学研究科の三浦史仁先生,京都大学化学研究所バイオインフォマティクスセンターの阿久津達也先生,理化学研究所生命機能科学研究センターの新海創也博士には,筆者の知識が十分でない箇所について多くのご指南をいただいた。筆者の研究室である東京大学定量生命科学研究所大規模生命情報解析研究分野のメンバー,特に西條栄子博士と長岡勇也博士には用語の表現方法や説明を加えたほうがよいトピックに関してさまざまなコメントをいただいた。この場を借りて各氏にお礼を申し上げたい。本書の完成を辛抱強く待ち,サポートいただいたコロナ社の方々にも深く感謝する。最後に,本書の執筆をずっと応援してくれていた筆者の妻と子どもたち,彼らの応援がなければ本書の完成はなかった。心から感謝したい。
2025年6月
中戸隆一郎
☆発行前情報のため,一部変更となる場合がございます
1.エピゲノム情報とは
1.1 ゲノム
1.1.1 コーディング遺伝子・ノンコーディング遺伝子
1.1.2 ゲノミクス
1.2 エピゲノム
1.2.1 細胞種の個性を形成するエピゲノム
1.2.2 細胞分化におけるエピゲノムの遷移
1.2.3 ゲノムリプログラミング
1.2.4 環境で変化するエピゲノム
1.3 エピゲノムの種類
1.3.1 DNAメチル化
1.3.2 ヒストン修飾
1.3.3 転写因子結合
1.3.4 オープンクロマチン
1.3.5 ゲノム三次元構造
1.4 シークエンサーを用いたエピゲノム解析
1.4.1 シークエンサーの概要
1.4.2 リードデータの形式(FASTQ形式)
1.4.3 シングルエンドリードとペアエンドリード
1.4.4 シークエンサーデータの公開・共有
1.5 リードマッピング
1.5.1 シークエンサーデータのマッピング
1.5.2 ユニークリードとマルチリード
1.5.3 マップデータの形式(SAM・BAM形式)
1.5.4 BED形式
1.6 リード分布
1.6.1 リード分布ファイルの形式
1.6.2 マッパビリティ
2.ヒストン修飾,転写因子結合
2.1 ChIP-seq法とは
2.1.1 ChIP-seq法の流れ
2.1.2 その他のアッセイ
2.2 ピーク検出
2.2.1 ピークの種類
2.2.2 リード分布モデル
2.2.3 インプットサンプル・ネガティブコントロールとの比較
2.2.4 p値の閾値と多重検定の補正
2.2.5 Irreproducible discovery rate(IDR)
2.2.6 その他のピーク検出法
2.2.7 広域ピークの検出
2.2.8 混合ピークの解析
2.3 品質評価
2.3.1 ChIP-seqデータの品質
2.3.2 リード深度
2.3.3 ライブラリ複雑度
2.3.4 S/N比
2.3.5 ストランドシフトプロファイルを用いたS/N比とDNA断片長の評価
2.4 サンプル間ピーク比較
2.4.1 二値比較
2.4.2 定量的比較
2.4.3 定量的比較のためのリード正規化手法
2.4.4 スパイクイン正規化
2.5 モチーフ抽出
2.5.1 モチーフ抽出とは
2.5.2 モチーフ抽出法の種類
3.DNAメチル化
3.1 DNA メチル化とは
3.1.1 DNAメチル化・ヒドロキシメチル化
3.1.2 DNA脱メチル化機構
3.1.3 DNAメチル化の生物学的意義
3.1.4 ゲノムインプリンティング
3.2 DNAメチル化解析アッセイの種類
3.2.1 MeDIP-seq
3.2.2 バイサルファイトシークエンシング
3.2.3 PBAT法
3.2.4 Reduced representation bisulfite sequencing(RRBS)
3.2.5 マイクロアレイ(Infinium)
3.2.6 1分子シークエンサーを用いたメチル化解析
3.3 DNAメチル化解析のワークフロー
3.3.1 DNAメチル化解析の流れ
3.3.2 サンプル間メチル化比較:フィッシャーの正確確率検定
3.3.3 サンプル間メチル化比較:ロジスティック回帰
4.オープンクロマチン,ヌクレオソーム
4.1 オープンクロマチン・ヌクレオソーム解析とは
4.1.1 オープンクロマチン解析
4.1.2 オープンクロマチン解析とヌクレオソーム解析の種類
4.1.3 ChIP-seqとの用途の違い
4.2 オープンクロマチン・ヌクレオソーム解析のワークフロー
4.2.1 オープンクロマチン解析の流れ
4.2.2 ヌクレオソーム解析の流れ
4.2.3 オープンクロマチン解析のピーク抽出
4.2.4 モチーフ抽出
4.2.5 転写因子フットプリント
4.3 シングルセル解析(scATAC-seq)
4.3.1 scATAC-seqとは
4.3.2 scATAC-seqの流れ
4.3.3 遺伝子発現量の推定
4.3.4 疑似バルク解析
4.3.5 エンハンサー・プロモーター相互作用推定
4.3.6 遺伝子制御ネットワークの構築
5.ゲノム三次元構造
5.1 階層的ゲノム構造
5.1.1 染色体テリトリー
5.1.2 コンパートメント
5.1.3 TAD
5.1.4 クロマチンループ
5.1.5 ストライプ
5.1.6 その他のゲノム構造
5.1.7 その他の生物種のゲノム構造
5.2 ゲノム立体構造解析の原理
5.2.1 立体構造解析の流れ
5.2.2 立体構造解析で得られるリード分布
5.3 種々の立体構造解析手法
5.3.1 全ゲノム相互作用の網羅的解析(Hi-C,Micro-C)
5.3.2 ゲノム領域を制限した網羅的解析(Capture-C)
5.3.3 特定のタンパク質を介した立体相互作用の抽出(ChIA-PET,HiChIP)
5.3.4 多点間相互作用検出
5.4 Hi-C解析の流れ
5.4.1 コンタクト行列の計算
5.4.2 コンタクト行列の正規化
5.4.3 コンタクト距離の分布
5.4.4 コンパートメント検出
5.4.5 コンパートメント強度
5.4.6 TAD検出
5.4.7 Arrowhead
5.4.8 インシュレーションスコア
5.4.9 Directionality index
5.4.10 ループ検出
5.4.11 ChIA-PETでのループ検出
5.4.12 ピーク集計分析
5.4.13 その他の解析手法
5.4.14 アリル特異的解析
5.5 確率的立体構造
5.5.1 ゲノム立体構造の確率的ばらつき
5.5.2 ループ押し出しモデル
5.5.3 三次元構造モデリング
6.エピゲノムデータベースと大規模解析
6.1 エピゲノムデータベース
6.1.1 論文公開のためのデータアーカイブ
6.1.2 種々のエピゲノムデータベース
6.1.3 ヒストン修飾データベース
6.1.4 転写因子結合領域データベース
6.1.5 三次元構造データベース
6.1.6 エピゲノムデータベースの注意点
6.2 多サンプルを用いた大規模解析
6.2.1 文脈特異的な転写因子相互作用の同定
6.2.2 クロマチン状態アノテーション
6.2.3 BED12形式
6.3 機械学習を用いた予測モデル
6.3.1 遺伝子発現予測
6.3.2 エンハンサー・プロモーター相互作用予測
6.3.3 全ゲノム相互作用予測
6.3.4 データ補完
引用・参考文献
索引
★特設サイトはこちらから★
シリーズ刊行のことば,シリーズラインアップ,著者一覧,目次がご覧いただけます