生物ネットワーク解析
生物ネットワーク解析の基礎から応用までを,具体的な事例を交えながら解説
- 発行年月日
- 2021/11/15
- 判型
- A5
- ページ数
- 222ページ
- ISBN
- 978-4-339-02732-7
- 内容紹介
- まえがき
- 目次
- レビュー
- 書籍紹介・書評掲載情報
- 広告掲載情報
種々の生命現象や生態系の動態を理解するためには、様々な生体分子、生物そして環境がどのように相互作用しているのか、つまりネットワークを明らかにすることが重要である。いまや、バイオインフォマティクスやシステムバイオロジーの分野において、生物ネットワーク解析はなくてはならない存在になったといえるだろう。その一方で、生物ネットワーク解析は確かによく目にするものの、実際に何をしているのか、あるいは結果が何を意味しているのかよくわからない、という声も多く聞く。本書では、そのような生物ネットワーク解析の基礎から応用までをいくつかの具体的な事例を交えながら説明する。
本書は、学部生および大学院生、ならびにバイオインフォマティクスやシステムバイオロジーの分野に関わる技術者や研究者を読者として想定しており、学部生をはじめとする初学者でも無理なく読めるように配慮している。1章では生物ネットワーク解析を学ぶ上での基礎事項を説明し、2章ではネットワーク解析で頻出する基本的な指標、3章ではネットワーク解析の理論の中心をなすいくつかの代表的なネットワークモデルについて説明する。そして、4章から7章にかけて、代表的な生物ネットワーク解析を紹介する。具体的に、4章ではネットワークにおける重要なノードを順位づけするために用いられる中心性解析、5章ではネットワークを制御するための重要なノードを見つけるために用いられるネットワーク可制御性解析、6章ではネットワークをクラスタリングするために用いられるコミュニティ検出、そして7章ではオミクスデータから生物ネットワークを推定するために用いられる相関ネットワーク解析について、それぞれ説明する。
これらの内容については実際の生物ネットワーク解析を体験することで、より理解を深めることができるだろう。本書で紹介した手法や解析などの一部は、統計解析ソフトウェアRとそのネットワーク解析用パッケージのigraphを用いることで体験することができる。コードは https://github.com/kztakemoto/network-analysis-in-biologyで利用可能である。実際の生物ネットワーク解析や新規手法の開発に役立ててもらえれば幸いである。
生物における種々の生命現象や病気の発症などは,遺伝子,タンパク質,代謝化合物のような,さまざまな生体分子の複雑な相互作用の結果として起きている。また,生物はほかの生物や環境と複雑に相互作用することで生態系をなしている。種々の生命現象や生態系の動態を理解するためには,さまざまな生体分子,生物,そして環境がどのように相互作用しているのか,つまりネットワークを明らかにすることが重要になる。近年の計測技術やそれに関連する情報解析技術の発展から,さまざまな生体分子の相互作用を網羅的に同定することができるようになってくると,このような複雑な生物ネットワークを解析し,理解することがバイオインフォマティクスやシステムバイオロジーにおける中心課題の一つになっていった。いまや,生物ネットワーク解析はこれらの分野において,なくてはならない存在になったといえるだろう。その一方で,生物ネットワーク解析は確かによく目にするものの,実際になにをしているのか,あるいは結果がなにを意味しているのかよくわからない,という声も多く聞く。
そこで本書では,そのような生物ネットワーク解析の基礎から応用までをいくつかの具体的な事例を交えながら説明する。ネットワーク解析に関する良書は近年多くなってきているものの,歴史的な経緯や分野の違いもあり,それらは生物学分野から見た場合,必ずしもわかりやすいものでなかったり,スコープがあまり一致していないように感じられたりすることがままあるようである。本書の執筆にあたってはそのようなギャップを埋めることも強く意識した。
本書は,学部生および大学院生,ならびにバイオインフォマティクスやシステムバイオロジーの分野に関わる技術者や研究者を読者として想定している。学部生をはじめとする初学者でも無理なく読めるように,第1章では生物ネットワーク解析を学ぶ上での基礎事項を説明している。もちろん冗長だと思われる読者は読み飛ばしていただいて構わない。第2章ではネットワーク解析で頻出する基本的な指標について紹介し,第3章ではネットワーク解析の理論の中心をなすいくつかの代表的なネットワークモデルについて説明する。そして,第4章から第7章にかけて,代表的な生物ネットワーク解析について説明する。具体的に,第4章ではネットワークにおける重要なノードを順位づけするために用いられる中心性解析,第5章ではネットワークを制御するための重要なノードを見つけるために用いられるネットワーク可制御性解析,第6章ではネットワークをクラスタリングするために用いられるコミュニティ検出,そして第7章ではオミクスデータから生物ネットワークを推定するために用いられる相関ネットワーク解析について,それぞれ説明する。
これらの内容については,実際の生物ネットワーク解析を体験することで,より理解を深めることができるだろう。本書で紹介した手法や解析などの一部は,統計解析ソフトウェアRとそのネットワーク解析用パッケージのigraphを用いることで体験することができる。コードはhttps://github.com/kztakemoto/network-analysis-in-biologyで利用可能である。実際の生物ネットワーク解析や新規手法の開発に役立てていただければ幸いである。
早稲田大学理工学術院の浜田道昭先生には本書を執筆する貴重な機会を与えていただいた。また,浜田先生と京都大学化学研究所バイオインフォマティクスセンターの阿久津達也先生には,ご多忙にもかかわらず原稿を丁寧に確認していただき,学問分野全体の大局的な視点そして個々の専門的な視点から数々の有用なご指摘をいただいた。九州工業大学大学院情報工学府の千代丸勝美氏には,学生の視点からの読みやすさについて丁寧に確認していただき,多くの指摘をいただいた。ここに感謝の意を表したい。最後に,本書の出版元であるコロナ社の方々に心から感謝申し上げたい。
2021年9月
竹本和広
1. 生物ネットワーク解析の基礎
1.1 なぜ生物ネットワーク解析か
1.1.1 生物学における多様な役者たち
1.1.2 システム的理解とネットワーク科学
1.2 ネットワーク解析の準備
1.2.1 ネットワークの基礎
1.2.2 ネットワークの種類
1.2.3 行列表現
1.2.4 経路と閉路
1.2.5 部分ネットワーク
1.2.6 連結性と連結成分
1.3 さまざまな生物ネットワーク
1.3.1 遺伝子制御ネットワーク
1.3.2 タンパク質構造ネットワーク
1.3.3 タンパク質相互作用ネットワーク
1.3.4 代謝ネットワーク
1.3.5 脳ネットワーク
1.3.6 生態系ネットワーク
1.3.7 疾病や創薬に関連するネットワーク
2. 基本的なネットワーク指標
2.1 次数
2.1.1 無向ネットワークの場合
2.1.2 有向ネットワークの場合
2.1.3 重み付きネットワークの場合
2.1.4 次数分布
2.1.5 スケールフリー性
2.2 次数相関
2.2.1 同類度係数
2.2.2 同類度係数の拡張版
2.3 クラスタ係数
2.3.1 各ノードに対するクラスタ係数
2.3.2 平均クラスタ係数
2.3.3 重み付きクラスタ係数
2.4 最短経路長
2.4.1 平均最短経路長
2.4.2 大域効率性
3. ネットワークモデル
3.1 Erdos-Renyiのランダムネットワークモデル
3.1.1 Erdos-Renyiモデル
3.1.2 次数分布
3.1.3 平均最短経路長
3.1.4 クラスタ係数
3.1.5 現実のネットワークとの比較
3.2 格子ネットワーク
3.2.1 格子ネットワークとは
3.2.2 平均クラスタ係数
3.2.3 平均最短経路長
3.3 Watts-Strogatzのスモールワールドネットワークモデル
3.4 Barabasi-Albertのスケールフリーネットワークモデルとその改良版
3.4.1 Barabasi-Albertモデルとそのネットワークの性質
3.4.2 Barabasi-Albertモデルの改良版
3.4.3 優先接続の検証
3.4.4 優先接続の解釈
3.5 Chung-Luモデル
3.6 コンフィギュレーションモデル
3.7 ランダム化ネットワーク
3.8 ネットワーク指標の統計的有意性評価
3.8.1 Z検定に基づく評価
3.8.2 経験的p値に基づく評価
3.8.3 比に基づく評価
3.8.4 ランダムネットワークとの比較の妥当性
4. 中心性解析
4.1 中心性解析とは
4.2 次数中心性
4.3 固有ベクトル中心性
4.4 PageRank
4.5 近接中心性とその別形
4.5.1 近接中心性
4.5.2 点効率性
4.6 媒介中心性
4.7 そのほかの中心性指標
4.7.1 カッツ中心性
4.7.2 サブグラフ中心性
4.8 統計解析や機械学習における中心性
5. ネットワーク可制御性解析
5.1 可制御性
5.2 構造可制御性
5.3 最大マッチングに基づくドライバ・ノードの求め方
5.4 最小支配集合に基づくドライバ・ノードの求め方
5.5 ネットワーク可制御性に基づくノード分類
6. コミュニティ検出
6.1 コミュニティ検出とは
6.2 ノード間の類似度に基づくコミュニティ検出
6.2.1 階層的クラスタリング
6.2.2 構造的重複度に基づくクラスタリング
6.2.3 そのほかの類似度に基づくクラスタリング
6.3 モジュラリティに基づくコミュニティ検出
6.3.1 モジュラリティ
6.3.2 重み付きネットワークや有向ネットワークにおけるモジュラリティ
6.3.3 モジュラリティ最大化問題としてのコミュニティ検出
6.3.4 ネットワーク間でのモジュラリティの比較
6.3.5 モジュラリティ最大化に基づくコミュニティ検出の限界
6.3.6 そのほかのコミュニティ分割指標
6.4 機能地図作成
6.5 コミュニティの重複を考慮する場合
6.5.1 エッジ間の構造的重複度に基づく手法
6.5.2 モジュラリティ最大化に基づく手法
7. 相関ネットワーク解析
7.1 相関ネットワーク解析とは
7.2 相関ネットワーク解析の基本
7.3 相関ネットワークの閾値化
7.3.1 p値による閾値化
7.3.2 相関係数による閾値化
7.4 重み付き相関ネットワーク解析
7.5 偏相関ネットワーク解析
7.5.1 偏相関ネットワーク解析の基本
7.5.2 偏相関と多重回帰
7.5.3 偏相関ネットワーク解析の限界
7.5.4 正則化付き偏相関ネットワーク解析
7.6 相対量を考える場合
7.6.1 オミクスデータにおける相対量
7.6.2 定数和制約による見せかけの相関
7.6.3 対数比変換
7.6.4 相対量データに対する相関ネットワーク解析
7.6.5 相対量データに対する偏相関ネットワーク解析
7.7 相関ネットワークの比較
7.8 相関ネットワーク解析は「なに」を推定しているのか
引用・参考文献
索引
読者モニターレビュー【 渡辺 諭史 様 株式会社サイキンソー(ご専門:腸内細菌)
生態学の研究者にとって、種間ネットワーク解析とそれにより得られる種数、メタ群集の推定は重要な研究課題である。
しかしながら、生物ネットワーク解析に関する国内の書籍は未だ少なく、外国文献から情報を仕入れているのが現状であった。
本書は、生態学者が種間相互作用、メタ群集を推定、計算するために必要な生物ネットワーク解析に関する指標や、代表的な統計モデルの解説が丁寧になされている。
特に、これまで理解が難しかった、相関ネットワーク分析の章において、生物種の区別を必要とするメタ群集を扱う際の問題点を詳細に解説している点は、他の類似書籍とは一線を画する章である。
生態学モデリングを行う研究者には是非とも手にとって読んで欲しい一冊である。
具体的な解析手法は、github上のsource code側に預けられており、プログラミング言語を用いたデータ解析に慣れていない読者には、ややとっつきにくいかもしれない。
続刊もしくは別冊などで、具体的な解析フローを、コードの解説も加えて追記してもらえると有り難い。
読者モニターレビュー【 中西 瑛太 様 東京大学大学院生(ご専門:ゲノミクス)】
目次を眺めると他のネットワーク科学の書籍と共通する項目が多い。しかし、実際の内容はネットワーク科学の基礎理論を押さえつつ、生物学分野における研究事例や深層学習などの話題も挙げられており、書籍名の通り生物ネットワーク解析に特化したユニークな入門書である。本書の中でも特に、ドライバ・ノード(必須遺伝子や疾病関連遺伝子など)を求めるネットワーク可制御性解析は、オミクスデータの解釈性を高めたり、生命の複雑系を理解したりするために、生物学分野の研究者にとって非常に有効な手法であると感じた。本書全体を通して、わかりやすく端的にそれぞれの指標の特徴や解析手法の限界などが挙げられている点も、解析を行うときの指標・手法の選択に役立つだろう。また、GitHubのコードは、Rの導入から全章の生物ネットワーク解析の手法が丁寧に説明されているので、プログラミング初学者でも実践へステップアップできる構成になっている。生物ネットワーク解析の基礎を押さえることができたり、書籍・GitHub中の豊富な参考文献から知識の幅の広がりが期待できたりする点で、初学者の1冊目として最適だと思う。
読者モニターレビュー【 日置 恭史郎 様 国立環境研究所(ご専門:環境・生物)】
本書は、ネットワーク解析とその生物分野への応用について、体系的に書かれた書籍です。そもそも生物ネットワークとは何かという導入から(1章)、ネットワークの基礎的な考え方やモデル(2~3章)、より実践的ネットワークの解析法あるいは推定法(4~7章)まで、基礎から応用まで幅広く扱っています。
このような題材の書籍にありがちな、数式ばかりで理解できないということは決してなく、私のようなインフォマティクスの門外漢にも分かりやすく平易に書かれています。個々のトピックの記述は割とあっさりなので、例えば数学的な性質などを深く知りたい方には物足りないかもしれません。ただ、文献は豊富に引用されているので(333本)、分野全体を外観する入門書としては適当だと思います。
またありがちな、実践に偏重しすぎてコードを動かすだけで満足してしまうということもありませんが、著者のGitHubページには本書を追体験できる解析用Rコードが公開されています。練習用のデータも多数紹介されており、GitHubページだけでも実践的な力はつけられそうです。
以上のように本書は、理論の理解と実践技能の習得とのバランスがとれた良質な入門書です。
読者モニターレビュー【 小杉 孝嗣 様 東京工業大学(ご専門:バイオインフォマティクス・ケモインフォマティクス)】
本書は、基礎から実践的な応用事例まで幅広く取り扱っている。基礎的な内容として、遺伝子制御ネットワークやタンパク質相互作用ネットワークの様な生物ネットワークの実例からネットワーク解析の次数やクラスター係数といった基礎、ネットワーク解析でよく用いられるモデルの説明から始まる。ネットワーク構造から算出される指標である、構造的中心性指標の適用事例としてWebでよく用いられるPageRankが代謝反応ネットワーク解析に応用された例は非常に興味深い。また、中心性と機械学習についての言及もあるため、機械学習に分子グラフのようなネットワークの概念を取り入れたい方も参考になると考えられる。可制御性解析を用いた、疾患関連遺伝子の推定や薬剤標的分子の推定するためのドライバーノードの解析方法はとても実践的と感じた。また全ての章において、Rmdと結果のHTMLが公開されており、すぐ実践できるのも魅力である。このことから、本書は、バイオインフォマティクスやシステムバイオロジーの分野において、ネットワーク解析を「体系的」・「実践的」に学びたい初学者・中級者向けの書籍である。
読者モニターレビュー【 稲毛 純 様 東京医科歯科大学(ご専門:バイオインフォマティクス)】
トランスクリプトームなどの大規模データを用いた研究をされた経験がある方は、遺伝子間の相互作用を視覚化したり、重要な遺伝子を特定したりするために、ネットワーク解析をしてみたいと考えたことがある人は少なくないと思う。一方で、ネットワーク解析に関する参考書は、前提とする線形代数の知識など、(私のような)大学数学をバックグランドとしてもたないものには理解が難しい本が多く、一通り読み終わる前に途中で挫折してしまった経験がある。本書は、そのような生物学の研究者にとって最適な構成になっている。まず、そもそもネットワークとはなにか、ということから丁寧に説明が始まる。その後、ネットワーク解析に用いる指標や、これまでの歴史も含めた代表的なモデルの紹介、実際の解析手法がわかりやすく説明されていく。高校レベルの数学知識に加えて、入門レベルの線形代数の知識があれば、この本を読み通すことはできるだろう。それぞれの話の途中にあるデータベースの紹介や、解析に使用するsource codeがgithubからダウンロードできるのも、知識から実践へ向かうためには非常にありがたい。是非とも、これからネットワーク解析を始めたいと考えている方は、本書を手にとって眺めていただきたい。
「生物の科学 遺伝」(2022年1月発行号(76-1)) 掲載日:2022/01/14
生物関連書籍の「新刊一覧」にてご掲載いただきました。
-
掲載日:2023/09/05
-
掲載日:2023/02/01
-
掲載日:2023/01/27
-
掲載日:2022/12/13
-
掲載日:2022/10/17
-
掲載日:2022/06/20
-
掲載日:2022/01/26
-
掲載日:2022/01/06
-
掲載日:2021/12/28
-
掲載日:2021/12/27
-
掲載日:2021/12/02
-
掲載日:2021/11/26
-
掲載日:2021/11/01
-
掲載日:2021/10/18
-
掲載日:2021/10/14
★特設サイトはこちらから★
シリーズ刊行のことば,シリーズラインアップ,著者一覧,目次がご覧いただけます