レビュー,書籍紹介・書評掲載情報

生物統計

バイオインフォマティクスシリーズ 3

生物統計

本書では,データサイエンスを活用した生命研究をするために必要な,統計科学の基礎を解説する。紹介する解析手法の多くに数式を用いた導出をつけ,読者が各手法の由来を理解したうえで使えるようになることを目指した。

発行年月日
2022/05/27
定価
4,180(本体3,800円+税)
ISBN
978-4-339-02733-4
在庫あり

レビュー,書籍紹介・書評掲載情報

amazonレビュー978-4-339-02733-4 生物統計

掲載日:2022/08/30

日本バイオインフォマティクス学会ホームページ

掲載日:2022/06/16

読者モニターレビュー【 N/M 様(ご専門:総合情報学(情報科学))】

掲載日:2022/05/25

本書は,バイオインフォマティクスシリーズの3シリーズ目の書籍であり,「(応用)統計学」の中でも特に「生物統計」という分野についての記述がなされている.

私自身,統計学・確率論等の基礎を身に着けたいという理由から本レビュ企画に応募したが,最初に読む書籍としては,難解であったのが正直な感想である.まずは,統計学・確率論のイメージが掴める基礎的な別の書籍で1章〜5章ぐらいの内容をしっかりとイメージを付けてから,本書にチャレンジする方がいいのでは,とまずは思った次第である.

先ほど述べたように,私自身,統計学・確率論,その他数学的な知識はほぼない(情報科学の分野を学ぶ際に,条件付き確率,相関係数等の統計学・確率論の用語を見聞きした程度)に等しい状態であるのと,生物学の分野ということで,専門からもかなりかけ離れているため,詳細なレビュは困難なことを先にお断りしておく.その上で,気になった点や内容の概略を中心に紹介していく形を取っていく.

本書を読むにあたり,ほぼすべての箇所で数式による導出が基本となっているので,数式に苦手意識のあるレビュしている私のような方は少し注意が必要であるが,最初のうちは数式の導出過程も大事だが,各種紹介されている統計解析手法を理解することから始めてみてはどうだろうか(後で別の書籍で数学をしっかり学習して,数理的な意味合いを理解する努力は必要だが・・・).

内容としては,統計解析の目的から始まり,ベルヌーイ分布,二項分布等の各種確率分布,大数の法則,中心極限定理,仮説検定,マルコフ過程,ポアソン過程等の統計・確率分野でよく聞く各種用語が,かなり詳しく取り上げられている.

8章〜13章では,実際に解析する際の概念を詳しく取り上げているだけではなく,プログラム風の疑似コードを用いて,アルゴリズム(算法;ある問題に対して,正解を引き出すための一定の手続きまたは思考方法)としても解説されている.これをベースにデータ解析が得意なプログラミング言語(PythonやR言語等)にアルゴリズムを落とし込むことで,データ解析が容易にできるのではないだろうか(もしかすると既に,実装されている言語もあるかもしれない).

ところで,本書の著者の所属先をよく見てみると,早稲田大学,東京大学の教授をされている方々ということが,一番驚かされた次第である.東京大学の講義「生物統計論」がベースになっているみたいなので,高偏差値の大学の講義とはこういった難易度であるということも,本書を通じて垣間見ることができたのも興味深かった.

最後に,内容が定着するような演習問題のようなものも数問あれば,より理解がより深まるようにも思えた.また,引用・参考文献には統計学の基本的な書籍の紹介もあると便利だとも思った.本書を超える内容で,興味のある分野については,更に深く調べてみると面白いだろう.特に,バイオインフォマティクスシリーズの別の書籍等で学ぶことにより,本書で取り上げられたテーマを深く学ぶことができるだろうと思われる.

読者モニターレビュー【 tom 様(ご専門:生命医科学・分子遺伝学)】

掲載日:2022/05/19

当書は特にオミクス解析で頻繁に用いられる統計的解析手法の数理学的背景を、数式を用いて導出し詳説している。内容を読み解くにあたって、微積分学や線形代数学の知識が必須である。前半部では確率論の基礎と確率分布の具体例、大数の法則と中心極限定理から始まり(1〜3章)、仮説検定と具体例及び多重検定補正を扱っている。
例えばゲノムワイド関連解析(GWAS)ではp値を用いてSNPの統計的有意性を判断するが、当書の4〜6章を読み進めることで、GWASで用いられる仮説検定や多重検定補正が何を行っているかを理解することができる。後半部(7章〜)からは確率モデル解析の概念を詳説し、さらに疑似コードを用いて、確率分布からランダムサンプリングするアルゴリズムを解説している。内容は高度なものであるが、生命ビッグデータを用いて確率モデルを実装するなどの解析をする際には必須となる理論を網羅している。コンパクトにまとまっているが、読み応えのある一冊である。