書名で キーワードで

詳細検索 >>

HOME > レビュー

レビュー

1 - 1件目を表示 <前ページ 1|次ページ>

Book Review

読者モニターレビュー【M.K.様(大学院・航空宇宙システム制御専攻)】

数理最適化,制御工学,強化学習の観点からマルコフ決定過程に興味があり,モニターに応募した。
本書は,オペレーションズ・リサーチ(OR)の研究者である著者が,主にORの例題を通してマルコフ決定過程という確率過程について解説する内容となっている。話題はマルコフ決定過程の基礎となっているBellmanの動的計画法から,近年話題となっている強化学習アルゴリズムにどのように応用されているかまで広く取り扱っているが,実装例のプログラムは含まれていないため,辞書のように利用することが想定される。
本書は重要な例題とその証明に紙面を多く割いており,複雑な式展開の場面では必ず一言説明が入る所が丁寧だと感じられた。ただ通読に大きな影響があるほどでもないが,数学の高度な知識が必要になる部分があり,特に4章の不動点定理の部分は難易度が高い。しかし理工系の大学3年程度の数学の知識があれば一部を除き通読可能だと感じられた。
欲を言えば3~6章のアルゴリズムのパートや,8章の強化学習への応用のパートに図解があればさらに理解が深まると思われたが,全体としては様々なマルコフ決定過程の考え方や導出方法を把握することに役に立つ本であると思われる。

シリーズ 情報科学における確率モデル 4

  マルコフ決定過程
-理論とアルゴリズム -

中出康一 名工大教授 博士(工学) 著

発行年月日:
2019/04/05
判 型:A5
ページ :202頁
ISBN:
978-4-339-02834-8
定 価: 3,132円
(本体2,900円+税5%)
1 - 1件目を表示 <前ページ 1|次ページ>