シリーズ情報科学における確率モデル 6 確率システムにおける制御理論

シリーズ情報科学における確率モデル 6

確率システムにおける制御理論

向谷博明広島大教授博士（工学）著

確率微分方程式に支配される確率システムを基盤とした電気・機械・プロセスシステムにおけるシステム理論、動的ゲームへの応用を解説

ジャンル

発行年月日: 2019/07/03

判型: A5

ページ数: 270ページ

ISBN: 978-4-339-02836-2

在庫あり

2営業日以内に出荷致します。

定価

4,290円(本体3,900円+税)

カートに入れる

購入案内

内容紹介
まえがき
目次
レビュー
著者紹介
広告掲載情報

【読者対象】
確率システムを基盤とした動的ゲーム問題，および関連する数値計算について，基礎から応用まで幅広く学びたい大学院生・研究者を読者の対象としています。また，システム理論を軸として，実際の現場で活躍されている開発者も含まれます。特に，確率制御を含む動的ゲーム理論を将来的に応用してみたい技術者も対象にしています。

【書籍の特徴】
現在に至るまで，ダイナミクスを伴わない静的ゲームに関しては，多数の良書が存在します。一方，ダイナミクスを前提とした動的ゲームに関する書籍は，洋書では，多数の良書があるにもかかわらず，著者が知る限り，和書では中々見当たらないのが実情です。そこで，本書では，確率システムを基盤とした電気・機械・プロセスシステムにおけるシステム理論および動的ゲームへの応用について述べています。本書の前半部分では，確率システムにおける基礎となる内容から，システム理論の基盤に到るまで，広範囲に記述しています。一方，後半では，動的ゲーム理論についての結果や実装方法，関連する事例等を平易に記述しています。

【各章について】
1章では，今後，必要となる数学の基礎的内容について説明を行います。さらに，関連する表記法についても説明を行います。内容に関しては，最適化手法を重点に説明を行います。また，最適解を得るために必要な数値計算法について触れ，その後，システムの安定性から始まり，システム制御理論ではおなじみの最適レギュレータ問題に関して，考察を行います。特に，最大原理や動的計画法による解法について説明を行います。また，近年のシステム制御理論の成果として重要なH_∞制御理論や線形行列不等式(LMI)について触れます。
2章では，まず，連続時間における確率過程であるウィナー過程に対して，ブラウン運動を定義し，その性質について解説します。特に，確率微分方程式や関連する伊藤の公式，無限小生成作用素について，簡易な証明を含め解説します。さらに，実際の確率システムの応用についても述べます。その後，マルコフ過程においては，マルコフジャンプ確率システムについて述べます。
3章では，初めに連続時間確率システムに対して，基本的な結果である確率システムにおける可制御性，可観測性に関して議論を行い，その後，最適レギュレータ問題として良く知られる最適制御に関する結果を与えます．また離散時間システムに対しても，同様な結果を与えます。
4章では，確率リカッチ代数方程式に見られる確率非線形行列方程式を解くための数値計算アルゴリズムについて言及します。初めに，確定システムに見られるリカッチ方程式に対して，シュール法，クラインマンアルゴリズムとして知られるニュートン法を基盤とした手法を中心に，アルゴリズムや収束に関する性質について述べます．その他，再急降下法によるアルゴリズム，座標降下法によるアルゴリズムによるもの等，代表的なアルゴリズムについて考察を行います。
5章では，物理モデルのシステムパラメータが劇的に変化する，あるいは不規則なモード遷移を伴うシステムを扱う手法として良く利用される連続時間・離散時間マルコフジャンプシステムにおける安定化や最適制御問題について考察を行います。特に，線形行列不等式理論に基づく安定性から安定化，最適制御に到るまで，最新の結果について詳細を説明します。
6章では，伊藤の確率微分方程式に基づく非線形確率システムにおける様々な制御問題を対象に，制御則を得るために必要な確率ハミルトン・ヤコビ・ベルマン方程式の導出，および数値解法を中心に考えます。また，4ステップスキームとよばれる数値計算法や，確定ハミルトン・ヤコビ・ベルマン方程式の数値解法に由来するアルゴリズムに関して，解説を行います。
最後の7章では，確率システムにおけるパレート最適戦略，ナッシュ均衡戦略，スタッケルベルグ戦略を考察します。特に，システム理論との関連，および不確定要素や環境変動に対してロバスト性を達成するための現在までの取り組みや成果について，基礎的事項も含め紹介します。その他，解析手法としての動的ゲーム理論や，不確定要素や環境変動をどのように解釈・表現すれば戦略の存在条件が定式化できるかを中心に述べます。

【著者からのメッセージ】
近年，原子力エネルギーから再生可能エネルギーへのシフトでは，ウィンドファームでの風車の配置問題，あるいは，それらの電力を利用したピークシフト・ピークカット問題等が知られています。さらには，複数ドローンに見られる協調制御等，動的ゲーム理論が大いに活躍できる諸問題が多く存在します。本書では，このようは現実問題を解くためのヒント，あるいは道具となる結果を網羅しています。この本によって，少しでもこの分野に興味を抱く研究者が増え，活性化することを願ってやみません。

自然システムにおける物理現象を数学の表記法に従って記述する場合，常微分方程式が利用される。場合によっては，化学プロセスのように，時間と空間によって現在の状態を記述するときには，偏微分方程式が利用される。これらの数理モデルは，ハミルトンの原理「始点と終点の二つの定点を運動する経路は，ラグランジアン，すなわち運動エネルギーとポテンシャルエネルギーの差の時間積分の最小値」として与えられる。実際，解析力学で見られるこの結果を利用して，マニピュレータなどの運動方程式が得られることはよく知られている。あるいは，数理モデルが具体的に得られない場合，統計的手法を基盤としたシステム同定によって，次数とパラメータが決定される。近年では，コンピュータおよびインターネットの発達に伴って，ビッグデータの採取や大規模計算が容易にかつ高速に行われるようになり，複雑な数理モデルを求めることが容易となった。その結果，プロトタイプを作る前に，シミュレーションを行うことによって，ものづくりの期間短縮に貢献していることは周知の事実である。

数学を基盤としたシステム理論の始まりとして，常微分方程式によって支配される確定システムにおけるラウス・フルビッツやナイキストの安定判別に代表される1950年代に現れた古典制御理論が挙げられる。その後，比例・積分・微分の三つのパラメータを操作することによって制御則を決定するPID制御が確立された。PID制御に至っては，現在でもその不動の地位を保っており，ありとあらゆる電気・機械・プロセスシステムで利用されている。1960年代には，旧ソ連の有人月旅行計画や，アメリカのアポロ計画にみられるように，宇宙船の制御にシステム理論は多大な貢献をなした。具体的には，最大原理を応用した最短時間制御，あるいは，カルマンの提案した状態空間法に基づく時間領域の二次形式評価関数を最小にする最適レギュレータ問題が盛んに研究され，応用された。さらには，カルマンフィルタに見られるように，必要な信号からノイズを除去する手法が確立された。1980年代に入ると，最悪外乱を抑えるH∞ノルムを評価基準としたH∞制御が開発され，車両のセミアクティブサスペンション技術に応用された。近年では，伊藤の確率微分方程式による拡張や，マルコフ過程を導入した新たな確率システム論が研究されるなど，システム理論の発展は，枚挙にいとまがない。

本書では，伊藤の確率微分方程式によって支配される確率システムを基盤とした電気・機械・プロセスシステムにおけるシステム理論および動的ゲーム理論への応用について述べる。本書を読み進めるにあたり，線形代数学，微分積分学，微分方程式，最適化は既習であることを前提にしている。本書の前半部分では，確率システムにおける基礎となる内容から，システム理論の基盤に至るまで，広範囲に記述している。特に，1章および2章に限っては，既習である場合，読み飛ばしてもなんら問題は生じないと思われる。後半では，動的ゲーム理論についての結果や関連する証明などを記述している。現在に至るまで，ダイナミクスを伴わない静的ゲーム理論に関しては，多数の良書が存在する。一方，ダイナミクスを前提とした動的ゲーム理論に関する書籍は，洋書では，多数の良書があるにもかかわらず，著者が知る限り，和書ではなかなか見当たらない。近年，原子力エネルギーから再生可能エネルギーへのシフトでは，ウィンドファームでの風車の配置問題，あるいは，それらの電力を利用したピークシフト・ピークカット問題などが知られている。さらには，複数ドローンに見られる協調制御など，動的ゲーム理論が大いに活躍できる諸問題が多く存在する。本書では，線形・非線形確率システムに対して，協力ゲームにおけるパレート最適戦略から始まり，非協力ゲームの代表であるナッシュ均衡戦略，階層戦略を構成する非協力スタッケルベルグ均衡戦略について記述している。また，H∞制御問題を定式化できるサドルポイント均衡など，おもなゲーム問題を確率システムを基盤として論じている。通常，これらの戦略を得るためには，連立型確率リカッチ代数方程式や，非線形システムでは，ハミルトン・ヤコビ・ベルマン方程式で有名な偏微分方程式を解く必要がある。本書では，それらの解法についても詳細を述べている。さらに，MATLABを利用したシミュレーションも行っている。MATLABにはさまざまなTool Boxが存在し，制御系設計を容易にし，かつ，Simulinkによって，視覚的に設計することが可能となる。

最後に，前半は，偉大な先人による確率システムに関する良書があるにもかかわらず，薄学な著者による記述をお許しいただきたい。動的ゲーム理論に関しては，詳細な証明は記述できなかったが，概念を理解するには十分と考える。本書によって，動的ゲーム問題が，実際の社会問題を解決する一つの手段として利用されることを願ってやまない。また，本書を作成するにあたり，川上恭平氏には，証明の確認や原稿の校閲を行っていただいた。ここに改めて謝辞を述べさせていただく。

2019年5月向谷博明　

1.　数学的準備
1.1　ベクトル・行列の性質
1.2　二次形式と微分
1.3　行列の微分
1.4　最適化
　1.4.1　ラグランジュの未定乗数法
　1.4.2　カルーシュ・クーン・タッカー（KKT）条件
　1.4.3　ニュートン法
　1.4.4　勾配法
1.5　リアプノフ安定論
1.6　最適レギュレータ
　1.6.1　最大原理による導出
　1.6.2　動的計画法による導出
1.7　リアプノフ代数方程式
1.8　H_∞制御
　1.8.1　H_∞ノルム
　1.8.2　H_∞制御問題の一般解
1.9　線形行列不等式：LMI
1.10　まとめ

2.　確率過程論
2.1　確率過程
　2.1.1　ウィナー過程
　2.1.2　ブラウン運動の性質
　2.1.3　確率微分方程式
　2.1.4　確率微分方程式によるモデル表現
　2.1.5　伊藤の公式
　2.1.6　例題
2.2　確率システムの安定性
2.3　シミュレーション技法
　2.3.1　ブラウン運動のシミュレーション
　2.3.2　オイラー・丸山近似
2.4　まとめ

3.　連続・離散時間線形確率システム
3.1　連続時間線形確率システム
　3.1.1　連続時間線形確率リアプノフ代数方程式
　3.1.2　連続時間線形確率システムの最適レギュレータ問題
3.2　離散時間線形確率システム
　3.2.1　離散時間線形確率リアプノフ代数方程式
　3.2.2　安定化
　3.2.3　離散時間線形確率システムの最適レギュレータ問題
3.3　まとめ

4.　数値計算アルゴリズム
4.1　リカッチ代数方程式
4.2　確率リカッチ代数方程式
　4.2.1　ニュートン法による数値計算アルゴリズム
　4.2.2　LMIによる数値計算アルゴリズム
　4.2.3　数値例
4.3　連立型確率リカッチ代数方程式
　4.3.1　ニュートン法による数値計算アルゴリズム
　4.3.2　リアプノフ代数方程式による数値計算アルゴリズム
　4.3.3　座標降下法による数値計算アルゴリズム
4.4　離散型マルコフジャンプ確率システムに関する数値計算アルゴリズム
4.5　まとめ

5.　マルコフジャンプ確率システム
5.1　連続時間マルコフジャンプ確率システムの安定化
　5.1.1　事前結果ならびに準備
　5.1.2　主要結果
　5.1.3　モード非依存型制御
5.2　連続時間マルコフジャンプ確率システムの最適レギュレータ問題
　5.2.1　事前結果ならびに準備
　5.2.2　主要結果
5.3　離散時間マルコフジャンプ確率システムの安定化
　5.3.1　事前結果ならびに準備
　5.3.2　主要結果
5.4　離散時間マルコフジャンプ確率システムの最適レギュレータ問題
　5.4.1　事前結果ならびに準備
　5.4.2　主要結果
5.5　まとめ

6.　非線形確率システム
6.1　安定性
6.2　最適レギュレータ問題
　6.2.1　有限時間の場合
　6.2.2　無限時間の場合
6.3　H_∞制御
　6.3.1　非線形確率有界実補題
　6.3.2　非線形確率システムにおけるH∞制御
6.4　数値解法
　6.4.1　逐次近似法
　6.4.2　ガラーキン・スペクトル法
　6.4.3　チェビシェフ多項式の導入
6.5　まとめ

7.　動的ゲーム理論への応用
7.1　パレート最適戦略
　7.1.1　確率パレート最適戦略
　7.1.2　確率パレート最適戦略の解
7.2　ナッシュ均衡戦略
　7.2.1　混合H_2/H_∞制御問題
　7.2.2　確率ナッシュ均衡戦略
　7.2.3　マルコフジャンプ確率システムにおけるナッシュ均衡戦略
　7.2.4　ナッシュ均衡戦略対が存在するための必要十分条件
　7.2.5　ニュートン法
　7.2.6　非線形確率ナッシュ均衡戦略
7.3　スタッケルベルグ均衡戦略
　7.3.1　スタッケルベルグ均衡戦略問題
　7.3.2　主要結果
　7.3.3　数値計算アルゴリズム
　7.3.4　数値例
7.4　min-max戦略：サドルポイント均衡
　7.4.1　弱拘束確率ナッシュ均衡戦略問題
　7.4.2　主要結果
7.5　まとめ

引用・参考文献
索引

読者モニターレビュー【K.O.様（所属:機械メーカ・研究職，専門:制御工学）】

本書籍は、確率で表記されるダイナミクスを持つシステムに対して、制御理論の適用手法について解説された本となります。
特に、制御工学の立場から話が展開されており、現代制御理論を勉強した人が確率システムの制御とはどのようなものか、雰囲気を知るために適していると感じました。また、各章末の問題は記載されていませんが、文章内に数値例が紹介されているため、必要に応じて、自分でプログラムを組みながら読み進めることで、より理解を深めることができると感じました。

M.K.様（大学院・航空宇宙システム制御専攻）

この本は，厳密な証明や解説は他書に譲り，確率システムと制御に関する要点の証明・最新の研究動向の紹介があるような，いわゆる橋渡しとなるテキストのように感じました。
前書きに"ダイナミクスを前提とした動的ゲーム理論に関する書籍は(中略)，和書ではなかなか見当たらない"とある通り，和書には珍しい動的ゲーム理論が紹介される点で特に他書と差別化しているようです。
比較的行間が広いため，参考文献に挙げられているテキストを随時参照しながら，この本の行間を埋めていくようなセミナー等に適すると思われます(※)。特に現代制御論・確率解析のいずれかに関する基礎知識を持つ方は，この本で確率システムの制御理論を概観することができると思われます。
個人的には，リカッチ代数方程式とシュール分解について詳しく書かれている点(第4章)，非線型確率システムの H∞ 制御について書かれている点(第6章)，また各章のまとめで辿った道筋と応用先を明確に示している点が良いと感じました。
(※) より行間が狭く書かれた確率システムの入門書としては，本書でも随所に引用されている「大住晃:確率システム入門(システム制御情報ライブラリー), 朝倉書店(2002)」が挙げられます。こちらではカルマンフィルタについても取り挙げられています。

レビュー,書籍紹介・書評掲載情報一覧