情報幾何学の初学者向け参考書とそのレビュー
情報幾何学を”非”数学者
が学習する上で参考になりそうな書籍についてレビューする。特に、ニューラルネットワークなどの統計的学習理論を勉強している物理系/情報系/工学系の人間が読む前提で考えている。書籍は日本語に限り、3冊ピックアップした。
※ここに記載されていない本は私が読んでいないだけで、読んだうえで本記事への掲載を取捨選択したわけではないことに注意をしていただきたい。紹介していない有用な参考文献も世の中にはまだまだあると思うし、もしおすすめがあればコメント欄から推薦してほしい。
紹介文献リスト
各書籍の目次比較
コンテンツとしてどのようなものが含まれているか、目次をもとに列挙する。あくまでコンテンツを確認することが目的なので、以下の箇条書きリストが目次と一致しているわけではない。
情報幾何の方法(甘利俊一・長岡浩司、岩波書店)
- 微分幾何の基礎知識
- 統計的モデルの幾何学的構造
- 統計的モデル
- Fisher情報行列とRiemann計量
- α-接続
- 双対接続の理論
- 統計的推論の微分幾何
- 統計的推論と指数型分布族
- 指数型分布族における統計的推論
- 曲指数型分布族における推論
- 推定の高次漸近理論
- 情報量の分解定理
- 検定の高次漸近理論
- 推定関数の理論とファイバーバンドル
- 局所指数族バンドル
- Hilbertバンドルと推定関数
- 時系列と線形システムの幾何
- システムと時系列の空間
- システム空間の計量と接続
- 有限次元モデルの幾何学
- 安定システムと安定フィードバック
- 多元情報理論と統計的推論
- 多元情報の統計的推論
- 0レートの検定理論
- 0レートの推定理論
- 一般の多元情報の推論問題
- 情報幾何のこれからの話題
情報幾何学の基礎(藤原彰夫、牧野書店)
- 準備
- Euclid平面の幾何
- Euclid空間
- 座標系
- 接ベクトル
- ベクトル場の微分
- 局面から多様体へ
- 多様体のアファイン接続
- 双対アファイン接続の幾何
- 双対アファイン接続
- 双対平坦な多様体の幾何
- 確率分布空間の幾何構造
- 統計物理学への応用
- 最大エントロピー原理
- 平均場近似
- 統計的推論への応用
- 統計的パラメータ推定
- 大偏差原理
- 統計的仮説検定
- 補足:Cramerの定理
- 量子状態空間の幾何構造
- 状態と測定
- 有限量子状態空間の双対構造
- 量子統計的パラメータ推定問題
- 補足:作用素単調関数
代数幾何と学習理論(渡辺澄夫、森北出版)
- 特異点
- 代数幾何
- 超関数
- 超関数論の基礎
- 超関数とゼータ関数
- メリン変換
- 漸近展開
- 一般形の漸近展開
- 経験過程
- 測度空間・確率空間
- 法則収束
- 関数空間に値をとる解析関数
- 経験過程
- 対数尤度比とカルバック情報量
- 学習理論
- 確率的複雑さの漸近挙動
- 汎化誤差の漸近挙動
- 学習係数
- 学習理論と諸科学
各書籍に対するコメント
情報幾何の方法(甘利俊一・長岡浩司、岩波書店)
この分野の先駆者、甘利先生が書かれた本。1993年に出版されてから版は変わっていないようだ。分量も130ページそこそこしかなく、とてもコンパクトにまとまっている印象。エッセンスだけ詰まっている感じなので、分かる人は分かるが言葉が足りないと感じる人もいるかもしれない。情報幾何で使われる基本的な概念、定理などをずらずらと定義していくスタイルなので、発見的学習を後押ししてくれるような示唆に富むタイプの教科書ではない。初学者向けというよりも、すでにある程度知っている人が原理原則を確認するために戻る用のハンドブック
という立ち位置にある本だと思う。
情報幾何学の基礎(藤原彰夫、牧野書店)
甘利先生の本の第1~4章をより詳しく解説している感じ。数学を本分としない工学系や情報系の学生向けに書かれているとあってなかなかに読みやすい。大学1回生レベルの数学知識のみを前提としているのも優しい。個人的に嬉しいのは統計物理学との接点について解説してあるところ。たとえば、情報幾何では汎化誤差に関連する指標として「確率的複雑さ」という量が導入されているが、これは「対数周辺尤度」あるいは「自由エネルギー」と呼ばれている。この異名についてはこの後紹介する「代数幾何と学習理論」の中でも触れられているのだが、どこがどう自由エネルギー(ヘルムホルツの方)と関連しているのかということは「代数幾何と学習理論」には書かれていない。他にも最後の章では量子統計との関連から量子計算にも情報幾何が使えるのではないかといったこと(解説ではなく問題提起)が書かれていたりと、物理屋さんには興味のそそられる内容になっていると感じた。
代数幾何と学習理論(渡辺澄夫、森北出版)
この本はとてもユニークであると感じた。まず、情報幾何を特異点や超関数の観点を含めて丁寧に解説している本は他に見たことがない。(学会誌レベルの解説記事では存在する。)そして、数学的な議論を粛々と積み重ねて学問としての情報幾何
を解説する王道的な教科書ではない。確かに、大学1回生レベルの線形代数と微積分を前提にしているという点では上述の2冊と同じスタートラインから解説を始めるのだが、「(統計的)学習理論」に数学的枠組みを与えるために情報幾何では何を明らかにしようとしているのか、というゴールをはっきりさせたうえで、そこに向かって必要な数学的知識を整理しているとこが新しい。個人的には一番読みやすいと感じた。やはり私のような工学系の人間にとっては、漠然と定理や補題を証明していく数学の本よりは、何のためにこの定理を知る/証明するのかあらかじめはっきりさせておいてくれるこうした本の方がスッキリと読めるような気がする。
まとめ
以上の3冊を使って勉強をするには、「情報幾何学の基礎」で数学的知識を物理学的観点も含めて身につけつつ、「代数幾何と学習理論」で情報幾何学が持っている問題意識と、これまでにどのような知見が得られてきたのかを確認していく、というプロセスをたどるのが良いのではないかと思う。
とりあえず私もざっと読んだだけなので、これから腰を据えてじっくり読み込んでいこうと思っている。