基礎から学ぶ推薦システム - 情報技術で嗜好を予測する -

基礎から学ぶ推薦システム - 情報技術で嗜好を予測する -

人の嗜好を予測する「推薦システム」技術について,わかりやすく丁寧に解説した一冊

ジャンル
発行年月日
2022/07/21
判型
A5
ページ数
324ページ
ISBN
978-4-339-02928-4
基礎から学ぶ推薦システム - 情報技術で嗜好を予測する -
在庫あり

定価

4,950(本体4,500円+税)

カートに入れる

電子版を購入

購入案内

  • 内容紹介
  • まえがき
  • 目次
  • 著者紹介

【書籍紹介】
「この商品を買った人はこんな商品も買っています」。いまや,Web上のいたるところでみかけます。もしかしたら,あなたもお薦めの本として提示されて,この本を手にとられたのかもしれません。このような機能を支えている技術が推薦システムです。本書では,その推薦システムの中身に迫ります。

推薦システムは,大きく,内容ベース推薦システム,協調ベース推薦システム,知識ベース推薦システム,そして,それらを組み合わせたハイブリッド型推薦システムに分類されます。この分類を踏まえ,本書はつぎのような構成になっています。1章では,なぜ推薦システムが必要かという話からはじめ,推薦問題の定義について学びます。内容ベース推薦システムについては2章と3章の2章構成で,協調ベース推薦システムについては4章から6章の3章構成で,それぞれ学びます。知識ベース推薦システムは7章で学び,ハイブリッド型推薦システムは8章で学びます。そして,最後に9章で推薦システムの評価について学びます。なお,本書は,1章から順を追って読まれることを想定しています。前の章で学んだ知識を後の章にも活用するように,知識を積み重ねていく構成となっています。

【本書の特徴】
本書では数式がふんだんに出てきますが,一つひとつ紐解きながら丁寧に解説しています。具体例を交えながら,計算過程もなるべく省略せずに書いていますので,一つひとつ記号の意味を理解しながら式を追っていくことができます。
また,問題に親しみをもってもらいやすいように,具体的かつ身近な事例として,食をテーマにしたシナリオを設定しています。食に対する好き嫌いは個人差が現れやすいので,嗜好予測の問題設定としてはうってつけです。

【著者からのメッセージ】
推薦システムの研究には面白くワクワクするような課題がたくさん詰まっています。本書では先端的なトピックについては扱いませんでしたが,いずれのトピックにおいても本書で学んだ内容が基礎となります。
世の中のコンテンツは数も種類も日々増大しており,人々の選択肢も無数に存在します。それにつれて人間の嗜好もどんどん多種多様で複雑になってきています。そのような嗜好を果して情報技術でどこまで予測できるのか,推薦システム研究はこの課題に挑戦しつづけていくことになるでしょう。さあ,推薦システムの探求への旅はいま始まったばかりです!

☆発行前情報のため,一部変更となる場合がございます

「この商品を買った人はこんな商品も買っています」。いまや,Web上のいたるところでみかけます。オンラインショッピングサイトで,ある商品を購入しようとすると,その商品に関連するおすす薦めの商品が提示されます。動画共有サイトにアクセスすると,あなたにお薦めの動画が提示されます。観光情報サイトで興味のある地域の情報を閲覧すると,その地域のお薦めの観光スポットやレストラン,ホテルなどの情報が提示されます。もしかしたら,あなたもお薦めの本として提示されて,この本を手にとられたのかもしれません。このような機能を支えている技術が推薦システムです。

さて,この推薦システムの中身はどのようになっているのでしょうか。どのようにわたしたちの好みを言い当てているのでしょうか。本書では,その推薦システムの中身に迫ります。推薦システムにおいては,その人が何を好むのか,人間の嗜好をいかに予測するのかが課題となります。その予測の鍵を握るのがデータ,すなわち,その人がこれまでに利用してきたコンテンツに対する評価履歴です。その評価履歴からの嗜好予測には,機械学習をはじめとしたさまざまな情報技術を駆使します。人間の嗜好は多種多様で複雑です。そのような人間の嗜好を情報技術でどこまで予測できるのか,これが推薦システムにおける究極的な問いであるといえます。この問いに対して挑みつづけることが,推薦システム研究の醍醐味ともいえるでしょう。

情報技術は,数学によって支えられています。そのため,本書では数式がふんだんに出てきます。数式が苦手な方にとっては少々難しく感じるかもしれません。しかし,安心してください。本書で出てくる数式については,一つひとつ紐解きながら丁寧に解説していきます。具体例を交えながら,計算過程もなるべく省略せずに書いていますので,一つひとつ記号の意味を理解しながら式を追っていくことができます。本書では,問題に親しみをもってもらいやすいように,具体的かつ身近な事例として,食をテーマにしたシナリオを設定しています。食に対する好き嫌いは個人差が現れやすいので,嗜好予測の問題設定としてはうってつけです。数式の意味を理解するためには,実際に手で計算しながら式を追っていくことが重要です。問題の大きさも小規模なものにしていますので,一部の計算を除いて,プログラムに頼らなくても,(関数電卓ぐらいは必要ですが)手計算で追っていける内容となっています。本書を通して,数式の読み方にも慣れていただければ幸いです。

本書の読者対象は,これから推薦システムについて学びたいという大学生,および大学院生を想定しています。学部1~2年生レベルの微分,線形代数,確率・統計に関する知識を前提としていますが,先述したように,数式についてはその都度解説していきますので,授業で習ったことがある程度で十分です。必要に応じて数学の教科書などを参照し,知識を補いながら読み進めていただければと思います。本書をきっかけに,推薦システムの研究分野に興味をもっていただければ望外の喜びです。

また,本書は,大学の授業や研究室などで,学生さんに対して推薦システムや関連技術について指導される機会のある教員の方も想定しています。推薦システムは,機械学習やデータ分析などの応用例の一つとして紹介されることが多いと思いますが,本書の目次を参照いただいてもわかるとおり,推薦システムはじつに多くの技術に関連します。そのため,推薦システム一つとっても,学生さんに伝えられる技術は多くあります。本書が推薦システムや関連技術の指導の一助になれば幸いです。

一方で,本書は推薦システムの基礎に焦点をあてているため,先端的なトピックについてはカバーしていません。先端的なトピックについて興味のある方は,推薦システムの国際会議であるACM Recommender Systemsやそれに併設されているワークショップで最新の研究動向を追われるとよいでしょう。また,本書は実践向けではなく,一部の疑似コードを除いて,コードも出てきません。推薦システムの実装や実践に関しては,文献38)や文献179)などが参考になります。もちろん,これら最新の研究動向の調査や,推薦システムの実装や実践を進めるうえで,本書で学ぶような推薦システムの基礎をしっかり押えておくことは大事です。

推薦システムは,大きく,内容ベース推薦システム,協調ベース推薦システム,知識ベース推薦システム,そして,それらを組み合わせたハイブリッド型推薦システムに分類されます。この分類を踏まえ,本書はつぎのような構成になっています。1章では,なぜ推薦システムが必要かという話からはじめ,推薦問題の定義について学びます。内容ベース推薦システムについては2章と3章の2章構成で,協調ベース推薦システムについては4章から6章の3章構成で,それぞれ学びます。知識ベース推薦システムは7章で学び,ハイブリッド型推薦システムは8章で学びます。そして,最後に9章で推薦システムの評価について学びます。

本書は,1章から順を追って読まれることを想定しています。前の章で学んだ知識を後の章にも活用するように,知識を積み重ねていく構成となっています。例えば,3章の内容ベース推薦システム~モデルベース方式~では,ルールベース分類器や単純ベイズ分類器,決定木などの各分類器について学びます。そして,ここで学んだ各分類器は,5章で学ぶモデルベース協調フィルタリングにおいても活用します。また,6章では潜在因子モデルについて学びますが,これは欠損値を含む評価値行列の行と列の次元を同時に削減するものです。その前の段階で,2章で評価履歴の次元削減,4章で欠損値を含む評価値行列の次元削減について学びます。このように,次元削減について簡単な問題設定から段階的に学んでいけるように構成を工夫しています。

本書の内容については,記述が著者の主観にならないように,主要な文献を引用するように心がけました。特に,各トピックにおける主要なサーヴェイ論文や初期に提案された論文などをなるべく引用するようにしました。本書で紹介しきれなかった詳細部分は,これらの論文などを参照し,適宜補っていただければ幸いです。本書は,これら先人たちの知の積み重ねがあってのものです。この場をお借りして謝意を表します。

それでは,一緒に推薦システムの中身についてみていきましょう!

2022年5月
奥 健太

☆発行前情報のため,一部変更となる場合がございます

1. 推薦システム
1.1 推薦システムとは
1.2 なぜ推薦システムが必要か?
1.3 ユーザ,アイテム,評価値
 1.3.1 ユーザ
 1.3.2 アイテム
 1.3.3 評価履歴
 1.3.4 評価値行列
1.4 推薦問題の定義
1.5 推薦サイクル

2. 内容ベース推薦システム~近傍ベース方式~
2.1 内容ベース推薦システム(近傍ベース方式)の基本
 2.1.1 アイテムの特徴ベクトル
 2.1.2 特徴空間
 2.1.3 ユーザプロファイル
2.2 類似度に基づく推薦
 2.2.1 類似度
 2.2.2 推薦
2.3 適合性フィードバック
2.4 k近傍法
 2.4.1 距離
 2.4.2 近傍アイテム
 2.4.3 推薦
2.5 次元削減
 2.5.1 分散共分散行列
 2.5.2 固有値・固有ベクトル
 2.5.3 主成分
 2.5.4 主成分得点
 2.5.5 寄与率
 2.5.6 推薦

3. 内容ベース推薦システム~モデルベース方式~
3.1 内容ベース推薦システム(モデルベース方式)の基本
 3.1.1 アイテムの特徴ベクトル
 3.1.2 訓練データ
 3.1.3 予測対象データ
 3.1.4 学習と予測
 3.1.5 クラス分類問題
3.2 ルールベース分類器
 3.2.1 ルール
 3.2.2 候補ルール
 3.2.3 頻出ルール
 3.2.4 相関ルール
 3.2.5 ユーザプロファイル
 3.2.6 嗜好予測
 3.2.7 推薦
3.3 単純ベイズ分類器
 3.3.1 条件付き確率
 3.3.2 問題設定
 3.3.3 ベイズの定理
 3.3.4 単純ベイズ仮定
 3.3.5 ユーザプロファイル
 3.3.6 嗜好予測
 3.3.7 ラプラススムージング
 3.3.8 推薦
3.4 決定木
 3.4.1 ジニ係数
 3.4.2 分割のよさ
 3.4.3 決定木の学習
 3.4.4 ユーザプロファイル
 3.4.5 嗜好予測
 3.4.6 推薦

4. 協調ベース推薦システム~近傍ベース協調フィルタリング~
4.1 協調フィルタリングの基本
4.2 ユーザベース協調フィルタリング
 4.2.1 ユーザ類似度
 4.2.2 類似ユーザの選定
 4.2.3 嗜好予測
 4.2.4 評価値行列の補完
4.3 アイテムベース協調フィルタリング
 4.3.1 アイテム類似度
 4.3.2 アイテム–アイテム類似度行列
 4.3.3 類似アイテムの選定
 4.3.4 嗜好予測
 4.3.5 評価値行列の補完
4.4 評価値行列の次元削減
 4.4.1 分散共分散行列
 4.4.2 固有値・固有ベクトル
 4.4.3 潜在因子
 4.4.4 嗜好予測
 4.5ユーザベース協調フィルタリングvs. アイテムベース協調フィルタリング
 4.5.1 正確性とセレンディピティ
 4.5.2 説明性
 4.5.3 計算効率性

5. 協調ベース推薦システム~モデルベース協調フィルタリング~
5.1 モデルベース協調フィルタリングの基本
5.2 ルールベース協調フィルタリング
 5.2.1 ルール
 5.2.2 候補ルール
 5.2.3 相関ルール
 5.2.4 学習モデル
 5.2.5 嗜好予測
 5.2.6 評価値行列の補完
5.3 単純ベイズ協調フィルタリング
 5.3.1 問題設定
 5.3.2 ベイズの定理
 5.3.3 単純ベイズ仮定
 5.3.4 事前確率
 5.3.5 各アイテムに関する条件付き確率
 5.3.6 ラプラススムージング
 5.3.7 学習モデル
 5.3.8 嗜好予測
 5.3.9 評価値行列の補完
5.4 決定木に基づく協調フィルタリング
 5.4.1 決定木の学習
 5.4.2 学習モデル
 5.4.3 嗜好予測
 5.4.4 評価値行列の補完

6. 協調ベース推薦システム~潜在因子モデル~
6.1 潜在因子モデルの基本
 6.1.1 問題設定
 6.1.2 定式化
6.2 勾配降下法
6.3 確率的勾配降下法
6.4 近傍ベース協調フィルタリングvs.モデルベース協調フィルタリング
 6.4.1 正確性
 6.4.2 シンプルさ
 6.4.3 説明性
 6.4.4 計算効率性
 6.4.5 モデル表現
6.5 内容ベース推薦システムvs.協調ベース推薦システム
 6.5.1 コールドスタート問題
 6.5.2 アイテム特徴量の抽出
 6.5.3 正確性とセレンディピティ
 6.5.4 説明性

7. 知識ベース推薦システム
7.1 知識ベース推薦システムの基本
7.2 制約ベース推薦システム
 7.2.1 ユーザ要求
 7.2.2 アイテムデータベース
 7.2.3 適合性制約
 7.2.4 フィルタ制約
 7.2.5 推薦タスク
 7.2.6 推薦
 7.2.7 要求の緩和
 7.2.8 要求の追加
7.3 事例ベース推薦システム
 7.3.1 初期事例
 7.3.2 類似性尺度
 7.3.3 批評
 7.4知識ベース推薦システムvs. 内容・協調ベース推薦システム
 7.4.1 コールドスタート問題
 7.4.2 個人化
 7.4.3 制御性
 7.4.4 アイテム特徴量の抽出・知識獲得

8. ハイブリッド型推薦システム
8.1 ハイブリッド型推薦システムの基本
8.2 アンサンブル型ハイブリッド
 8.2.1 並列型ハイブリッド
 8.2.2 直列型ハイブリッド
8.3 モノリシック型ハイブリッド
8.4 混合型ハイブリッド

9. 推薦システムの評価
9.1 推薦システムの評価の基本
 9.1.1 評価目的
 9.1.2 評価指標
 9.1.3 ベースライン
 9.1.4 ハイパーパラメタ
9.2 評価方法
 9.2.1 オフライン評価
 9.2.2 ユーザ評価
 9.2.3 オンライン評価
9.3 正確性に関する評価指標
 9.3.1 嗜好予測の正確性
 9.3.2 上位K推薦の正確性
9.4 発見性に関する評価指標
 9.4.1 被覆率
 9.4.2 多様性
 9.4.3 新規性
 9.4.4 意外性
 9.4.5 セレンディピティ

引用・参考文献
あとがき
索引

奥 健太

奥 健太(オク ケンタ)

世の中にはまだまだ自分が知らないコンテンツが膨大に眠っています。そのようなコンテンツの存在を知り尽くし、とにかくさまざまな感動するようなコンテンツに出会いたい、そんな思いで推薦システムの研究に取り組んでいます。

大学では推薦システムを軸とした教育・研究を展開しています。推薦システムはじつに多くの技術に関連します。また、良い推薦システムを実現するためには、技術だけでなくコンテンツと人の両者を深く理解する必要があります。推薦システムを通して学べることは多くあると思っています。

少しでも多くの方に推薦システムの面白さ、奥深さを知ってもらいたいと思い、特に推薦システムに関する教材開発に力を入れています。本書はその活動の一つとして執筆いたしました。本書をきっかけに、多くの方に推薦システムに興味を持ってもらえると幸いです。

関連資料(一般)

関連資料一覧

教科書採用される教員・指導者向け 関連資料申込
本書を教科書としてご採用の教員様向けに,講義用スライド(PowerPointファイル)を提供しております。こちらよりお問い合わせください。