「統計的テキストモデル 言語へのベイズ的アプローチ」

確率と情報の科学

出版社名 岩波書店
出版年月 2025年6月
ISBNコード 978-4-00-006976-2
4-00-006976-4
税込価格 5,566 円(税込)
頁数・縦 375P 22cm
数量

商品内容

要旨

文字・単語・文・文書からなる離散データをベイズ統計モデルでいかに学習するか。さまざまなテキストの統計的なモデル化の数理について一から説明し、ブラックボックスに頼らずとも自分の手で統計的分析を駆使できるようになることを目指す。分野を問わず自然言語処理の必要性が増加の一途をたどるなか、読者を基礎から導く好適書。

目次

1 テキストと言語のモデル化(言語とテキストの特徴
テキストの階層構造 ほか)
2 文字の統計モデル(文字の頻度と出現確率
文字の同時確率 ほか)
3 単語の統計モデル(文字から単語へ
単語の統計と冪乗則 ほか)
4 文の統計モデル(テキストの文分割
文ベクトルと意味的ランダムウォーク ほか)
5 文書の統計モデル(ナイーブベイズ法と単語集合表現
ユニグラム混合モデル(UM) ほか)

出版社・メーカーコメント

文字・単語・文・文書からなる離散データをベイズ統計モデルでいかに学習するか。さまざまなテキストの統計的なモデル化の数理について一から説明し、ブラックボックスに頼らずとも自分の手で統計的分析を駆使できるようになることを目指す。分野を問わず自然言語処理の必要性が増加の一途をたどるなか、読者を基礎から導く好適書。

著者紹介

持橋 大地 (モチハシ ダイチ)  
1973年生まれ。1993年東京大学文科三類入学、2005年奈良先端科学技術大学院大学情報科学研究科博士後期課程修了。博士(理学)。ATR音声言語コミュニケーション研究所、NTTコミュニケーション科学基礎研究所各研究員を経て、2024年より統計数理研究所 統計基盤数理研究系教授/総合研究大学院大学 統計科学コース教授および国立国語研究所 次世代言語科学研究センター教授(兼務)。専門は自然言語処理および統計的機械学習(本データはこの書籍が刊行された当時に掲載されていたものです)