機械学習による音声認識

音響テクノロジーシリーズ

1～2日で出荷、新刊の場合、発売日以降のお届けになります

出版社: コロナ社

著者名: 日本音響学会 , 久保陽太郎

価格: 5,280円（本体4,800円+税）

発行年月: 2021年5月

判型: Ａ５

ISBN: 9784339011395

音声認識は夢のテクノロジーである。人の言葉を聞き取り理解する技術は，人間の真のパートナーとなるべき機械もしくはロボットを実現する鍵となる技術である。スマートスピーカーやスマートフォンのような製品とともに，急速に一般化しつつある音声認識であるが，人々の要求はいまも高度化し続けている。音声認識が身近になることで，「どのような状況で」「だれが」「どのようなことを」話しても認識できるようになることの重要性が，これまでより高まってきている。また，ほぼ人間と同精度での認識が可能になった現在，人間を超える認識精度への期待も高まりつつある。本書は，そのような期待に応えうる未来の技術を切り拓くために，必要な基礎知識を学ぶためのテキストである。

本書の特色として，有限状態トランスデューサと機械学習の関わりについて，広く解説している点がある。音声認識は機械学習の典型的な応用例の一つであるが，そのシステムの複雑性は他の機械学習技術と一線を画する。本書では，複雑なシステムを有限状態トランスデューサを用いて解説する。有限状態トランスデューサは複雑なシステムを簡潔に記述するための便利な概念であるのみではなく，今日の多くの音声認識ソフトウェアの実装において，基本構成要素として利用されており，今後ともに重要な基礎技術である。

本書の主たる想定読者は，音声認識の分野に携わる技術者，研究者，およびこの分野の研究を始めようとする学生である。近年のこの分野の急速な発展を鑑みるに，書籍という媒体で日々更新され続ける最先端をなぞるのは得策ではない。本書は，本書を手に取った読者が，論文やウェブなどによって最新の情報に触れる際，それらの理解をより深めることができるようにと執筆されたものである。近い将来，本書の読者と，より新しい技術について議論するのが楽しみである。

お気に入りカテゴリ

よく利用するジャンルを設定できます。

≫ 設定

カテゴリ

「+」ボタンからジャンル（検索条件）を絞って検索してください。
表示の並び替えができます。