音声・テキスト・画像のデータサイエンス入門

データサイエンス大系

1～2日で出荷、新刊の場合、発売日以降のお届けになります

出版社: 学術図書出版社

著者名: 市川治 , 飯山将晃 , 南條浩輝

価格: 2,420円（本体2,200円+税）

発行年月: 2024年4月

判型: Ｂ５

ISBN: 9784780607161

滋賀大学データサイエンス学部のカリキュラムに基づく，音声・テキスト・画像データ分析の教科書．Pythonを使用して，基本的なデータ処理から機械学習技術まで実践的なスキルを習得する．最先端のAIが対象とするのはまさに本書がテーマとする音声・テキスト・画像である．最先端AIの基礎を本書で学ぶことができる．

【目次】
第0章　音声・テキスト・画像データの特徴
　0.1　構造化データと非構造化データ／0.2　本書の目的／0.3　音声・テキスト・画像データの融合
第1章　音声データの概要
　1.1　音声データの活用事例／1.2　音声データの構造／1.3　パソコンによる音声データの録音・再生
第2章　音声データの基本的な処理
　2.1　音声データの入出力／2.2　音声パワーの取得／2.3　発話区間の推定／2.4　SN比
第3章　音声のスペクトル表現
　3.1　音声信号の相関／3.2　サイン波とコサイン波／3.3　音声データのスペクトル表現
第4章　音声データの特徴量
　4.1　スペクトルの時系列データの算出／4.2　音声特徴量の作成
第5章　音声データの機械学習
　5.1　音声データの機械学習の基礎／5.2　音声データの前処理／5.3　深層学習モデルの学習／5.4　深層学習モデルによる推論
第6章　テキストデータの概要
　6.1　テキストデータの活用事例／6.2　テキストデータの処理単位／6.3　形態素解析／6.4　基本的なテキスト操作
第7章　テキストの処理単位とその統計量
　7.1　単語の出現確率／7.2　統計的言語モデル／7.3　統計的言語モデルによる文書分類
第8章　テキスト全体（文書）の特徴量
　8.1　ベクトル空間法／8.2　Bag-of-Words表現／8.3　トピックモデル
第9章　テキストの処理単位とその特徴量の生成
　9.1　1-hot表現／9.2　分散表現／9.3　学習済み単語分散表現の利用／9.4　単語分散表現の学習
第10章　テキストデータの機械学習
　10.1　深層学習による文書のベクトル表現／10.2　事前学習モデル／10.3　BERT文書分類モデルの学習
第11章　画像データの概要
　11.1　画像データとその活用事例／11.2　画像データの構造／11.3　画像の入出力
第12章　画像の基本的な処理
　12.1　色の表現／12.2　画像の二値化／12.3　画像の変形
第13章　画像のフィルタ処理
　13.1　平滑化／13.2　さまざまなフィルタ処理／13.3　周波数領域との関係
第14章　画像からの特徴抽出
　14.1　エッジの検出／14.2　直線・円の検出／14.3　点特徴
第15章　画像データの機械学習
　15.1　画像認識の概要／15.2　最近傍法による手書き数字認識／15.3　ニューラルネットワークを用いた手書き数字の認識

お気に入りカテゴリ

よく利用するジャンルを設定できます。

≫ 設定

カテゴリ

「+」ボタンからジャンル（検索条件）を絞って検索してください。
表示の並び替えができます。