音声・テキスト・画像のデータサイエンス入門

データサイエンス大系

音声・テキスト・画像のデータサイエンス入門

1~2日で出荷、新刊の場合、発売日以降のお届けになります

出版社
学術図書出版社
著者名
市川治 , 飯山将晃 , 南條浩輝
価格
2,420円(本体2,200円+税)
発行年月
2024年4月
判型
B5
ISBN
9784780607161

滋賀大学データサイエンス学部のカリキュラムに基づく,音声・テキスト・画像データ分析の教科書.Pythonを使用して,基本的なデータ処理から機械学習技術まで実践的なスキルを習得する.最先端のAIが対象とするのはまさに本書がテーマとする音声・テキスト・画像である.最先端AIの基礎を本書で学ぶことができる.

【目次】
第0章 音声・テキスト・画像データの特徴
 0.1 構造化データと非構造化データ/0.2 本書の目的/0.3 音声・テキスト・画像データの融合
第1章 音声データの概要
 1.1 音声データの活用事例/1.2 音声データの構造/1.3 パソコンによる音声データの録音・再生
第2章 音声データの基本的な処理
 2.1 音声データの入出力/2.2 音声パワーの取得/2.3 発話区間の推定/2.4 SN比
第3章 音声のスペクトル表現
 3.1 音声信号の相関/3.2 サイン波とコサイン波/3.3 音声データのスペクトル表現
第4章 音声データの特徴量
 4.1 スペクトルの時系列データの算出/4.2 音声特徴量の作成
第5章 音声データの機械学習
 5.1 音声データの機械学習の基礎/5.2 音声データの前処理/5.3 深層学習モデルの学習/5.4 深層学習モデルによる推論
第6章 テキストデータの概要
 6.1 テキストデータの活用事例/6.2 テキストデータの処理単位/6.3 形態素解析/6.4 基本的なテキスト操作
第7章 テキストの処理単位とその統計量
 7.1 単語の出現確率/7.2 統計的言語モデル/7.3 統計的言語モデルによる文書分類
第8章 テキスト全体(文書)の特徴量
 8.1 ベクトル空間法/8.2 Bag-of-Words表現/8.3 トピックモデル
第9章 テキストの処理単位とその特徴量の生成
 9.1 1-hot表現/9.2 分散表現/9.3 学習済み単語分散表現の利用/9.4 単語分散表現の学習
第10章 テキストデータの機械学習
 10.1 深層学習による文書のベクトル表現/10.2 事前学習モデル/10.3 BERT文書分類モデルの学習
第11章 画像データの概要
 11.1 画像データとその活用事例/11.2 画像データの構造/11.3 画像の入出力
第12章 画像の基本的な処理
 12.1 色の表現/12.2 画像の二値化/12.3 画像の変形
第13章 画像のフィルタ処理
 13.1 平滑化/13.2 さまざまなフィルタ処理/13.3 周波数領域との関係
第14章 画像からの特徴抽出
 14.1 エッジの検出/14.2 直線・円の検出/14.3 点特徴
第15章 画像データの機械学習
 15.1 画像認識の概要/15.2 最近傍法による手書き数字認識/15.3 ニューラルネットワークを用いた手書き数字の認識

お気に入りカテゴリ

よく利用するジャンルを設定できます。

≫ 設定

カテゴリ

「+」ボタンからジャンル(検索条件)を絞って検索してください。
表示の並び替えができます。

page top