本書は,単にR を使ってインターネットからデータを収集・保存する方法を紹介した入門書ではなく,むしろその後の分析やレポート作成までのすべてのプロセスを効率化あるいは自動化する技法を実践的に解説した専門書である。分析に関連しては,データの前処理に役立つ正規表現や,ドキュメントから統計的な手法によって知見を引き出す技術であるテキストマイニングも取り上げられている。
本書の構成は大きく3つに分かれ,第1部では基本技術に焦点があてられている。R を利用することでWebスクレイピングとデータ操作は簡単に実現できるが,その背景技術について知識を深めておくと,構造の複雑なWebサイトに遭遇した場合でもデータをピンポイントに抽出できるようになる。続く第2部は,ここまで習得した技術の実践編となっており,現実に遭遇するケースのそれぞれに対処する方法が詳しく紹介されている。そして第3部は,やや複雑な研究課題を想定し,データの収集から分析,そして効果的なグラフィクスの作成までを詳細に解説している。
[原著:Simon Munzert, Chistian Rubba, Peter Meissner, Dominic Nyhuis: Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining, Wiley, 2015.]
よく利用するジャンルを設定できます。
「+」ボタンからジャンル(検索条件)を絞って検索してください。
表示の並び替えができます。