スクレイピングと機械学習のベストセラーがパワーアップ!
本書は、2016 年に発売され好評だった『Pythonによるスクレイピング&機械学習開発テクニック』を大幅に改訂したものです。
今回の改訂では、
・ソースコードの全面見直し
・Scrapyの解説を加筆
・TensorFlow Ver1.10以降に対応
・セキュアなHTTPSサイトへの対応
・SeleniumによるFirefoxの自動操縦の加筆
を行いました。
なお、前回の書籍を買われた読者の方も、追加部分以外の流れは同じなので、
今回のソースコードを是非ダウンロードしてみてください。
第0章 クローリング、スクレイピングそして機械学習
0-1 ビッグデータはネットにある
第1 章 クローリングとスクレイピング
1-1 データのダウンロード
1-2 BeautifulSoup でスクレイピング
1-3 CSS セレクターについて
1-4 リンク先を丸ごとダウンロード
第2 章 高度なスクレイピング
2-1 ログインの必要なサイトからダウンロード
2-2 ブラウザーを経由したスクレイピング
2-3 スクレイピング道場
2-4 Web API からのデータ取得
2-5 cron と定期的なクローリング
2-6 Scrapy を使ったスクレイピング
2-7 Scrapy で夏目漱石の全作品をダウンロードしよう
2-8 Scrapy とSelenium で動的Web サイトをダウンロード
第3 章 データソースと書式・整形
3-1 Web のデータはさまざまのフォーマット
3-2 データベースについて
第4 章 機械学習
4-1 機械学習とは
4-2 機械学習はじめの一歩
4-3 画像の文字認識
4-4 外国語の文章を判定
4-5 サポートベクターマシン(SVM) について
4-6 ランダムフォレスト
4-7 学習データを検証する
第5 章 深層学習に挑戦しよう
5-1 深層学習とはなにか
5-2 TensorFlow のインストール
5-3 Jupyter Notebook のススメ
5-4 TensorFlow の基本を押さえよう
5-5 TensorBoard で視覚化しよう
5-6 TensorFlow で深層学習に進もう
5-7 Keras でもっと楽に深層学習を実践しよう
5-8 Pandas/NumPy を使いこなそう
第6 章 テキスト解析とチャットボットの作成
6-1 日本語の解析(形態素解析)について
6-2 Word2Vec で文章をベクトル変換しよう
6-3 ベイズの定理でテキストを分類しよう
6-4 MLP でテキスト分類してみよう
6-5 文章の類似度をN-gram で調べよう
6-6 マルコフ連鎖やLSTM で文章を生成しよう
6-7 チャットボットの作成
第7 章 深層学習を実践してみよう
7-1 類似画像の検出をしよう
7-2 CNN で画像分類に挑戦しよう
7-3 牛丼屋のメニューを画像判定しよう
7-4 OpenCV で顔認識
7-5 画像OCR – 連続文字認識に挑戦しよう
Appendix 作業の準備と環境構築
Appendix-1 VirtualBox/Vagrant を使う方法
Appendix-2 Docker で開発環境を構築しよう
Appendix-3 Python + Anaconda の環境を整える
ダウンロードデータ
本書で解説したサンプルデータを以下のサイトからダウンロードできます。 なお、使用方法などに関しては、必ず書籍の該当箇所をご確認の上、ご利用ください。
アクセス後、右上にある「「Clone or download」から「download ZIP」を選んでダウンロードして下さい。
お問い合わせ
本書に関するお問い合わせは、下記のボタンをクリックしてお問い合わせフォームよりお問い合わせください。