スクレイピングという言葉を最近初めて知ったような結構な初学者です。
幸い、Pythonはアプリ開発で少しだけ触ったことがあったので
スクレイピング、Pythonという検索で引っかかっただけで購入しました。
本書は、7章で構成されており、
各章毎に段階をおって内容が深くなっていく感じです。
はじめに、クローリング・スクレイピングの定義から、pythonであるべき必要性など
基本的なことから、最終的には、フレームワークを使用してのクローリングも学習できます。
基本的にMacユーザはインストール手順が書いてあるため、
初学者の私でも容易に本書と同じ環境を整えることができました。
ある程度コマンド入力の経験がある方でしたら、環境構築は本書通りに進めれば
容易かと思います。
はじめは、適当に情報を集めて見たいなぁくらいの気持ちで読んでいたのですが、
画像データを収集して、顔画像の抽出を行うなど、
読んでるだけでワクワクするような内容が沢山あります終始飽きずに読み切ることができました。
いつかこの知識をしようして何か作れたらいいなぁ。。。
最後に、
他の人が書かれていますが、
Qiitaで情報を沢山公開して共有しましょう!!

無料のKindleアプリをダウンロードして、スマートフォン、タブレット、またはコンピューターで今すぐKindle本を読むことができます。Kindleデバイスは必要ありません。
ウェブ版Kindleなら、お使いのブラウザですぐにお読みいただけます。
携帯電話のカメラを使用する - 以下のコードをスキャンし、Kindleアプリをダウンロードしてください。
Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド- 大型本 – 2016/12/16
加藤 耕太
(著)
Pythonによるクローリング・スクレイピングの入門から実践までを解説した書籍です。基本的なクローリングやAPIを活用したデータ収集、HTMLやXMLの解析から、データ取得後の分析や機械学習前の処理まで解説。データの収集・解析、活用がしっかりと基本から学べます。Webサービスの開発やデータサイエンスや機械学習分野で実用したい人はもちろん、基礎から解説しているのでPython初心者でもつまずかずに学習できます。多数のライブラリ、強力なフレームワークを活用して高効率に開発できます。
- 本の長さ400ページ
- 言語日本語
- 出版社技術評論社
- 発売日2016/12/16
- 寸法23 x 18.2 x 2.1 cm
- ISBN-104774183679
- ISBN-13978-4774183671
この商品をチェックした人はこんな商品もチェックしています
ページ 1 以下のうち 1 最初から観るページ 1 以下のうち 1
登録情報
- 出版社 : 技術評論社 (2016/12/16)
- 発売日 : 2016/12/16
- 言語 : 日本語
- 大型本 : 400ページ
- ISBN-10 : 4774183679
- ISBN-13 : 978-4774183671
- 寸法 : 23 x 18.2 x 2.1 cm
- Amazon 売れ筋ランキング: - 388,128位本 (本の売れ筋ランキングを見る)
- - 338位Webプログラミング
- カスタマーレビュー:
著者について
著者をフォローして、新作のアップデートや改善されたおすすめを入手してください。

著者の本をもっと発見したり、よく似た著者を見つけたり、著者のブログを読んだりしましょう
-
トップレビュー
上位レビュー、対象国: 日本
レビューのフィルタリング中に問題が発生しました。後でもう一度試してください。
2018年1月21日に日本でレビュー済み
Amazonで購入
2017年11月19日に日本でレビュー済み
Amazonで購入
本書はLinuxコマンドが使えることを前提として話が進むので
WindowsユーザーはLinuxが使える仮想環境を整える必要がある。
巻末にWindowsユーザの仮想環境構築のための案内があるが、
PCの仕様なども人それぞれであるから、おそらく一筋縄ではいかない。
最初にWindowsの仮想化支援機能を有効に設定すると書かれているが、
調べてみると仮想化支援ツールHyper-VというWindows 10 proでのみ使える機能が必要とのこと。
homeエディションの私は最初から置いてけぼりに。
proへのアップグレードも考えたが1万円以上かかるようだったので断念。
結局ネットで色々と調べる羽目になった。
「Quiita:Windows10にUbuntuをインストール」とか検索すれば参考になるサイトが見つかると思う。
幸運を
WindowsユーザーはLinuxが使える仮想環境を整える必要がある。
巻末にWindowsユーザの仮想環境構築のための案内があるが、
PCの仕様なども人それぞれであるから、おそらく一筋縄ではいかない。
最初にWindowsの仮想化支援機能を有効に設定すると書かれているが、
調べてみると仮想化支援ツールHyper-VというWindows 10 proでのみ使える機能が必要とのこと。
homeエディションの私は最初から置いてけぼりに。
proへのアップグレードも考えたが1万円以上かかるようだったので断念。
結局ネットで色々と調べる羽目になった。
「Quiita:Windows10にUbuntuをインストール」とか検索すれば参考になるサイトが見つかると思う。
幸運を
2020年4月9日に日本でレビュー済み
Amazonで購入
Pythonの入門書を1冊終えた方にオススメしたい。
Pythonを仕事で使うイメージがものすごく掴みやすく実践的。
Python以外にも備えておくべき正規表現や情報通信系の知識もサラッと書いてあるのが嬉しい。
Pythonを仕事で使うイメージがものすごく掴みやすく実践的。
Python以外にも備えておくべき正規表現や情報通信系の知識もサラッと書いてあるのが嬉しい。
2017年6月9日に日本でレビュー済み
Amazonで購入
python始めて1ヶ月の初心者です。
windows使用者は仮想環境の構築から始まるんですが
その辺が結構おざなりというか、
エラー出たらこうやっといてね、じゃ次行きます。て感じの進行です。
中級者向けなのかな・・・
一応今はjupiter notebookでコードをなぞってます。
ただ仮想のLinux環境で動かす前提なのでLinuxコマンドとかは無視してます。
こなれてきたらも一度チャレンジしようと思います。
コード自体はコメントが充実しててわかりやすいです。
これなら素人でも大体やりたいことが理解できる気がします。
追記:
windowsの方ならば,VMware workstationでもUbuntuを動かせるのでそちらで環境構築しても良いかもしれません.
私はLinux環境に四苦八苦しながらpythonを勉強するのも学習効率が悪いと感じたので,
もう少し入門書を何冊か読み,一通りコードを書けるようになってから読み直そうかと考えました.
また戻ってきたいと思います.
windows使用者は仮想環境の構築から始まるんですが
その辺が結構おざなりというか、
エラー出たらこうやっといてね、じゃ次行きます。て感じの進行です。
中級者向けなのかな・・・
一応今はjupiter notebookでコードをなぞってます。
ただ仮想のLinux環境で動かす前提なのでLinuxコマンドとかは無視してます。
こなれてきたらも一度チャレンジしようと思います。
コード自体はコメントが充実しててわかりやすいです。
これなら素人でも大体やりたいことが理解できる気がします。
追記:
windowsの方ならば,VMware workstationでもUbuntuを動かせるのでそちらで環境構築しても良いかもしれません.
私はLinux環境に四苦八苦しながらpythonを勉強するのも学習効率が悪いと感じたので,
もう少し入門書を何冊か読み,一通りコードを書けるようになってから読み直そうかと考えました.
また戻ってきたいと思います.
2018年9月22日に日本でレビュー済み
Amazonで購入
Pythonの例題が豊富で理解しやすい。もう少しいろいろなパターンのサンプルがほしい
2016年12月28日に日本でレビュー済み
Amazonで購入
こちらの商品と
Pythonによるスクレイピング&機械学習 開発テクニック BeautifulSoup,scikit-learn,TensorFlowを使ってみよう
を立ち読みして比較してみてこちらの商品を購入しました。
結果的にはベストな選択だったと思います。
あちらの本は今話題の〜をちょっとだけやってみようってな感じで小粒の情報を沢山集めてまとめました的な本でした(パラパラと少し読んでみた感じ本の内容が悪いとは思いませんしうまくまとまってると思います)、こちらはウェブスクレイピングとクローリングだけに特化してとことんスクレイピングしようぜな本でとても楽しくワクワクしながら読ませてもらいました。もちろんサンプルコードもあるので写経せずに環境さえあれば動かせます!
初心者がつまずくであろう環境構築はpython3のvenvを利用していて説明は丁寧親切でわかりやすかったです!anacondaでしたらええやんって思いましましたがそこはまあ出来る人はそっちでもいいよと書いているので個人でいろいろ調べてやりやすい方でやったらいいと思います。
この本はプログラム初心者が1冊目に読む本ではないということには注意が必要です。
この本はある程度プログラム言語を勉強して、次は何がしたいかなと考えた時に膨大なWEBの情報を自由に使いたいという人が読むべき本ですので決してプログラム初心者が読むべきではないと思います。
ちなみにMacの方はまだいいのですが(homebrewを使ってまとめて管理できる)Windowsの方はこの本の最後に紹介されているvagrantを使いUbuntuを(簡単に)セットアップしてLinuxの操作が必要となります。そう言った点で初心者にとってはとっつきにくいかなと考えます。
まあすごく丁寧に説明してくれるのでやれるっちゃあやれると思いますが、そこらへんの知識がない人がvagrantやvirtualbox、teraterm等の文字が出てきてわからずに???って思いながら設定するよりもある程度の勉強をしてからの方がいいと思うので書かせてもらいました。
とても楽しい本だったのである程度の知識がある方は是非この本を読んで膨大なデータの取得方法の基礎学んでこの本以上のことを学ぶ足がかりとして、この本以上の知識をQiitaで情報を共有しましょう!!
Pythonによるスクレイピング&機械学習 開発テクニック BeautifulSoup,scikit-learn,TensorFlowを使ってみよう
を立ち読みして比較してみてこちらの商品を購入しました。
結果的にはベストな選択だったと思います。
あちらの本は今話題の〜をちょっとだけやってみようってな感じで小粒の情報を沢山集めてまとめました的な本でした(パラパラと少し読んでみた感じ本の内容が悪いとは思いませんしうまくまとまってると思います)、こちらはウェブスクレイピングとクローリングだけに特化してとことんスクレイピングしようぜな本でとても楽しくワクワクしながら読ませてもらいました。もちろんサンプルコードもあるので写経せずに環境さえあれば動かせます!
初心者がつまずくであろう環境構築はpython3のvenvを利用していて説明は丁寧親切でわかりやすかったです!anacondaでしたらええやんって思いましましたがそこはまあ出来る人はそっちでもいいよと書いているので個人でいろいろ調べてやりやすい方でやったらいいと思います。
この本はプログラム初心者が1冊目に読む本ではないということには注意が必要です。
この本はある程度プログラム言語を勉強して、次は何がしたいかなと考えた時に膨大なWEBの情報を自由に使いたいという人が読むべき本ですので決してプログラム初心者が読むべきではないと思います。
ちなみにMacの方はまだいいのですが(homebrewを使ってまとめて管理できる)Windowsの方はこの本の最後に紹介されているvagrantを使いUbuntuを(簡単に)セットアップしてLinuxの操作が必要となります。そう言った点で初心者にとってはとっつきにくいかなと考えます。
まあすごく丁寧に説明してくれるのでやれるっちゃあやれると思いますが、そこらへんの知識がない人がvagrantやvirtualbox、teraterm等の文字が出てきてわからずに???って思いながら設定するよりもある程度の勉強をしてからの方がいいと思うので書かせてもらいました。
とても楽しい本だったのである程度の知識がある方は是非この本を読んで膨大なデータの取得方法の基礎学んでこの本以上のことを学ぶ足がかりとして、この本以上の知識をQiitaで情報を共有しましょう!!
2017年8月31日に日本でレビュー済み
Amazonで購入
Windowsを持ってるひとはVirtualBox, Vagrantを用いてLinux環境を作らないといけません。それはこの本がMacかLinuxを前提としてるからです。しかし、その解説が不親切で、Vagrantで作られたLinux環境のファイルをどうやって操作したら良いのか不明で何も進まない。完全に詰みました。
2017年11月8日に日本でレビュー済み
Amazonで購入
完全な初心者には厳しいかもしれませんが、
何かしらのプログラムを書いたことのある人にはもってこいです。
Python自体のポテンシャルの高さ、モジュールの充実。
サクサクっと読み物としてもいけます。
自分のやりたい事に対して、タイムリーにもってこいの内容でした。
なぜPythonに今まで出会わなかったんだろうと思いました。
何かしらのプログラムを書いたことのある人にはもってこいです。
Python自体のポテンシャルの高さ、モジュールの充実。
サクサクっと読み物としてもいけます。
自分のやりたい事に対して、タイムリーにもってこいの内容でした。
なぜPythonに今まで出会わなかったんだろうと思いました。