@kyanny's blog

My thoughts, my life. Views/opinions are my own.

「Spidering Hacks」を読み始めた

Spidering hacks―ウェブ情報ラクラク取得テクニック101選

Spidering hacks―ウェブ情報ラクラク取得テクニック101選

上記のようなモジュールを作ろうと思い立った数日前に、スパイダーのためのモジュールを作るならスパイダーの作り方を知る必要があると思って、Spidering Hacksをアマゾンで購入。前に池袋のジュンク堂本店で洋書の棚でみかけたので、それを買う覚悟があったが、邦訳されていた。

で今日届いたので早速読み始めているんだけど、最初のほうですごく細かく丁寧に、「行儀よくあれ、許されないスパイダリングはするな」ということに言及されていて、とても考えさせられている。妖精現実を読んでいると、Webの資源は無尽蔵ではなく、公開者が多大な負担を強いられていることが多々あるんだ、という事実に気づかされるけど、スパイダーを作ろうとするからには、普通にWebを利用する場合以上に、その資源の利用について敏感にならないといけないんだなあと思った。そこをしっかり知らしめようとする本書はとてもよい本なんじゃないかと、具体的なHackを読む前からとても期待している。