分类: 未分类

102 篇文章

Web抓取分析机器人连载(一)
一般来说,如果某个网站没有提供API来获取其内容,那就只有通过模拟浏览器的行为来抓取其页面来获取我们感兴趣的信息。 理论上来说,只要网站对公共开放,其上面的内容就可以获取,但是如果需要二次验证,比如输入图形验证码或者短信验证码才能查看,这个就稍显复杂,不过也不是没有办法。 本教程关注没有特别保护的页面的抓取,用python来开发,其他语言开发者可以…
YAML simple tutorial
Introduction YAML stands for "YAML Ain't Markup Language", It’s basically a human-readable structured data format. It is less complex and ungainly than XML or JSON, …