Portia Spider(孔蛛)号称世界上最聪明的蜘蛛,孔蛛属,英文名 Portia,也翻译为波西亚蜘蛛(波西亚跳蛛)。

Portia是scrapyhub开源的一款可视化的爬虫规则编写工具。它提供可视化的Web页面,你只需要通过点击标注页面上你需要抽取的数据,不需要任何编程知识即可完成规则的开发。

这些规则可以在#Scrapy#中使用,用于抓取页面。

不过需要注意的是这个程序需要再python(PY)环境下运行。

具体请参考:http://blog.scrapinghub.com/2014/04/01/announcing-portia/

Github: https://github.com/scrapinghub/portia

视频介绍:http://v.youku.com/v_show/id_XNjkzNjkwODE2.html

最后修改:2015 年 12 月 05 日
如果觉得我的文章对你有用,请随意赞赏