我们以新浪网的新闻为例子,网址http://roll.mil.news.sina.com.cn/col/zgjq/index_2.shtml
很简单,只要输入列表地址就可以采集了,真正做到无规则采集,即使脑残都会使用。如下图
执行之后,我们可以看到程序自动获取到了列表
我们可以查看采集到的文章,如下图:
即使不写规则,程序仍然能够准确的提取出文章的标题和内容。完全无任何杂质。
如果查看学习规则列表的话,可以看到,采集器在执行过程中自动学习到了一条规则:
欢迎光临 嘻皮客娱乐学习网 (http://www.xipick.com/) | Powered by Discuz! X3.3 |