设为首页收藏本站

嘻皮客娱乐学习网

 找回密码
 中文注册
搜索
打印 上一主题 下一主题
开启左侧

DXC采集插件基本设置:2、一键采集

[复制链接]
跳转到指定楼层
楼主
发表于 2017-4-6 10:47:01 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

使用一键采集采集文章

我们以新浪网的新闻为例子,网址http://roll.mil.news.sina.com.cn/col/zgjq/index_2.shtml

1、配置

很简单,只要输入列表地址就可以采集了,真正做到无规则采集,即使脑残都会使用。如下图

2、执行

执行之后,我们可以看到程序自动获取到了列表

3、查看文章

我们可以查看采集到的文章,如下图:


即使不写规则,程序仍然能够准确的提取出文章的标题和内容。完全无任何杂质。

如果查看学习规则列表的话,可以看到,采集器在执行过程中自动学习到了一条规则:

回复

使用道具 举报

小黑屋|手机版|嘻皮客网 ( 京ICP备10218169号|京公网安备11010802013797  

GMT+8, 2024-4-27 10:30 , Processed in 0.199001 second(s), 24 queries , Gzip On.

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表