A-A+

dedecms教程简单使用八

2014年07月17日 PHP开源系统 评论 1 条 阅读 167 views 次

dedecms教程-采集

采集:采集是织梦的一个核心模块,这是用来采集文章的,对于普通的站点基本上用不着,主要针对一些小说之类的站点,在前期的时候没有内容,那么就可以使用织梦的采集功能,在互联网上采集大量的数据作为站点内容的补充,其中可以采集大量的文章和图片图集的内容,这里简单的介绍一下采集的管理和批量维护。

采集-采集管理:

采集节点管理:采集的节点就是采集的具体项目内容了,可以添加新的节点,添加新节点即是添加新的采集规则,只有设定好了采集的规则,才可以进行内容的采集,这里的采集规则就不具体讲了,添加好采集节点后,就可以在这里进行采集内容,导出数据等多项操作了。

临时内容管理:采集其它网站的内容都在这里了,先是作为一个临时源存在,可以看到每篇内容的所属节点,获取日期,以及是否已经下载等,将没有用的内容进行网址的删除,和内容的清空等。

导入采集规则:这个功能和添加节点是差不多的,这里只不过是将采集的内容规则放到了文本里面,在这里进行导入采集规则,其实这个规则我们一般都不会使用文本来写的,通常都是将老网站的采集规则内容进行导出,然后再从这里进行导入,一般新的采集规则都是通过 采集节点管理 里面的添加采集集点来实现的。

监控采集模式:其实就是用来检查采集内容是否能够正确进行采集,主要是针对所有节点的,当我们有相当多的节点时,就可以在这里进行批量的节点监测,而不必再去每个检查节点是否正确,里面选项进行默认即可,除了监测采集节点外,还可以对采集网址进行监测,当没有内容或规则不正确时,会有提示:获取到的网址为零:可能是规则不对或没发现新内容!这往往需要我们重新检查一下采集的规则了。。

采集未下载的内容:在临时内容管理栏目里,我们可以看到采集内容的状态,是否已经下载,而这个栏目里主要就是针对未下载的内容,也就是未入库的内容了,我们可以进行任务的执行,从临时内容管理处来监测所有未进行下载的内容,然后重新将其进行入库操作。

采集-批量维护:

批量维护其实是一个核心的内容,在 织梦-核心 模块里面已经出现过了,在夏日博客介绍dedecms教程核心模块里面有写到,这里就不再重复了,可以参考以前的xiariboke.net教程,有关于这个模块的介绍。。

标签:

1 条留言  访客:1 条  博主:0 条

  1. 爸爸狠爱妳

    织梦的采集功能是专门为做垃圾站准备的,正规的站点不可能用采集的功能,没必要学。

给我留言