DedeCMSV5
6 版自动采集功能规则使用基本知识讲解教程(一) 2011-05-05 17:09:01 来源: 作者: 【大 中 小】 浏览:5026 次 评论:0 条 ★★我要投稿★★ 将此页添加到网摘: DedeCMS 采集功能使用基本知识讲解 采集是指有着确定方向、明确目的的采撷和记录写作材料的一种活动
它主要指调查采访和查阅和搜集资料
采集最主要的作用在于为写作、分析、报表获取直接的和间接的材料
今天我们讲的采集主要是指网站采集,网站采集的概念主要是:程序按照指定的规则定向获取其他网站数据的一种方式,另一种简单的说法就是将 CTRL+C CTRL+V 程序化,系统化,自动化,智能化 DedeCMS 早期就已经加入了这个采集的功能,以前我们添加网站内容一般都是通过复制、粘贴、编辑然后再发布,这样对于少量的文章还是可以,但如果对于一个新站,什么内容都没有,那就需要复制粘提大量的文章,这是一个重复、枯燥的过程,内容采集就是解决这个问题,将这个重复的操作简化成规则,通过规则进行批量操作
当然采集还可以通过一些专门的采集器来进行采集,国内比较出名的采集器有火车头
今天我们这里以 DedeCMS 程序自带的采集功能来讲解如何使用采集,并介绍如何对采集的内容进行一些批量的管理
首先我们进入系统后台,打开[采集]-[采集节点管理],在学习使用这个采集工能之前先介绍一些基本的技术知识
首先我们需要知道 HTML 基本内容,我们知道浏览器中显示的各种各样的页面其实都是由最基本的HTML 组成的,我们可以在我们DedeCMS 系统后台发布一篇内容,然后对内容进行一些格式上面的设置
也就是说我们的页面都是 HTML 代码经过浏览器解析后显示出来的,这些基本的HTML 代码是给机器看的,而解析出来显示的内容是给我们的用户看的,机器其实是一个死东西,他阅读网页不像用户一样,直接