DedeCMSV5.6 版自动采集功能规则使用基本知识讲解教程(一) 2011-05-05 17:09:01 来源: 作者: 【大 中 小】 浏览:5026 次 评论:0 条 ★★我要投稿★★ 将此页添加到网摘: DedeCMS 采集功能使用基本知识讲解 采集是指有着确定方向、明确目的的采撷和记录写作材料的一种活动。它主要指调查采访和查阅和搜集资料。采集最主要的作用在于为写作、分析、报表获取直接的和间接的材料。今天我们讲的采集主要是指网站采集,网站采集的概念主要是:程序按照指定的规则定向获取其他网站数据的一种方式,另一种简单的说法就是将 CTRL+C CTRL+V 程序化,系统化,自动化,智能化 DedeCMS 早期就已经加入了这个采集的功能,以前我们添加网站内容一般都是通过复制、粘贴、编辑然后再发布,这样对于少量的文章还是可以,但如果对于一个新站,什么内容都没有,那就需要复制粘提大量的文章,这是一个重复、枯燥的过程,内容采集就是解决这个问题,将这个重复的操作简化成规则,通过规则进行批量操作。 当然采集还可以通过一些专门的采集器来进行采集,国内比较出名的采集器有火车头。 今天我们这里以 DedeCMS 程序自带的采集功能来讲解如何使用采集,并介绍如何对采集的内容进行一些批量的管理。 首先我们进入系统后台,打开[采集]-[采集节点管理],在学习使用这个采集工能之前先介绍一些基本的技术知识。 首先我们需要知道 HTML 基本内容,我们知道浏览器中显示的各种各样的页面其实都是由最基本的HTML 组成的,我们可以在我们DedeCMS 系统后台发布一篇内容,然后对内容进行一些格式上面的设置。 也就是说我们的页面都是 HTML 代码经过浏览器解析后显示出来的,这些基本的HTML 代码是给机器看的,而解析出来显示的内容是给我们的用户看的,机器其实是一个死东西,他阅读网页不像用户一样,直接看到某一个部分的内容,机器能够看到的是某一部分代码。 DedeCMSV5.6 版自动采集功能规则使用基本知识讲解教程(二) 2011-05-05 17:09:01 来源: 作者: 【大 中 小】 浏览:5027 次 评论:0 条 ★★我要投稿★★ 将此页添加到网摘: 例如,我们查看一个网页:http://www.dedemo.cn/news/cms/2009/0304/791.html,我们很容易就看到这个文档的内容部分,如图中黄色区域。 我们的电脑是看不出来的,他不过判断显示出来的东西,他只会去解析代码,我们右键查看这个文件的源文件。 机器是阅读这些代码内容的,他只能看懂这部分...