1. 网站地图
  2. 设为首页
  3. 关于我们


基于数据挖掘和系统集成的农业机械化 信息管理系统研究

发布时间:2023-04-24 11:22
目录
第一章绪论 1
1.1前言 1
1.2农业机械化管理的内容体系 2
1.2.1农业机械化的定义、内涵和作用 2
1.2.2农业机械化管理的理论和方法 4
1.2.3农业机械使用管理的结构分析 5
1.2.4农业机械化各管理层次的内容 6
1.3农业机械化管理的国内外研究综述 7
1.3.1社会经济战略层 : 7
1.3.2宏观管理组织层 8
1.3.3微观经营管理层 9
1.3.4机器运用技术层 9
1.4本文研究内容 11
1.5论文的创新点 13
参考文献 14
第二章 数据挖掘技术及其在农业机械化管理中的应用研究 18
2.1数据挖掘技术综述 18
2.1.1数据挖掘技术的产生与应用 18
2.1.2数据挖掘模式 20
2.1.3数据挖掘方法 22
2.1.4数据挖掘的步骤与工具 26
2.1.5小结 28
2.2基于粗糙集理论的组合预测方法研究 29
2.2.1弓 | 言 29
2.2.2组合预测方法分析 : 29
2.2.3粗糙集理论相关概念 30
2.2.4基于粗糙集理论的组合预测模型权系数确定步骤 32
2.2.5基于粗糙集的粮食产量组合预测模型 34
2.2.6小 结 38
2.3基于粗糙集和模糊聚类的农业机械化水平评价方法 39
2.3.1评价指标体系的建立 39
2.3.2评价指标和标准的计算与确定 41
2.3.3农业机械化水平评价指标权重的确定 43
2.3.4农业机械化发展水平的综合评价 45
2.3.5小 结 52
2.4农业机械总动力变化的灰色系统分析 52
2.4.1弓 I 言 52
2.4.2灰色系统理论相关概念 53
2.4.3农业机械总动力影响因素的灰色关联分析 56
2.4.4农业机械总动力的灰色预测 60
2.4.5小 结 63
2.5视情维修制拖拉机合理更新期计算方法 63
2.5.1弓 I 言 63
2.5.2拖拉机维修制度与更新期计算方法的回顾 64
2.5.3基于统计分析法的视情维修制拖拉机合理更新期计算方法 64
2.5.4小结 67
2.6农业机械化投资项目可行性研究的评价方法 68
2.6.1弓 I 言 68
2.6.2投资项目可行性研究评价方法概述 68
2.6.3风险型和不确定型投资项目的净现值{ENPV}分析法 70
2.6.4应用示例 73
2.6.5小结 73
参考文献 74
第三章农业机械化信息管理系统与系统集成 81
3.1信息系统集成 81
3.1.1信息系统集成的产生与必要性 81
3.1.2系统集成的定义、内容及特点 82
3.1.3系统集成的方法、层次与框架 85
3.2管理信息系统、决策支持系统和地理信息系统 87
3.2.1管理信息系统 87
3.2.2决策支持系统 88
3.2.3地理信息系统 90
3.3 MIS/DSS 与 GIS 集成模式 92
3.3.1松散型集成 93
3.3.2嵌入型集成 93
3.3.3链接型集成 95
3.4本章小结 95
参考文献 96
第四章 基于GIS的农业机械化信息管理与决策支持系统设计与实现 98
4.1系统总体结构设计 98
4.1.1系统分析 98
4.1.2系统设计 98
4.1.3系统实施 99
4.1.4系统评价 102
4.2系统数据库详细设计 103
4.2.1地理信息数据库 103
4.2.2农机信息数据库 104
4.2.3地理数据库与农机信息数据库的互访 105
4.3系统菜单和功能模块设计 105
4.3.1主控菜单设计 105
4.3.2功能模块设计 105
4.4基于MapInFO的GIS功能设计 106
4.4.1OLE Automation 技术 107
4.4.2GIS集成二次开发的实施 107
4.4.3在VB中集成Mapinfo的方法 108
4.5本章小结 113
参考文献 114
第五章系统应用与分析 115
5.1浙江省农业生产和农业机械化现状 115
5.1.1浙江省农业生产基本情况 115
5.1.2浙江省农业机械化发展现状 115
5.2应用系统的可视化功能 118
5.2.1空间数据对属性数据的查询 118
5.2.2农业机械化区域分类结果可视化 120
5.3浙江省农业机械化水平的总体评价与地区比较 120
5.3.1浙江省农业机械化水平的总体评价 120
5.3.2浙江省农业机械化水平的地区比较 122
5.4浙江省农业机械化发展的对策与建议 125
5.4.1农业机械化发展技术路线的选择 125
5.4.2农业机械化服务组织、管理制度和运行机制的联合创新 127
5.4.3促进农业机械化发展的政策建议 129
5.5本章小结 131
参考文献 132
第六章 结论与建议 133
6.1主要研究结论 133
6.2进一步研究建议 134
第一章绪论
1.1前言
2000年美国工程技术界评出了 20世纪对人类社会进步起巨大推动作用的20项工程技 术,其中,农业机械化列第7位。这一评价是基于一个世纪以来农业机械在农业生产中广泛 应用而引发的农业生产方式的根本变革,并大幅度地提高了土地产出率和农业劳动生产率, 有力地促进世界农业发展。20世纪世界人口从16亿增加到60亿,如果没有农业机械化的 发展,则无法保障这么多人口对食物的需求。与此同时,又促进了社会生产的分工,使许多 本应从事农业的人口能够从事其他重要工作,推动了工业和其他产业的发展,促进了世界经 济繁荣。一个农业现代化水平高度发达的国家,对农业机械化在社会经济发展中的作用和地 位给予如此高的评价,其成功经验非常值得许多尚未实现农业机械化的国家借鉴和参考。
新中国成立后,特别是改革开放以来,我国农业机械化事业有了巨大的发展,为发展农 村经济、实现小康做出了巨大贡献。在人类社会已跨入21世纪的今天,我国加入了 WTO, 进入全面建设小康社会、加快社会主义现代化进程的新的发展阶段,在经济全球化、国际竞 争日趋激烈的新形势下,本文以信息处理方法和手段为切入点,进行农业机械化管理领域一 些问题的研究,主要基于以下几方面的原因:
(1) 传统农业向现代农业的跨越需要农业机械化。综观世界农业的发展历史,按农业 劳动者掌握和利用的生产技能、生产工具和经济管理水平的演化大体上划分为古代农业、传 统农业和现代农业。传统农业与现代农业的本质区别就在于用什么样的劳动资料、怎样的生 产方式进行生产。目前,我国大部分农村地区相对落后,农业生产技术落后且更新速度慢。 农业生产以传统的生产方式为主,现代化的农业机械装备、技术等生产资料投入少,这也是 导致土地产出率和农业劳动生产率低、农产品竞争力弱、农民收入水平低的根本原因。可以 说,我国目前的农业正处在由传统农业向现代农业转变的阶段。因此,加强农业机械化的研 究与应用是实现农业现代化的关键。
(2) 农业产业结构调整需要农业机械化。改革开放以来,我国一直在调整农业产业结 构,经过20余年的努力,农业产业结构已经极大改善,其合理化程度有了明显提高,对发 展农业、增加农民收入、保证市场供给发挥了重要作用。但从目前来看,我国农业产业结构 仍然存在不少问题和矛盾,已不能适应当前国民经济发展对农业提出的新要求。随着城乡居 民生活的逐步提高,市场需求结构发生了很大变化,农业产业结构的缺陷也逐渐暴露出来, 主要表现在农业结构趋同现象严重,农业产业结构层次低,农业产业链不完整、农业比较效 益差,等等。农业机械化将现代工程技术与农业融合,能够实现应用前沿技术对农业的生产、 农产品加工、储运、流通以及农业资源环境等整个农业产业链、产业群进行改造和重构,从 而更加合理地配置农业资源,加快现代农业产业结构调整的进程。
(3) 农产品竞争力的提高需要农业机械化。目前,从总体上来说我国农产品的质量较 差、生产成本较高、国际竞争力弱。因此,要使农产品在国内外市场上取得竞争优势,必须 要在农业机械化技术的研究和应用上取得重大突破,促使先进的农业机械化技术能及时充分 地应用到农业生产中去,加速农业机械化技术向农业领域全面渗透,大幅度提高农业生产技 术的整体水平,从而实现农业生产力水平质的飞跃。只有不断提高我国的农业机械化技术水 平,在农业生产的关键技术环节达到世界先进水平,才能降低农产品生产成本、提高农产品 质量和科技含量,进而提高我国农产品的国际竞争力。
(4)农业机械化发展滞后和认识分歧己制约我国农业现代化进程。农业人口多、比重大, 农业生产方式落后等等,这些都是制约提高我国农业劳动生产率的因素。目前我国农业劳动 生产率只有发达国家的百分之几。可以说农业劳动生产率低下是导致我国农民收入低和农业 现代化水平低的根本原因。因此,需要通过大力发展农业机械化,在提高农业劳动生产率的 同时,釆取有效措施转移农村剩余劳动力,进而减少第一产业从业人员的比重。目前我国农 业正处于由传统农业向现代农业转变时期,由于长期以来社会各界对于农业机械化在发展农 业中的作用和地位的认识存在分歧,因而需要通过研究来解决发展农业中对农业机械化的认 识问题,以便形成正确认识来推进我国的农业机械化事业。
(5)农业机械化学科发展和建设的需要。农业机械化的实践需要有相应理论的指导才能 够顺利进行。我国是当今世界上农业人口最多、人均耕地面积少、农业综合生产能力较弱、 农民收入水平低、尚未实现农业现代化的农业大国,在这样的国情下发展农业机械化,目前 还面临着理论准备的不足。因此,作为农业机械化工作者有责任和使命来加强农业机械化领 域的理论研究,通过理论研究来解决农业机械化发展过程中出现各种的问题,进而推动我国 农业机械化事业和学科的发展。
因此,在上述背景条件下,加强农业机械化管理领域信息管理工作的研究,对提高农机 管理部门的科学决策水平,充分发挥农业机械化在加快推进现代化和提高我国农业生产水平 的作用,以及健全农业机械化宏观调控和微观指导,促进农业机械化的发展,具有十分重要 的理论意义和现实意义。
1.2农业机械化管理的内容体系
1.2.1农业机械化的定义、内涵和作用
1.农业机械化的定义与内涵
农业机械化是农业现代化的重要组成部分,是先进的农艺技术和生物技术实施的载体, 也是农业科技进步的重要表现。它不仅可以提高土地产出率和劳动生产率,而且是转移劳动 力、降低劳动者劳动强度、提高抗御自然灾害能力、增加农民收入和保证农产品质量的重要 手段,是促进农村产业结构调整和实现农业现代化的重要物质保障和技术支撑。
农业机械化有着广泛、复杂的内容,对农业机械化的定义曾有各种不同的提法,如农业 机械化是“用机器进行农业生产活动的过程”,农业机械化是“农业机器的设计、制造、鉴 定、推广、使用、维修、管理各环节的总称”,以及农业机械化“包括种植业、养殖业、加 工业,贯穿产前、产中、产后服务全过程”等等,这些提法阐述了农业机械化的不同特征、 不同方面,有助于说明不同问题,但作为反映本质的定文还不够确切。目前一般比较接受的 
定义是由我国著名的农业机械化学者余友泰教授提岀的,即农业机械化是用机器逐步代替 人、畜力进行农业生产的技术改造和经济发展的过程⑴。这个定义强调:一是实现农业生产 力的置换;二是经济发展与农村繁荣。二者相辅相成同步进行,农业生产力置换的过程,必 然引起经济增长和科学技术水平的不断提高,从而促进农业生产的发展。
农业机械化是一个用机器装备代替人力、畜力进行农业生产的技术改造和经济发展的过 程。包括种植业、养殖业、加工业机械化,贯穿产前、产中和产后全过程。农业机械化的目 的就是要用现代工程技术装备农业,实现农业的优质、高产、高效,保证农业的持续发展。
狭义农业机械化通常是指种植业生产过程中某个生产环节的作业机械化,或某种农业生 物产品以及某个农业部门的生产过程机械化,即运用各种动力机械和配套的作业机具替代 人、畜力和传统农具进行农业机械化生产作业。就范围而言,可分为种植业、畜牧业、林业 和渔业的机械化;就程度而言,可分为初步机械化、基本机械化、全过程机械化,以及农业 生产综合机械化,即某农业企业或某地区农业各生产环节的全面机械化。
广义农业机械化通常是指农、林、牧、渔各生产部门的生产实现机械化作业的过程。它 是根据各地区农村经济的发展需要逐步实现机械技术、生物技术与现代化管理技术的紧密结 合或融合,改变传统的生产方式而不断提高农业劳动生产率的动态过程。因此,农业机械化 既是一个技术发展过程,又是经济和社会发展过程。
随着农业现代化进程的深入,在不同阶段和不同社会经济环境下,农业机械化的概念与 内涵也有所变化,并表现出鲜明的时代特征。根据目前各种有关农业机械化领域的研究成果, 可以看出农业机械化具有以下几个特征【I】:
(1) 农业机械化是用机械动力逐步替代人畜力的发展过程;
(2) 农业机械化能降低劳动强度,改善生产环境,扩大生产规模;
(3) 农业机械化能显著提高农业劳动生产效率和土地产出率;
(4) 农业机械化贯穿于农业生产的产前、产中和产后全过程;
(5) 农业机械化的发展具有阶段性、区域性和不平衡性;
(6) 农业机械化的发展符合新陈代谢的规律;
(7) 农业机械化既是一个技术发展过程,又是经济和社会发展过程。
2.农业机械化的功能与作用〔"I
农业机械化作为农业生产系统的子系统,它与自然资源、人畜力、生物化学措施、资金 等生产要素,以及信息和政策一起输入到农业生产系统,通过一定的转换,实现农业生产系 统的产出。机械化生产过程中投入的农业机器,经营规模和发展速度等必须服务于增产增收 和“两高一优”的农业生产目标。这就决定了农业机械化在农业生产系统中的地位不是唯一 的,它是实现农业现代化的一种重要手段,而本身不是目的。
农业机械化在农业生产系统中的作用取决于它所具有的功能。所谓功能是指机器内在结 构所输出的各种能量属性。农业机械化的直接功能就在于提高农业劳动生产率、土地产出率 和资源利用率,改善农产品品质,并对农村产业结构调整、农业劳动力转移、农村经济的发 展乃至整个国民经济的发展都将产生重要影响。农业机械化的功能与作用可用图1 - 1描述。
 
图1 -1农业机械化系统的功能与作用
 
1.2.2农业机械化管理理论和方法3】
农业机械作为现代科学技术、生产经验和劳动技能相结合的产物,因而需要对其实施现 代化的管理,才能发挥农业机械的效能和提高其工作效率。从国内外农业机械化管理(Farm Machinery Management)理论和发展过程看,虽然农业机械化管理有其特殊的对象与领域, 但在解决问题的理论和方法,特别是现代化的农业机械化管理理论和方法,在很大程度上与 一般现代化的管理是相同的,或者是对现代化管理理论的发展和应用。
农业机械化管理就是按照客观规律要求,运用现代管理知识,合理组织农业机械进行农 业生产。其主要任务是运用各种技术、经济和行政手段,对农业机械化生产活动进行科学决 策和有效的计划、组织、指导和监督,做到全面规划,择优选购、合理配备、正确使用、安 全运行、精心维护、适时修理、计划更新,使农业机械在生产中处于良好的技术状态。
1、 农业机械化管理的内容
(1)农业机械化技术管理。从技术角度出发,采取一系列手段与方法,对农业机械实 施管理,使其性能在作业过程中能得到充分发挥,进而为农业生产的顺利进行提供物质保障。
(2)农业机械化经济管理。按照市场经济规律,通过对生产力诸要素的合理组织和生 产关系各方面的协调,发挥农业机械在农业生产中的作用,以较少投入获得较大产出。
2、 农业机械化管理的方法
农业机械化管理的方法是指为贯彻农业机械化管理思想和执行管理,以达到管理目标的 各种措施、手段、方法等总称。从内容上来看农业机械化管理的方法包括以下两个方面。
(1) 基本方法和手段。主要有行政方法、经济方法、法律手段、思想教育与精神激励 等方法。
(2) 技术方法。主要有管理数学、系统工程、信息论、控制论和计算机技术应用等学 科的理论与方法。
纵观国内外农业机械化管理的发展变化,可以发现现代管理理论和方法对农业机械化管 理有着重要影响,并与现代管理有着同样的发展趋势。具体表现为:
(1) 由定性管理向定性与定量相结合发展。借助运筹学、控制论和其它一些新近出现 的理论、方法和模型,解决农业机械化管理决策问题,由依靠经验的定性决策向科学定量决 策变化。如将线性或非线性规划方法用于制定机械作业计划、机器系统配备、经营规划等的 定量决策计算;排队论、随机模拟用于农业机械化供销服务系统、加工网点配置等计算、马 尔可夫过程用于机器更新的计算和市场预测;控制论用于作业过程优化控制计算等。
(2) 充分运用信息处理技术、随机模拟技术、系统仿真技术,强化系统分析能力,研 制开发一系列管理决策模型和信息系统。如农业机械化信息系统及计算机管理系统,将农业 机械化数据、信息和分析决策等融为一体,并朝着人工智能管理的方向发展。通过对机器作 业成本、作业时间、作业适时性损失的系统分析,建立机器-时间系统优化模型。
(3) 重视人群管理,发展行为科学。现代管理发展的一个普遍趋势是重视人的精神因 素,行为科学以及企业文化的研究,实质上就是从思想工作方面寻求提高工作效率的途径。 因而在满足农机工作者的物质需求的同时,还应从精神需求入手满足其需求。因此,通过思 想教育和精神激励等方式来挖掘和调动生产者的创作性和积极性。
1.2.3农业机械使用管理的结构分析〜勻
农业机械使用管理系统的结构是由农业机械使用管理目标所决定的,其目的是为了获得 使用的最佳经济效果,经济效果既是农业机械使用的核心,又是农业机械化管理的核心。围 绕这个核心所展开的一系列活动,就形成了一个有序的层次结构,即农机经营结构、配备结 构、组合结构、使用及工艺结构,各层次结构间的相互关系如图1-2所示。
 
图1-2农业机械经营结构
图中圆心表示农业机械使用的经济效果,则农业机械的使用方式与作业工艺结构是影响 经济效果的直接因素,最佳的使用与工艺结构依赖于最佳的组合结构,而最佳的组合结构又 依赖于最佳的配备结构,最佳的配备结构有赖于最佳的经营结构,而经营结构又必须适应外 部的社会经济条件和自然条件。
(1)农机经营结构。是指各种农业机械经营形式的比例关系。目前,我国的农业机械 经营形式是以户营为主,同时也存在其它经营形式。每一种经营形式都有其不同的特点和作 用。
(2)农业机械配备结构。指某一地区或某一个经营使用单位的农业机械其机型、配套 和数量之间的比例。合理确定农业机械配备结构是农业机械使用与管理过程中的一个重要环 节,对农业机械配备结构的基本要求是以最少的投入获得最佳的经济效果。
(3)农业机械组合结构。指作业过程中主机与作业机的组合形成的各式机组在完成农 艺有序作业时的合理匹配,其目的在于提高特定作业过程中整个机器系统的整体生产率和经 济效果。
(4)农业机械使用及作业工艺结构。指解决机械、劳动者和作业对象三者之间的协调。 这种协调过程体现在机器使用性能的发挥和作业的合理工艺过程上。后者包括机械与劳动者 间的协调和机械与劳动对象间的协调两个方面。
将农业机械的使用管理过程分为上述四个层次进行结构分析,目的是为了改善结构,进 而针对不同层次实施有效管理。虽然各个层次本身内部协调和各个层次之间的协调非常重 要,但最为重要的是农业机械使用管理全过程与更大范围的自然条件及社会经济条件之间的 协调。这种农业机械使用管理的结构层次就形成了农业机械化管理的工作内容层次。
1.2.4农业机械化各管理层次的内容
农业机械化管理工作具有广泛、复杂的内容,根据农业机械使用管理的结构分析,与之 相对应的农业机械化管理工作内容也因所处的层次、对象的不同而异。与上述农业机械使用 管理结构相对应,农业机械化管理工作内容可分为以下4个层次〜比
(1)社会经济战略研究层。主要研究解决农业机械的使用管理与自然条件及社会经济 条件之间的协调,即政府的行政主管部门或综合管理部门对农业机械化的作用与地位的研究 以及农业机械化发展速度和规模的研究。主管农业的行政领导和农村发展中心通过对农业机 械化与农村经济协调发展,农村劳动力转移与农业机械化关系,农村经济结构调整与农业机 械化优化等方面的研究,确定农村发展的工作重点与农业机械化的发展战略和方针。
(2)宏观管理组织层。主要对农业机械使用管理的经营结构层进行综合研究与管理。 在高层次农业机械化管理和研究部门,如农业部农业机械化管理司,省、市农业机械管理局, 农业机械化研究院(所)以及高等学校等研究如何发展农业机械化,制定战略、方针、政策 等。具体内容包括:农业机械化的区划、规划,制定农机科技攻关战略,机器生产及技术、 机具的引进规划,研究农业机械化生产模式、农业机械的经营形式、农业机械化社会化服务 体系建设、农业机械生产布局及更新政策等,并就上述各项内容向主管农业的行政领导提供 决策的信息。
(3)微观经营管理层。主要针对农业机械使用管理的配备结构和组合结构而进行。在 机务管理部门和具体的生产单位,如县以下的农业机械管理部门、农场、农业机械机务服务 站(队),农业机械制造厂、修理厂、农业机械供销公司等研究具体如何实施,如何获得更 好的经济效益。所从事的业务工作包括机器的配备和更新、生产计划的制定及调度、机器作 业工艺、种植制度和市场营销等。
(4)机器运用技术层。主要是指农业机械的具体使用及工艺结构层。从事农业机械化 工作的工程技术人员、农业机械驾驶操作人员等,他们的主要工作是如何使用、维修和保养 农业机械,通过对机器的合理使用、维修和保养,使其在机械化生产过程中发挥应有的功能, 提高使用的技术经济效果。
1.3农业机械化管理的国内外研究综述
1.3.1社会经济战略层
关于社会经济发展与农业机械化的研究,最早可追溯到19世纪卡尔•马克思、J.&Say. 等人的研究。进入20世纪后,有关农业机械化的研究,从内容上看,在世纪初到第二次世 界大战后期,主要发达国家在这一时期基本上都实现了农业机械化,期间研究重点集中在农 业机械化对提高劳动生产率、农村人口转移、促进社会工业化和增加农业总产出的作用和影 响等方面®7】;二次世界大战后至60年代,则是在总结已实现农业机械化国家的发展经验基 础上,重点研究发展中国家实现农业机械化的条件及其与社会经济发展关系,并主要以经济 学家的定性分析为主,定量研究仅限于一些简单的生产函数分析。到了 20世纪60年代以后, 由于系统工程理论和方法、计算机和信息处理技术在各个领域的广泛应用,以及经济学等学 科的发展,使得人们可以将农业机械化系统作为社会经济系统的一个子系统,定量分析农业 机械化在系统中的作用以及与其它子系统关系,进而揭示农业机械化与农村产业结构调整、 农村就业结构转型、农业现代化和工业化等重大社会经济问题的内在联系和相互作用,并从 宏观角度出发,构造更为全面的投资、就业和产业结构优化、投入与产岀关系模型,研究分 析农业机械化发展与农业劳动力转移、提高土地产出率和农业劳动生产率之间的相互关系 [8~12]«研究表明,农业机械化在替代人、畜力劳动,提高劳动生产率和土地生产率,增加农 业总产出和促进农业劳动力的转移等方面发挥了重要作用。如1880-1960年,农业机械化在 美国农业生产率增长的作用约在70%以上;而在美国的小麦生产中,大约劳动生产率增长的 60%来源于机械化,20%来源于生产位置向西部转移,其余20%来源于土地单产的变化以及 各因素相互影响的作用。另外,在发达国家与发展中国家之间农业劳动生产率比较研究表明, 二者之间差别的30%是由于化肥和机械投入的差别造成的。
近年来,国内有关农业机械化在农村经济发展中作用的研究主要集中在农业机械化对增 加农业产出、提高农民收入、促进农业现代化、农业产业化,以及提高农业国际竞争力等方 面的作用等几个方面[13'191« —方面,通过构建各种测算模型,研究分析农业机械化对增加 农业产出的贡献率,测算结果表明,目前国内许多地区农业机械化对农业产出的贡献率大约 在20%左右,同时农业机械化对增加农业产出的贡献将经历一个由小到大,再由大到小的变 化过程;另一方面,通过理论研究与实证分析表明农业机械化是增加农民收入、加速农业现 代化和农业产业化,以及提高农业竞争力的关键因素,农业机械化水平高低不仅影响农业现 代化和农业产业化的进程,还将决定农民收入的高低和农业竞争力的强弱等。
1.3.2宏观管理组织层
为了发挥农业机械化在农业生产和社会经济发展中的作用,必须制定相关的战略、方针 和政策以促进农业机械化的发展。国内外的科研机构和高校对此开展了一系列的研究。如欧 洲的法国、俄罗斯,亚洲的日本、韩国等许多国家为了促进本国农业机械化的发展,制定了 相应的农机化发展促进法[绚。
我国在系统分析和研究影响农业机械化发展诸因素的基础上,编写了“中国农业机械化 区划”,利用主导因素分析法将全国划分为九个一级区和38个二级区01。并根据农业机械 化区划结果,结合各地的社会经济条件,自然资源和生产实际,借助运筹学中的数学规划和 预测、决策方法制定农业机械化发展规划[22],确定在一定时期内所要达到的指标和进度、 比例关系、机器型号和投放量以及各项实施措施等。
农村经济体制改革后形成了土地家庭分散经营,要将农户分散经营的生产全过程纳入社 会化大生产协作体系,建立和完善农机化服务体系是关键,同时也是农村生产力发展的客观 要求。为此,围绕建立和健全农机化社会化服务体系的必要性、意义和内容,并将其纳入农 村经济发展这个大系统中来分析研究农机化社会化服务体系的组织形式及运行的动力和调 控机制心。
农业机械化水平是对机器在农业生产过程中使用程度、作用大小和使用效果的一种表述 和度量。科学评价农业机械化水平是正确认识农业机械化所处阶段和定量分析地域性差异因 素对农业机械化发展影响的前提,是制定农业机械化发展政策和因地制宜指导农机化发展的 科学依据。对于农业机械化水平评价方面的研究,一般是建立农业机械化发展水平评价指标 体系,然后利用层次分析法、专家评分法、综合指数法和神经网络等方法来评价某一地区在 某一时农业机械化的发展水平UH%在此基础上,分析农业机械化发展所处阶段,各个阶 段的特征以及实现阶段跨越的条件等di。而有关农业机械化水平地区分类,则主要通过建 立分类模型研究地域性差异因素对农业机械化发展影响珂,分析各类之间的差异和从时 序的角度考察各类型的动态变化规律。
农机产品质量评价是农机产品推广的重要环节。对于农机产品的质量或性能的评价目前 大都是从农机产品的现行标准岀发,建立一套评价指标体系,然后利用层次分析法或模糊综 合评价法对农机产品的质量做出评价
以计算机、信息处理技术为基础的管理信息系统的出现,为农机部门的管理工作提供了 一种新的手段。研制出的农机安全监理系统和农机化信息管理系统°F,不仅提高了信息 的收集、整理、存储、加工和检索、存储和分析的效率,还可利用系统中的统计分析模型和 优化模型对收集的数据作进一步处理,为各级农机管理部门和有关部门指导农业生产和制定 农业机械化的发展政策,提供有效的决策信息,尤其是近年来,将网络通讯技术、多媒体技 术和决策分析方法、模型库及人机交互技术引入到农机管理部门的信息管理系统中⑷⑷】, 使得农机管理部门的管理和决策水平有了进一步的提高。
1.3.3微观经营管理层
微观经营管理层主要涉及具体的生产和经营单位,如农场、农机供销公司。有关该层次 的研究主要有几个方面:
从微观生产经营过程出发,利用线性规划、非线性规划和系统仿真模型研究农业企业或 区域的机具配备、机群结构、耕作制度和作物布局的优化和生产作业计划制定等问题""4】, 以解决生产单位中如何安排生产,合理分配生产能力、作业时间和生产资源等问题,如普渡 (Purdue)大学研制的管理信息系统“CROP BUDGET”(农事预算),为农户制定机械化经 营规划服务,如:作物产后处理(清选、烘干、粗加工)的工艺流程及规范的制定,控制程 序的编制;植保作业工艺方案的制定(药物选用、施用量、喷洒方式、喷洒时间);灌溉计 划的编制(灌水次数、灌水时间、灌水量)。
农业机器的发展应该与农业生产技术的要求相适应。随着农业生产技术的发展,农业机 器的功能也将不断完善。农业机器使用年限的增加,不仅会增加其维修、油料等费用,而且 也会降低作业的数量和质量。因此,加强农业机器寿命的研究,才能确保农业机器适时更新 换代和取得最佳的经济效益。由于各国经济条件和技术水平的差异,目前有关农业机器寿命 的研究国内主要集中在机器经济寿命(或称为最佳更新期)的计算方法上,而国外则集中于 农业机器的技术寿命研究。有关农业机器经济寿命的计算方法,按照追求的目标来划分,可 分为3类,分别为费用最小法〔冬呵、收益最大法和相对收益率法[57~5%在费用最小法中, 按是否考虑货币的时间价值,又可分为静态年均费用最小法和动态年均费用最小法;在平均 单位工作量费用最小法中,按是否考虑货币的时间价值,亦可分为静态平均单位工作量费用 最小法和动态平均单位工作量费用最小法。在收益最大法中,按是否考虑货币的时间价值, 可分为静态年均收益最大法和动态年均收益最大法。在相对收益率法中,只有一种方法,即 新MAPI法。
研制开发以数据库和模型库为主要内容的信息处理系统,满足生产经营单位遇到的生产 决策和经营管理等方面的咨询服务是当今农业机械化管理领域的一个重要方面。从20世纪 60年代起,美国、英国、匈牙利、比利时、日本等一些发达国家中的大学的农业工程系、 农业经济系以及一些信息咨询服务中心等,就开始研究与开发农业机械化的农机管理系统软 件。从研究开发的内容来看,主要涉及农业生产过程的农业机械化管理,农业(农机)服务 的信息咨询、农机供销、仓库管理、物质调运,以及农业机械维修等方面,以满足农户在生 产过程中所需的各种信息和管理决策需求。如美国的Deree International Chalmers等农机公 司应用建立起来的农业机械销售管理信息系统为顾客提供购买机械咨询服务,帮助顾客选择 机型、数量等,以推销农机产品。
13.4机器运用技术层
为了维持农业机械良好的技术状态,使其在机械化生产过程中发挥应有的功能,提高使 用的技术经济效果,从事农业机械化工作的工程技术人员和科研人员为此在机械设备状态检 测、机械设备故障诊断和机械设备修理工艺等方面进行了大量的研究工作,尤其是在机械设 备故障诊断方面取得了许多研究成果。这些研究成果对及时、正确地判断农机设备的各种异 常状态、预防和消除故障,提高农业机器运行的可靠性、安全性和有效性,以及在允许条件 下充分挖掘机器设备潜力,延长在役期限和使用寿命,降低设备全寿命周期费用等方面起到 了积极作用。
在机械设备状态检测方面,20世纪40年代就研制出了以故障诊断和性能测试为主的单 项检测技术,随着传感器测试技术、计算机技术、故障诊断理论、人工智能和网络技术的快 速发展,检测控制和数据处理自动化,检测结果直接打印的现代综合检测诊断技术相继出现。 如西南农业大学研制的“农用拖拉机汽车技术状态检测评定专家系统TEFP”是供检测评定 拖拉机汽车技术状态使用的人工智能系统。该系统主要根据农用拖拉机、汽车技术状态监测 评定指标体系的项目规定,进行各检测项目数据的采集和处理。它将自动检测、处理、保存 检测数据和评定结果,并能对评定结果作出解释。系统所用评定指标可以人为修改以适应不 同情况,如地区差别、时间差别等。这些设备状态检测技术对于预防农机故障发生、减少停 机时间和提高作业质量发挥了重要作用。
在机械故障诊断技术方面,有关故障诊断方法的研究内容可以分为基于数学模型和基于 人工智能两类方法。前者有基于状态估计和基于过程参数估计等方法㈤宀】;后者基于案例、 神经网络、模糊数学、灰色关联度、故障树、信息集成技术和专家系统等方法〔*70],其中 信息集成技术也称为数据融合技术,主要有Bayse推理、Kalman滤波、D-S推理和模糊数 学等。利用这些故障诊断理论和方法研制成功的故障诊断系统,能够比较准确地诊断出汽车、 拖拉机发动机各部分的故障,并给出相应的故障排除方法与措施。如美国通用电器公司推出 的内燃机车故障排除专家系统DELTA,使用时,该系统屏幕首先显示可能的大致故障范围, 当用户根据故障症状选定某一特定区域时,系统再向用户询问一系列详细问题,同时解释每 一步推理步骤,直到查明故障原因,必要时给出修理指导并演示有关操作步骤。又如河北农 业大学研制的“发动机故障诊断专家系统EFDES”。该系统在计算机上用Turbo-Prolog实现 的汽车拖拉机发动机故障诊断专家系统,釆用先进的黑板-框架结构知识表示、双向综合推 理策略、双可信度传递和比较完善的规范化知识库,能比较准确地诊断出拖拉机发动机各部 分的故障。西安公路学院研制的“柴油机燃油供给系不解体故障诊断系统”从柴油机燃油供 给常见故障岀发的实际出发,根据柴油机运用和修理的需要以及柴油机燃油供给系不解体故 障诊断技术的研究,通过对相关数据处理和选择适合燃料供给系故障诊断数学模型,实现柴 油机燃油供给系的故障诊断。
在上述农业机械化管理的四个层次中,研究工作中所涉及的信息处理主要基于字符的信 息,而常见的信息中约有80%以上的信息含有空间信息⑺】。农业机械化是一项地域空间性 很强的工程,因而将以空间信息处理为主要内容的地理信息系统(Geographical Information System,简称GIS)融入农业机械化管理工作,必将在多方面增强农机化信息管理系统的功 能,进而提升农机部门的管理现代化程度。
地理信息系统G1S以地理空间数据库为基础,在计算机软、硬件技术支持下,用于采 集、存储、管理、检索和综合分析整个或部分地球表面(包括大气层在内)与空间和地理分 布有关数据的空间信息系统"I。它由一些计算机程序和各种地学信息数据组成现实空间信 息模型(即将地学信息抽象后,组成便于计算机中表达的空间信息模型)。通过这些模型, 可以用可视化的方式对各种空间对象进行定性和定量的模拟与分析。与其他信息系统相比, GIS具有以下三个方面特征:(1)具有釆集、管理、分析和输出多种地理空间信息的能力;
(2)以地理模型方法为手段,具有空间分析、多要素综合分析和动态预测能力;(3)由计 算机系统支持空间地理数据管理,使其能够快速、精确、综合地对复杂的地理系统进行空间 定位和动态分析。正因为上述三方面的特征,GIS又被称为GMISo
目前,GIS已被广泛用于农业区划、土壤适宜性评价、农业气象研究、作物种植的适应 性、农业资源的清查、核算、评估与监测、农作物估产和监测、农业生态环境监测和分析、 精细农业等农业生产、管理中⑴]。在农业机械化领域,有关G1S的应用研究主要有两方面: 一是GIS作为精细农业技术体系的重要组成部分,在生产过程中接收作业机器系统中的各 类传感器(变量耕地实时传感器、变量施肥实时传感器、变量栽种实时传感器、变量中耕实 时传感器等)及监测系统(遥感、飞机照相等)的信息,并对这些数据进行组织、统计分析, 做出决策,进而通过计算机控制变量执行设备,实现机械投入量或作业量的调整[7476〕;二 是在农业机械化管理中,将不同地区的农机化发展水平及其影响因素地图化,分析其空间分 布规律[77~78[。从研究的总体情况看,目前大多数都集中于前者,而涉及后者的还比较少。
随着计算机科学技术的飞速发展和广泛应用,农机化管理部门除了要开发自己的管理信 息系统外,还要面向高层次、战略性、大范围的决策问题,以及非结构化、半结构化的信息 处理问题,应用决策分析方法、数据库及人机交互技术,开发农业机械化管理决策支持系统, 继而是农机化管理部门的管理向着智能化、集成化方向发展。
从我国以及西方发达国家的农业机械化发展过程看,农业机械化信息管理为充分发挥 农业机械化作用提供了重要保证。农业机械化信息反应了与农业机械化发展相关的各项因素 状态和特征,是农业机械化事业发展的重要资源,是决策科学化和管理现代化的有力保障。 因此,建立和健全农业机械化信息管理是当前农业机械化工作的重要任务。当代社会是一个 信息爆炸的时代,从众多信息中鉴别出有用信息加以利用更是各行各业都关心的一项课题。 能否经济有效地利用农业机械化信息,并从现有的一些数据中提取有用规则是农业机械化管 理机构管理水平高低的标志之一。充分利用信息技术加强农业机械化信息管理成为各地区农 业机械化发展一个重要课题。运用计算机技术建立一个快速有效的信息收集系统和一个功能 良好的信息处理系统是农机化管理部门实现现代化管理的重要标志。
1.4本文研究内容
本文以提高农业机械化管理决策水平为研究目标,在分析国内外农业机械化管理领域 现状的基础上,利用农业机械化、管理科学、数据挖掘技术、系统集成技术、地理信息系统 (GIS)、管理信息系统(MIS)、决策支持系统(DSS)、系统工程、计算机软件等多学科的 理论和方法,来解决农业机械化管理决策过程中信息管理的有关问题。
论文的主要研究内容包括以下几个方面:
(1)在分析我国加入WTO后,农业发展面临新的挑战下研究发展农业机械化意义的基础 上,系统地概述了农业机械使用管理的层次及农业机械化管理各个层次所对应的工作内容, 在此基础上对国内外围绕上述农业机械化管理决策所做的研究工作进行综述,据此提出本文 的研究内容。
(2)针对目前我国农业机械化管理领域中产生的大量数据的现状,将数据挖掘——这一 崭新的数据处理技术引入农业机械化管理领域,以实现对激增的数据进行更高层次的分析, 进而从数据中提取重要信息或者知识为决策服务。为此,对数据挖掘的各种模式、方法和数 据挖掘的实施步骤进行了分析,为解决各类问题合理选择数据挖掘方法提供了依据。
(3)对农业机械化管理工作的第二层次即宏观管理组织层中遇到的如农业机械化发展水 平评价、预测问题,通过利用数据挖掘中的一些主流方法,如粗糙集和模糊聚类等方法,以 及这些方法的组合,对这些问题做了更进一步的研究与探讨,具体内容包括:
①利用粗糙集理论中的属性依赖度和重要度等概念研究了组合预测模型中的权重确 定方法。通过建立预测方法与预测对象的关系数据模型,离散化属性数据建立知识表达系统, 进而计算出各预测模型对预测对象的依赖性和重要性以及组合预测模型中单个模型的权系 数。然后依据浙江省粮食总产量的历史数据建立基于粗糙集的粮食产量组合预测模型。
②针对现行农业机械化发展水平评估方法中存在的主观因素对评价结果的影响,把模 糊聚类方法和粗糙集理论相结合,提出了基于模糊聚类和粗糙集的农业机械化水平评价方 法。该方法从评价指标的统计数据出发,根据各指标中含信息量的大小来确定其相应的权重。
③鉴于目前有关农业机械总动力的研究主要停留在对总量变化进行预测的现状,在系 统分析影响农业机械总动力发展变化因素的基础上,利用灰色系统理论中的关联系数和关联 度方法对影响浙江省农机总动力变化的因素进行了关联分析,同时利用灰色系统理论中的 GM (1, 1)模型对农业机械总动力的变化趋势进行了预测。
(4)对农业机械化管理工作的第三层次即微观经营组织层中遇到的如农业机器的更新决 策、农业机械化项目可行性的研究等问题,也做了进一步的研究与探讨,具体内容包括:
①利用农业机器生产管理学和统计学原理,给岀了视情维修制拖拉机大修理周期间距、 修理周期与更新界限的数学模型,并对此计算方法从拖拉机所有者追求经济效益最大化的角 度,分析了视情维修制拖拉机最佳更新期与合理更新期的经济界限。
②针对现行农业机械化项目可行性研究中的净现值法CNPV)在使用过程中存在的对 外界环境变化适应性弱的问题,利用风险决策理论对现有的净现值评价模型进行改进和完 善,并给出了风险型和不确定型投资项目的净现值(EMT)分析模型。
(5)目前在农机管理部门中的各种信息处理系统主要使用基于字符的信息,而常见的信 息中约有80%以上含有空间属性信息。为了实现具有空间分析功能的GIS与传统的信息管 理系统的结合,应用系统集成技术对GIS与目前信息处理系统中模型结合的各种方式的特 点进行了详细分析,为实现各种信息系统有机集成,确定合理方案提供了参考。
(6) 运用系统集成技术,以VB为主要开发工具、Mapinfo Professional 7.0为地理信息 平台,结合Microsoft ACCESS 8.0数据库,设计开发了基于GIS的农业机械化信息管理与决 策支持系统,该系统不仅具有传统MIS/DSS的功能,还具有GIS的空间信息分析和数据处 理结果地图化的功能。
(7) 依据本文建立的农业机械化发展水平评价模型对浙江省及其所属的69个县(市) 的农业机械化发展水平进行了总体评价与地区比较。然后,利用集成系统中的GIS功能子 系统将上述各地区的评价结果及其影响因素生成相应的专题地图,据此分析了浙江省农业机 械化发展水平及其影响因素的空间分布规律,并对各类地区的农业机械化发展提出了相应的 措施与建议。
1.5论文的创新点
本文在整个研究过程中有以下几个创新点:
(1) 将粗糙集理论和模糊聚类方法相结合,首次提出了基于模糊聚类和粗糙集的农业 机械化水平评价方法。该方法从评价指标的统计数据出发,根据各指标中包含信息量的大小 来确定其相应的权重,使得评价结果更具相对客观性。实例表明,评价结果与实际情况有较 好的一致性。为分析农业机械化发展水平评价指标体系中各指标的内在规律提供了一种新方 法,并对其他多指标系统的评价具有参考应用价值。
(2) 利用系统分析方法,考虑经济、技术和社会条件,系统地分析了影响农业机械总 动力变化的因素,并首次利用灰色系统理论中关联系数和关联度方法对影响农业机械总动力 的因素进行了关联分析,从而揭示了各种相关因素对农业机械总动力变化的影响,为正确认 识农业机械总动力的宏观发展特征提供科学依据。
(3) 利用农业器生产管理学和统计学原理,首次给出了视情维修制拖拉机大修理周 期间距、修理周期与更新界限的数学模型,并对此计算方法从拖拉机所有者追求经济效益最 大化的角度,分析了视情维修制拖拉机最佳更新期与合理更新期的经济界限。与现行换件制 和定期大修制更新期计算方法相比,利用该方法确定拖拉机的更新期更符合拖拉机技术状态 变化和零件磨损的规律。
(4)利用系统集成技术开发了一个基于GIS的农业机械化信息管理和辅助决策支持系 统。该系统不仅具有传统MIS/DSS的统计分析、预测和辅助决策等功能,而且还具有GIS 的空间信息分析和数据处理结果地图化的功能。此外,系统具有较好的扩展性,可以通过增 加功能模块的方式,来满足农机管理部门中不断变化的需求。
参考文献
[1]余友泰.农业机械化工程[M].北京:中国展望出版社,1987.
[2]戴有忠.农业机械化工程[M].哈尔滨:东北农业大学出版社,1996.
[3]杨敏丽.中国农业机械化与农业国际竞争力[M].北京:中国农业科学技术出版社.2003.
[4]邱立春,李冠峰.农业机械化管理学[M].长春:吉林科学技术出版社,2000.
[5]高焕文.高等农业机械化管理学[M).北京:中国农业大学出版社,199&
[6]H. W. Quaintance. The Influence of Agricultural Farm Machinery on Production and Labor[M], New York, 1941.
[7]John D. Black. Agricultural Reform in United Stated[M]. New York and London, 1927.
[8]Pawlak, J. The Impact of Agricultural Mechanization on Labor Productivity in 22 Developed
Countries[J]. American Society of Agricultural Engineers, 1986.
[9]Prasad, J., Srivastava, J. S. Impact of Agricultural Mechanization on Production, Productivity, Income and Employment Generation卩].Agricultural Engineering Today, 1991/1992.
[10]傅泽田.农村产业结构调整与农业机械化发展的协调关系分析[D].北京农业工程大学 博士学位论文,1987.
[11]万鹤群.农村经济结构调整与农业机械化优化[M].北京:北京科学技术出版社,1992.
[12]张冬平,史国栋,陈俊国.农业机械化对农业剩余劳动力的影响(J].农业机械学报,1996, 27 (4) :1~6,
[13]程智强,杨邦杰,贾栓祥.南方沿海发达地区农业机械化贡献率分析[J].农业现代化研 究,2002,23(1):72-75.
[14]杨青,朱瑞祥,张捷,等.陕西省农业机械化对农业生产贡献率的研究[J].农业工程学报, 2000,16(6):64-67.
[15]魏宏安,邵世禄,黄颜彪.甘肃省农业机械化对农业生产贡献率的研究[J].农业机械学 报,2002,33(1):135〜137.
[16]高连兴,刘凤丽,吕子湖,等.东北农业机械化特点及其对种植业纯收益的贡献率[J].农 业工程学报,2001,17(6):56-59.
[17]白人朴等.中国农业机械化与现代化[M].中国农业科学技术岀版社.2002.
[18]杨敏丽,白人朴.农业机械化与农业国际竞争力的关系研究卩].中国农机化, 2004(6):3-9.
[19]白人朴.农业机械化与农民增收[J].农业机械学报,2004, 35(4): 179〜182.
[20]农业部农业机械化管理司.外国农业机械化政策选编[M].北京:中国农业出版社, 1999.
[21]《中国农业机械化区划》编写组.中国农业机械化区划[M].北京:农业出版社,1985.
[22]陈忠慧.农业机器运用管理学[M].北京:中国农业岀版社,1991.
[23]孟繁琪.关于建设农机化服务体系思路卩].农业经济问题.1991 (6) :25~29,
[24]李晓红.农机化社会化服务体系模式研究.北京农业工程大学学位论文[D], 1992.
[25] 李炳军,朱永达,万鹤群.农业机械化发展水平的概率一灰色评估方法及应用卩]・农业 工程学报,1997,13 (3) :21〜26.
[26] 郑文钟,何勇.浙江省农业机械化水平评价方法及应用研究[几浙江大学学报(农业与
生命科学版),2001,27 (2) , 191-194.
[27] 楼文高,王延政.农业机械化发展水平的人工神经网络评价模型[几农业机械学报, 2003, 34 (3) :58〜61.
[28] 何勇,冯雷,吴春霞.基于粗糙集与神经网络的农机化发展水平评估方法[J].农业机械
学报,2004,35 (1) : 100-103.
[29] 杨敏丽.我国农业机械化发展的阶段性[几中国农业大学学报,199& 3 (4) :11〜15.
[30] 杨敏丽,白人朴.我国农业机械化发展的区域不平衡性研究[J].农业工程学报,2000, 16
(4) :86~72.
[31] 白人朴,田志宏.我国各地农机化发展水平中的一种有序样本分类方法卩].中国农业大 学学报.1999,4 (6) :1〜5.
[32] 白人朴,杨敏丽,刘清水.中国农业机械化发展水平地区分类研究[J].中国农机化, 1999,3:24-27.
[33] 陈为.农机产品设计质量模糊综合评价方法的硏究[几农业机械学报,1999, 30 (1) :97~100,
[34] 叶继昌,王登峰,杨印生等.农业机械性能评价及选型专家系统的设计[J].农业机械学 报,1995,26 (1) :11 〜14.
[35] 刘大维,杨印生等.层次分析法在拖拉机总体性能评价中的应用[几农业机械学报,
1994, 25 (1) : 96-99.
[36] 鲍一丹,何勇.农业机械多媒体决策支持系统的研究[J].浙江大学学报(农业与生命科
学版),2001,27 (2) : 187-190.
[37] 何勇,郑文钟,奚文斌农机安全管理技术与装备[M}.北京:地震出版社,2002.
[38] 邱立春.农机化管理信息系统数据库设计[J].农机化研究,1991,(2):31-36.
[39] 何勇,鲍一丹.农业机械化数据库管理系统的研究[J].科技通报,1995,11 (3) :147~152,
[40] 张玉宝,朱瑞祥,刘淑珍.农业机械化管理信息系统的研究与开发[J].农机化研究, 2002,11.61 〜63.
[41] 张毅,朱瑞祥,张玉宝.基于广域网的农业机械化管理信息系统设计[J].农机化研究, 2003,7.170-172.
[42] 晏国生等.计算机在农机化管理中的应用[M].北京:清华大学出版社,199&
[43] J.N. Scarborough and D. R. Hunt. Optimization of field parameters Using Powell*s Constrained Minimization Algorithm卩].ASAE, 1977.214—217.
[44] D. Singh. Field Machinery System Modeling and Equipment for Selected Michigan Cash Crop Production System. A dissertation for the degree of doctor of philosophy[D], Department of Agricultural Engineering. Michigan University, 1987.
[45]Link, D. A. A System Approach to Farm Machinery Selection [J]. ASAE, 1965.
[46]Link, D. A. Activity Network Techniques Applied to Farm Selection Problem [J]. ASAE, 1967.
[47]File, L.S. Approach to the Selection of Optimum Combination of Power and Machinery[M]. 田M Agricultural Symposium, Endicott, New York, 1963.
[48]Hunt D R. Farm Power and Machinery Management[M]. 9th ed. Iowa Press, 1995.
[49]韩宽襟,冯云田,高焕文.农业机器配备非线性规划的完善及其序列规划逼近算法卩]. 北京农业工程大学学报.1990,10(2):1〜&
[50]张东兴,高焕文.一个确定机器可下地概率的实用模型[几北京农业工程大学学 报.1990,10(4):7〜15..
[51]韩宽襟,万鹤群,高焕文.我国农业机器配备的特点及典型模型研究[J].北京农业工程 大学学报.1990,10⑷:14.
[52]高焕文.流水作业法与机器系统优化[几农业机械学报.1992,23(4):55〜60.
[53]韩宽襟,高焕文.微机用农业机器作业系统优化大型软件系统FMS的研制卩]•农业工程 学报.1991,7(1):2436.
[54]徐丽明,高焕文.山东小麦玉米两茬套作和平作研究[几北京农业工程大学学 扌艮 1994,14(3):5459.
[55]Hunt D.R. Farm Power and Machinery Management[M]. 8th ed, the Iowa State University
Press, Ames, 1983.
[56]王耀发.拖拉机经济服务年限的动态计算[J].北京农业工程大学学报.1988 (4).
[57]王福林 代耕型拖拉机最佳更新期计算问题的研究[几 农机化研究.1992 (1) :1419.
[58]樊文正.拖拉机更新选型的经济合理性分析[J].现代化农业.1991 (8) .8〜10.
[59]Aldemir,T; Rizzoni. GA model-based probabilistic approach for fault detection and identification with application to the diagnosis of automotive engines. Automatic Control, IEEE Transaction on, Volume:44,Issue: 11, Nov,1999. Pages:2200~2220.
[60]Mattias Nyberg. Using hypothesis testing flieory to evaluate principles for leakage diagnosis of automotive 切gines. Control Engineering Practice, Volume 11, Issue 11, November 2003, Pages 1263-1272.
[61]R.Conatser, J.Wagner, S.Ganta and I.Walkar. Diagnosis of automotive electronic throttle control systems, Control Engineering Practice, Volume 12, Issue 1, January 2004, Pages 23 〜30.
[62]Bo-Suk Yang, Tian han and Yong-Su Kim. Integration of ART-Kohonen neural network and case-based reasoning for intelligent fault diagnosis, Expert Systms with Applications, Volume 26, Issue 3, April 2004, Pag饶 325-341.
[63]Yiannis Papadopoulos. Mosel-based system monitoring and diagnosis of failures using state charts and fault trees, Reliability Engineering & System Safety, Volume 81, Issue 3,
September 2003, Pages 325〜341.
[64]S.-L. Jamsa-Jounela, M. Vennasvuori, P. Enden and S. Haavisto. Aprocess monitoring system based on the Kohonen sei仁organizing maps, Control Engineering Practice, Volume 11, Issue 1, January 2003, Pages 83〜92.
[65]A. H. Mohamed, F. A. Mohamed, A. M. Nassar and M. H. El-Fouly. Case-functional-based diagnostic(CFDS), Engineering Applications of Artificial Intelligence, Volume 15, Issue 5, September 2002, Pages 501 〜509.
[66]李树涛,王耀南,毛建旭.基于多神经网络分类器组合的火焰图像分割卩].数据采集与 处理,2000,12 (4) :443~446.
[67]何勇,鲍一丹.基于神经网络的发动机故障多媒体诊断专家系统[J].内燃机学报, 2001,19 (3) : 245-24&
[68]凌卫新,郑启伦,陈琼.并行协作模块化神经网络体系结构卩].北京邮电大学学报, 2002,25 (2) :14~17.
[69]Lacher R C. Back-Propagation Learning in Expert Networks. IEEE Transaction on Neural
Networks. 1992, 1 (3):62〜72.
[70]S.Timo and N.K.Heikki. Neural Networks in Process Fault Diagnosis. IEEE Transaction on SMC, Vol.21, No.4, pp815-825, 1991.
[71]汤国安,陈正江,赵牡丹,等.ArcView地理信息系统空间分析方法[M].北京:科学出版 社,2002.
[72]何勇等编著.精细农业[M].杭州:浙江大学出版社,2003.
[73]褚庆全,李林.地理信息系统(GIS)在农业上的应用及其发展趋势卩].中国农业科技导 报.2003, Vol.5 (1) 21 〜26.
[74]Wang N., Zhang N., Dowell F.E. etc..2001. Design of an optical weed sensor using plant spectral characteristics^]. Transaction of the ASAE 2001,44(2), 409~419.
[75]Tian L., Reid J.F., Hummel J.W. 1999. Development of a precision sprayer for site-specific
weed management[J], Transaction of the ASAE 1999,42(4), 893-900.
[76]王长耀,牛铮,唐华俊.对地观测技术与精细农业[M].北京:科学技术出版社.2001.
[77]郑文钟,何勇.基于GIS的浙江省农业机械化发展水平的地区比较[J].浙江大学学报
(农业与生命科学版)2004, 27 (2) :191〜194.
[78]何勇,谈黎虹,葛晓锋.基于GIS的农机化发展水平区域划分系统的研究[J].农业工程
学报,2003 ,5.19(3): 129-131.
第二章数据挖掘技术及其在农业机械化管理中的
应用研究
如前所述,农业机械化的管理内容因所处层次而异,这也说明农业机械化的管理决策 工作是一项复杂的系统工程。随着我国农业机械化事业的快速发展,在农业机械化管理领域 产生了大量的数据,激增的数据背后隐藏着许多重要信息。因此,要科学、合理地解决农业 机械化管理工作中遇到各种的实际问题,必然会涉及到一系列的理论和方法。而加强农业机 械化管理领域中定量分析方法的研究是提高农机管理部门决策水平的一个重要方面,也是促 进农业机械化管理决策现代化、科学化的一项重要内容。鉴于此,本章将利用近年来岀现的 信息处理方法——数据挖掘技术对农业机械化领域的宏观管理组织层和微观经营管理层这 两个层次中的一些定量分析方法进行研究与探讨。
2.1数据挖掘技术综述
2.1.1数据挖掘技术的产生与应用
1.数据挖掘的定义及其发展
数据挖掘(Data Mining)是指从存放在数据库、数据仓库或其它信息库中大量的、不 完全的、有噪声的、模糊的、随机的数据中挖掘其中的、人们事先不知道的、但又是潜在的 有用信息或知识的过程⑴。由于数据挖掘与数据库密切相关,又称为数据库知识发现 (Knowledge Discovery in Database,简称KDD)。自从1989年8月在美国底特律召开的第 11届国际人工智能联合会议上首次出现数据库中知识发现的概念后,数据挖掘一词很快流 传开来,并在国内外的学术界和产业界都受到了前所未有的重视。2001年,Gantner Group 进行了一次有关“未来3~5年内将对工业产生深远影响的五大关键技术”的高级技术调查, 结果数据挖掘和人工智能位居首位;与此同时,并行处理体系和数据挖掘还被列为未来5 年内投资焦点的十大新兴技术的前两位[瓷 美国麻省理工学院在2001年1月份的《科技评 论》(Technology Review)提出将在未来5年对人类产生重大影响的10大新兴技术,其中第 3项就是数据挖掘技术。
人们通常把原始数据看作是形成知识的源泉。原始数据可以是结构化的,如关系型数据 库中的数据;也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网格上的异构 型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳 的。发现了的知识可以被用于信息管理、査询优化、决策支持、过程控制等,还可以用于数 据自身的维护。
数据挖掘技术与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖 掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未 知、有效和可实用的三个特征。先前未知的信息是指该信息是预先未曾预料到的,即数据挖 掘是要发现那些不能靠直觉就能发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出 的信息越是岀乎意料,就可能越有价值。数据挖掘不但能够学习己有的知识,而且能够发现 未知的知识,得到的知识是“显示”的,既能为人们所理解,又便于存储和应用。
数据挖掘技术汇集了机器学习、模式识别、数据库、统计学以及管理信息等学科的成果。 多学科的相互交融和相互促进,使得数据挖掘这一新兴学科得到了快速发展。目前,数据挖 掘和知识发现已成为国际学术界研究的热点。在数据库、人工智能、信息处理、知识工程等 领域的许多国际学术刊物都开辟了数据挖掘和知识发现的专题或专刊。其中,最早刊登数据 挖掘和知识发现的则是IEEE的《知识和数据工程》会刊,该刊于1993年岀版了数据挖掘 和知识发现的技术专刊,所刊5篇论文的内容涉及从建立分子模型到设计制造业的具体应 用,并代表了当时在数据挖掘和知识发现研究领域的最新成果和动态。这些论文不仅较全面 地论述了数据挖掘和知识发现的系统方法论、发现结果评价、数据挖掘系统设计的逻辑方法, 而且还集中讨论了数据挖掘过程遇到的数据库的动态性冗余、高噪声和不确定性等问题,以 及与其它传统的机器学习、专家系统、人工神经网络、数理统计分析系统的联系与区别。目 前,期刊有关数据挖掘和知识发现这两方面内容的代表性杂志有《Data Mining and Knowledge Discovery》(数据挖掘和知识发现)、《Artificial Intelligence Review》(人工智能评 论)。
除了各种有关数据挖掘和知识发现的期刊外,在Internet上还有不少数据挖掘和知识发 现的电子出版物,其中以半月刊Knowledge Discovery Nuggets最为权威,若要免费订阅, 只需向该网站发送一份电子邮件即可,还可以下载各种各样的数据挖掘工具软件,供用户测 试和评价。另一份在线周刊为DS* (DS代表决策支持),于1997年10月7日开始出版, 也可以向该周刊的网站提出申请免费订阅。在网上,还有一个自由论坛DMEmailClub,人 们可以通过电子邮件相互讨论数据挖掘和知识发现的热点问题。而领导整个潮流的数据挖掘 和知识发现开发和研究中心,当数设在美国的EMDEN的IBM公司的开发部。
2.数据挖掘技术应用
数据挖掘是一门应用性很强的学科,目前,数据挖掘技术已被广泛地应用于各个领域, 几乎涉及到各个领域,包括天文学、生物学、经济管理、金融、保险、电力、石油化工、地 理地质、通信网络管理和Internet应用等领域。这些行业的应用需求更进一步推动了理论研 究的发展。
目前,数据挖掘技术在各个领域的应用主要可概括为以下几个方面:
(1)在科学研究中的应用
随着先进的科学数据收集工具的使用,试验数据量越来越大,传统的数据分析工具有时 会显得无能为力,因此,必须借助强大的智能自动数据分析工具才能完成数据处理工作。数 据挖掘在科学研究中的一个成功应用实例是Fayyad和他的同事们在美国加利福尼亚 Pasadena的Jet Propulsion实验室,利用数据挖掘技术和人工智能技术开发的SKICAT系统, 该系统能够帮助天文学家发现了 16颗新的极其遥远的类星体,这是人工智能技术在天文学 和空间科学上的第一批成功应用之一⑶;在生物学研究中应用数据挖掘技术对DNA进行分 析⑷,等等。
(2) 在零售行业上的应用
通过对市场销售数据进行挖掘,来识别顾客的购买行为模式⑸,从而可以帮助确定商店 货架的布局摆放以促进某些商品的销售。这个过程通常也称为货篮分析。
(3) 识别银行或商业上经常发生的欺诈行为
数据挖掘技术在商业和银行上可以用于探测可疑的信用卡交易,如恶性透支等冏,识别 与洗钱有关的金融交易。
(4) 在金融投资领域的应用
在投资评估和股票交易市场主要是通过数据挖掘技术对市场的趋势进行预测。如LBS Capital Management使用专家系统,神经网络和遗传算法来辅助管理多达6亿美元的有价证 券。
(5) 在制造业中的应用
目前,数据挖掘在制造业中最主要的应用是对生产流程进行控制。典型成功的实例是 LTV钢铁集团一全美第三大钢铁制造企业,应用数据挖掘技术检查可能出现的产品质量问 题,从而降低产品的残次品率。
(6) 在电话销售和直接销售行业的应用
主要方法是根据客户的采购历史数据对客户进行商品销售定位,有针对性地向客户发送 商品目录,或打电话,提髙直接销售或电话销售的成功率。
(7) 在电信行业中的应用
釆用降价策略是当前国际电信行业普遍采用一种的营销策略。由于数据挖掘技术的发 展,是许多电信公司开始关注新的营销策略——通过研究客户需求,提供客户愿意购买的新 的服务项目。
2.1.2数据挖掘模式
根据数据内部之间的规律,数据挖掘模式可以分为以下几类:
1.分类模式
分类就是按照某种标准找出一个类别的内涵描述,这种描述代表了一类数据的整体信 息,并用这种描述来构造模型,一般用规则或决策树模式来表示。通过分类可以反映同类事 物的共同性质的特征型知识和不同类事物之间的差异型的特征知识。分类是利用有关数据通 过一定的算法来求得分类规则。
2.聚类模式
聚类就是将数据对象进行分组,使之成为多个类或簇,其目的是使在同一个类中的对象 之间具有较大的相似度,而不同类中的对象则差别较大。在数据库中就是将记录划分为一系 列有意义的子集。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的前提条件。 聚类分析可以用作独立的数据挖掘工具,来获得对数据分布的了解,也可以作为其它数据挖 掘算法的预处理手段。
3.关联模式
若两个或多个变量的取值之间存在着某种规律性,就称为关联。关联可分为简单关联、 时序关联、因果关联。关联分析的目的是找出数据库中的关联网。数据关联是数据库中存在 的一类重要的可被发现的知识。在关联规则算法中的研究中,生成所有的频繁项目集是核心 问题。关联规则的发现一般可分为两个步骤:一是迭代需识别的所有的频繁项目集,要求频 繁项目集的支持率不低于用户设定的最低值;二是从频繁项目集构造出可信度不低于用户设 定的最低值。
4.估计和预测模式
估计是根据既有的连续性数值的相关属性资料,以获得某一属性的未知值。预测则是利 用时间序列的历史数据找岀变化规律,建立模型,并由此模型对未来数据的种类及特征进行 预测,因此,预测模式也可以被认为是以时间为关键属性的关联知识。预测模式关心的是数 据的精度和不确定性。
5.时序模式
时序模式包括两个方面,一方面,通过时间序列找出重复发生概率较高的数据;另一方 面,在给定一个由不同序列组成的集合基础上,其中集合中的每个序列是由不同元素构成的 有序排列,而每个元素则由不同的项目组成。然后,再给定一个用户指定的最小支持度阈值, 据此找出所有的频繁子序列。
6.层次模式
层次模式主要根据数据的微观特征发现其特征的、带有普遍性的、较高层次概念的、宏 观的知识,来反映同类事物的共同性质,是对数据的概括和抽象。通过层次模式可以获得对 数据类别特征的概括性描述知识。
7.偏差模式
数据库中的数据存在很多异常情况,导致这些数据异常的原因并非是随机偏差,而是由 于完全不同的机制产生的。通常在偏差中包含许多有用的知识,然而许多数据挖掘方法会将 这些数据视为噪声而消除。因此,发现和合理处理数据集中的异常情况是非常重要的,分析 偏差产生原因的简单方法就是寻找观察结果与参照对象之间的差别。此外,在实际应用中, 某些异常事件可能比一些正常岀现的事件更能引起人们的兴趣和重视。
从上述7种数据挖掘模式的处理过程来看,各种挖掘模式所利用的数据是不同的。各种
模式的区别与联系就在于⑺:关联模式、预测模式和时序模式都是利用已有知识的基础上来 发现新知识;聚类模式和分类模式都是将大量的数据按照数据本身的特征划分为若干类别; 层次模式可以在宏观、中观和微观等不同层次上获得数据所表达的知识;而偏差模式在某种 程度上来说是从上述各种数据挖掘模式可能舍弃不用的数据中发掘有用的知识过程。
因此,对于每一种数据挖掘模式的知识发现,都有与之对应的一系列数据挖掘方法,而 大部分的数据挖掘方法也都可派生出若干种不同的数据挖掘模式。
2.1.3数据挖掘方法
在数据挖掘的实践过程中,数据挖掘方法是最为关键的。目前有关数据挖掘的方法可以 概括为以下几类:
1.基于集合论的方法
(1) 模糊集方法
利用模糊集理论对研究对象进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。 一般来说,复杂程度越高的系统,其模糊性越强,因而对其进行精确化也就越难。目前有关 模糊挖掘算法在国内外已有很多研究[8~12]»利用模糊集方法可以形成多种数据挖掘模式,并 在各领域的实际应用中都取得了较好的效果。
(2) 关联规则方法
关联规则的挖掘最早是由R.Agrawal等人于1993年提出的。在关联规则算法中的研究 中,生成所有的频繁项目集是核心问题。关联规则主要用于挖掘关联模式,Apriori算法是 一种典型的挖掘关联规则算法〔⑶,此外,还有许多其他的关联规则挖掘算法〔“2%如 Pincer-Search算法、Paridon算法、Cumulate算法、DLG算法、DHP算法和DLC算法、布 尔型加权算法、广义模糊型加权算法、基于多维标度算法、基于正态云模型算法,以及基于 转移规则和概念格算法等。
为了提高算法的有效性,研究人员利用其它理论改进关联规则算法〔27~28】,如引入粗糙 集概念使关联规则发现模式具有较高的解释能力和精确度,以及引入神经网络概念来发现数 据库中的关联规则等。同时,还有适合挖掘序列模式的改进的关联规则算法,如Apriori II 算法、GSP算法等。
(3) 粗糙集方法
粗糙集(Rough Set,简称RS)理论是由波兰数学家Z.Pawlak在20世纪80年代提出 的一种新型数学理论,主要用于处理不确定性和不精确性问题(2刃。该理论在分类意义下定 义了模糊性和不确定性的概念,能有效地分析不精确、不一致、不完整等各种不完备信息, 并从中发现隐含的知识,揭示潜在的规律。粗糙集理论从新的视角对知识进行了定义,把知 识看成是关于论域的划分,认为知识是有粒度的。其主要思想是利用已知的知识,通过上近 似、下近似等概念将不确定或不精确的知识用已知的知识库中的知识来刻画,利用约简、核 等概念对知识进行简化及对知识的依赖性进行分析、决策等。粗糙集理论的最大特点是不需 要提供问题所需处理的数据集合之外的任何先验信息,如统计中要求的先验概率和模糊集中 要求的隶属度,且算法简单、易于操作。
近年来,粗糙集理论在数据库知识发现和数据挖掘中的应用取得了较大的进展,基于粗 糙集理论的方法逐渐成为数据库知识发现和数据挖掘的主流方法之一 DM】,利用该理论可 以进行相关分析、属性约简、因果关系分析和范式采掘等。
(4) 覆盖正例排斥反例方法
该方法主要是利用覆盖所有正例,排除所有反例方法的思想来寻找规则。比较典型的有 AQ11方法【创和改进的AQ15方法跑,以及AE15方法。AQ系列的核心算法是首先在正例 集中任选一个种子,并将该种子与反例集中逐一进行比较,然后对字段值构成的选择子相容 则舍去,相斥则保留。按照这一思路循环正例集中的所有种子,最后得到正例集的规则。此 外,还有通过扩张矩阵来完成正例集的规则提取的AE系列方法⑷】。
(5) 概念树方法
将数据库中的记录属性字段按归类方式进行抽象,建立起来树型的层次结构。利用概念 树方法能够得到高度概括的知识,该方法不仅可以大大缩减数据库中的记录,而且还能提升 多个字段的概念树。例如,“分钟”概念的下层是“秒”,其直接上层是“小时”,“小时”的 上层是“日”,再上层是“旬”。
2.基于信息论的方法
这类方法主要是利用信息论的原理与方法,计算数据库中各字段的信息量,建立决策树 或决策规则集。决策树是一种常用于预测模型的算法,它通过将大量数据有目的分类,从中 找到一些有价值的潜在信息。它的主要优点是描述简单,分类速度快,特别适合大规模的数 据处理。决策树在分类时一般都是自上而下生成的。每个内部节点表示对某一属性的一次测 试,每个分支代表一种测试结果,叶子节点代表某个类的分布,最上面(顶部)的节点就是 根节点,决策树可以是二叉的、也可以是多叉的。从根到叶子节点都有一条路径,这条路径 就称为一条“规则”。决策树方法中比较重要的方法有ID3法和IBLE法等方法。
(1) ID3方法
ID3算法是最有影响和最早的基于信息的决策树方法,它主要利用信息论中的互信息量 寻找数据库中具有最大信息量的字段,建立决策树的一个节点,再根据字段的不同取值建立 树的分枝,在每个分枝子集中重复建立树的下层节点和分枝,叶节点为正例或反例。而决策 属性的选择主要是运用信息论中的爛的概念来完成的,在属性的选择方法上,是通过选取具 有最大信息增益(或最大爛减方向)的决策属性作为当前节点。采用这种方式选择的节点属 性可以保证决策树具有最小的分支数量,使得到的决策树冗余最小。
(2) IBLE 方法
与ID3方法不同的是,IBLE方法不是每次只选取一个特征作为决策树的节点,而是选 一组重要特征建立规则,作为决策树的节点。通过选用多个特征组合而成的规则节点来鉴别 实例,能够更有效地正确判断。IBLE算法建立的是决策规则树,树中每个节点由多个特征 构成。特征的选取是通过计算各特征信道容量来进行的。各特征的正例标准值由编码函数来 决定,节点中判断正例或反例的阈值由实例中权值变化的规律来决定的。
除了上述两种算法外,还有CART算法、CHAID算法和C4.5算法等。
(3)信号分析方法
信号分析方法是将数据看成是由多个通道采样组成的信号,利用信号分析的原理和方法 对数据进行分析。目前用于信号分析的方法有傅立叶分析方法、加窗的傅立叶分析方法和小 波分析法〔斗旬等。这些方法的共同点就是将输入的数据经过变换并进行频率域上的分析。 由于频率域上的信号通常表现为低频和高频信号的叠加。因此,可以对不同频率的信号进行 处理,以实现特定的目的。
3.基于仿生物学的方法
(1) 神经网络方法
人工神经网络是由大量类似于神经元的处理单元相互联接而成的非线性复杂网络系统。 它试图通过模拟人的大脑神经网络处理、记忆信息的方式完成人脑那样的处理功能。该方法 模仿生物神经网络,它通过对训练数据的采集,逐步计算网络连接的权值。神经网络的挖掘 方法可分为以下三种:
①前馈式网络。采用分层网络的结构形式,实现从输入层节点的状态空间到输出层状 态空间的非线性映射,广泛地应用于预测、模式识别和特征提取等方面。
②反馈式网络。它以Hopfield的离散模型和连续性模型为代表,分别用于联想记忆和 优化计算。
③自组织网络⑷⑷】。主要以ATR模型、Koholen模型为代表,主要应用聚类分析。
神经网络具有分布式存储信息、并行地处理信息和进行推理,以及高度容错和自组织学 习等特点,可以解决众多采用传统方法难以解决的问题。神经网络的典型算法有无导师的 Hebb规则,有导师的Delta规则,Hopfield能量最小准则,误差反向传播的广义Delta规则 以及Boltmamn规则,等等。此外,神经网络是一个通用算法,几乎可以挖掘前面所列举的 各种模式。
(2) 遗传算法
遗传算法的基本思想是根据自然选择原理以及自然遗传机制进行数据处理,从中寻找有 用的信息,与其它算法相比较,其主要特点有以下三个方面:一是规则的表达形式是以编码 的形式给出的;二是遗传算法中的规则是不固定的,而是进行不断的转换和进化,最初的规 则是随机给出的,并根据适者生存的原则,在最初的规则中选出最适用的规则,再由最适用 的规则产生它们的后代,通过不断地对规则群体进行进化,直到满足给定的条件为止;三是 遗传算法的处理过程中不需要其他任何辅助信息及附加的先决条件。
由于遗传算法是模拟生物进化过程的算法,因而是一种全局寻找最优解的算法。它由以 下3种基本操作组成:
①繁殖。通过选择算子从一个旧的种群中选岀生命力强的个体产生新的种群;
②交叉。利用交叉算子来选择两个不同的个体部分进行交换,形成新的个体;
③变异。借助变异算子,以一定的适用度对某些个体的某些基因进行变异,如把1变 成0,或者把0变成1,等等。
通过遗传算法上述三种运算,可以起到产生优良后代的作用。这些后代需满足适应值, 经过若干代的遗传,将得到满足要求的后代即问题的解。遗传算法易于并行〔刈,在分类机 器和优化计算等方面已得到成功的应用。遗传算法在数据挖掘中不仅可以用于挖掘分类模式 |5'\聚类模式炉】、依赖模式、层次模式,而且还可以用来对其它算法的适合度进行评估
(3)机器发现
随着人工智能技术在各领域的广泛应用,以人工智能技术为支撑的机器发现技术得到了 快速发展。通过对数据库中的若干数据项进行一定的数学运算,可以建立相应的数学模型。 目前利用机器发现技术研制成功的系统有科学定律发现系统BACON和数学概念发现系统 AM等。
(4)统计分析方法
这类方法主要是利用有关统计学的原理和方法对数据库中的数据进行统计分析。常用的 统计分析方法有以下几种:
①假设检验和方差分析。假设检验是根据研究对象的样本统计量的值的差异来推断总 体参数之间是否存在差异;方差分析则是根据试验数据中不同来源的变异对总体变异的影响 程度,从而确定试验中的可控因素对试验结果是否有重要影响。
②相关分析和回归分析。相关分析法是通过计算变量之间的相关系数来度量变量间的 相关程度;而回归分析是利用数学的方程表达式来描述变量之间的数量关系,回归分析方法 主要有线性回归法和非线性回归法。
③聚类分析。聚类分析能够直接比较样本中各事物之间的性质,将性质相近的归为一 类,而性质差别较大的分在不同的类。聚类分析是数据挖掘中一个非常活跃的领域,目前已 有很多种聚类算法〔‘宀71,如划分法、层次方法、基于密度的方法、基于网格的方法和基于 模型的方法外,还有基于DBSCAN的各类改进的聚类算法,以及对高维数据的可视化聚类 算法等。这些算法不仅提高了聚类速度,而且处理的数据量也大大增加。
④因子分析。因子分析是利用少量的综合指标来表达多个观测变量,并根据变量之间 的相关程度的大小对变量进行分组,相关性较高的变量被划分在同一组内,而相关性较低的 变量则被划分到不同的组之间。
⑤判断分析。在建立一个或若干个判断函数和确定一个判断标准的基础上,根据判断 标准将未知属性的对象划归到己知类中。
4.其它数据挖掘方法
(1)可视化方法
当所要识别的不规则事物是一系列图形而不是数字表格时,此时可利用可视化数据挖掘 方法,使用户能够交互地浏览数据和挖掘过程。可视化数据分析方法拓宽了传统的图表功能, 使用户对数据的剖析更清晰。虽然可视化方法是一种辅助的数据挖掘方法,但是非常重要。 Keim D A等厲】研制出一种多维的可视化挖掘工具VisDB系统,Cleveland W[59]对可视化数据 技术进行了系统的分析与总结。
(2)分形系统
分形分析试图利用混沌科学来指明模式,然后用分形将多维数据库提供的分析信息存储 于数据仓库,其目的是为大型数据仓库提供OLAP的响应。OLAP技术是指联机分析处理 (On-Line Analytical Processing,简称 OLAP),它由关系数据库之父 EJF.Codd 博士在 1993 年提岀的。OLAP可以在使用多维数据模型的数据仓库或数据集市上进行,使用数据立方体 结构,OLAP操作可以有效地实现。OLAP技术主要是应用隐含在数据里的领域背景知识对 数据进行操作,为用户在不同的抽象层上提供数据。OLAP技术一般都是在集成数据仓库中 实现的。
在数据挖掘实践中,用户对于数据处理过程和结果的要求不尽相同,有的要求在数据挖 掘过程对数据的格式和输入顺序不敏感,能够处理噪声和孤立点,有的要求能处理高维的海 量数据和有较低的时间和空间复杂度,还有的要求对挖掘出的知识有较好的可解释性,等等。 然而,现有每一种数据挖掘方法在某些方面存在不足,没有一种方法能够完全满足用户的各 种要求。因此,在数据挖掘过程中,应根据所要解决的具体问题,并结合各种数据挖掘方法 的特点,选择一种适合所研究问题的方法。
2.1.4数据挖掘的步骤与工具
1.数据挖掘的实施步骤
数据挖掘是指一个完整的过程,该过程从大型数据库中挖掘未知的、有效的、可实用的 信息,并能使用这些信息作出决策或丰富知识。
(1)确定应用领域和对象
不同的应用领域和对象,其数据挖掘的目的是不同的,最终所获得的知识也是不同的。 因此,明确界定应用领域和对象,是正确认识数据挖掘和KDD的目的是进行数据挖掘和 KDD实践的重要一步。
(2)数据准备
数据准备工作包括数据的选择(Data Selection)、数据预处理(Data Preprocessing)和 数据变换(DataTransfbrmation) 3个步骤。数据选取就是确定操作对象,即根据用户需要 从原始数据中抽取相应的数据;数据预处理主要用来消除噪声、计算插值缺失数据、删除 重复记录、完成数据类型转换等;数据变换则是完成削减数据维数或降低维数,以及离散 值数据与连续值数据的相互转换、数据的分组分类、数据项的计算组合等,即从初始特征 中找出真正有用的数据特征,以减少数据挖掘时的工作量。
(3)数据挖掘和建立模型
对所得到的,经过转换的数据进行挖掘。这一环节主要包括两方面的工作:一是确定挖 掘任务,即确定要发现的知识,知识发现的任务主要有基于产生式规则、综合、分类、预测、 辩识和聚类;二是根据挖掘任务的不同,选取数据挖掘工具提供的算法并应用于准备好的数 据,选取相应参数,生成模型。
(4)结果分析和解释评价
对数据挖掘结果进行分析,并结合专业知识进行评价。若发现的知识不能满足用户要求, 则需要整个发现过程返回到发现阶段之前,重新选取数据、采用新的数据变换方法、设定新 的数据挖掘参数值,甚至换一种数据挖掘方法。此外,由于KDD最终是面向用户的,因此, 要设法将发现的知识进行可视化,即把结果转换为用户易懂的一种表示方式。
上述数据挖掘的过程可用图2 - 1来表示。
 
 
图21数据挖掘过程
2.数据挖掘的工具
目前,数据挖掘软件特别多,如SAS公司推出的Enterprise Miner, SPSS公司在购买了 Clementine,并将其与自己原先的统计功能相结合,取得了很好的业绩。在Clementine推出 之前,SPSS公司在统计软件市场上还很难与SAS竞争。但在推出Clementine后,SPSS隐 然成为可与SAS—比高低的市场引导者。另外,IBM公司借助自身强大的科研实力,推出 了数据容量巨大、具有强大数据挖掘能力的数据挖掘软件Intelligent Miner。
(1)SAS Enterprise Miner 软件
SAS Enterprise Miner是数据挖掘市场上非常杰出的一种数据挖掘软件,它利用SAS统 计模块的优势,同时增加了一系列数据挖掘算法,使它成为无论是初学者还是专业使用者都 比较喜欢使用的数据挖掘工具之一,因而成为数据挖掘市场的领导者,SAS Enterprise Miner 软件比较适用于有关企业发展的数据挖掘及CRM决策支持。
(2) SPSS Clementine 软件
SPSS Clementine软件是SPSS公司发行的数据挖掘工具,由于它结合了多种图形接口 分析技术,使软件的应用变得相当容易与直观,因而SPSS公司在市场上具有较强的市场竞 争力。
(3) IBM Intelligent Miner 软件
IBM公司的Intelligent Miner是数据挖掘领域中市场容量最大且功能强大的一种数据挖 掘工具,在数据挖掘软件市场上占有重要地位。Intelligent Miner工具不仅包含了最广泛的 数据挖掘技术与算法,而且容纳数据和计算能力也很强大。此外,不仅包含了丰富的用户自 定义数据挖掘应用软件,还能利用可视化技术和Java接口来增强其可用性,支持DB2关系 型数据库。
除了上述3种数据挖掘软件外,国际许多大型软件公司根据不同的市场需求推岀了自己 的数据挖掘产品,如StatSoft统计软件公司推出的基于STATICA的Data Miner模块、S-PLUS、 MATLAB 和 Mathamatica 的数据挖掘模块等。此外,SGIMindSet、DataMind DataCruncher、 INSPECT等也都是比较知名的专用数据挖掘软件。
2丄5小结
在分析研究有关数据挖掘的模式、方法、实施步骤和应用领域的基础上,得到以下结论:
(1) 数据挖掘是指从大型数据库中挖掘未知的、有效的、可实用的信息,并能使用这 些信息作出决策或丰富知识的过程。数据挖掘技术是一个新兴而充满希望的研究领域,其表 现出来的广阔应用前景正吸引越来越多的研究人员和工商界人士,每年都有新的数据挖掘方 法、模型和系统问世,并在商业、经济、金融和管理等各个领域取得了许多应用性成果。
(2) 从数据挖掘模式和方法之间的关系可以看出,每一种数据挖掘模式的知识发现, 都有与之对应的一系列的数据挖掘方法,而大部分的数据挖掘方法也可以挖掘出几种不同的 数据挖掘模式。
(3) 在数据挖掘实践中,用户对于数据处理过程和结果的要求不尽相同,然而现有每 一种数据挖掘方法在某些方面存在不足,没有一种方法能够完全满足用户的各种要求。因此, 在数据挖掘过程中,应根据所要解决的具体问题,并结合各种数据挖掘方法的特点,选择一 种比较合理的方法。
(4) 一个完整的数据挖掘过程应包括确定应用领域和对象、数据准备、数据挖掘和建 立模型和结果分析和解释评价等四个基本步骤。
2.2基于粗糙集理论的组合预测方法研究
2.2.1引言
预测是人们根据客观事物过去和现在己知的情况,弄清事物的发展规律或趋势,并据此 对将要发生,而目前又不明确的事物或过程作出预先的估计和推测。在预测实践中,对于同 一个问题可采用不同的预测方法,不同的预测方法能提供不同的有用信息,且其预测精度也 不相同,这表明单一性预测方法在使用上存在一定的局限性。具体表现为:
(1) 单一预测模型都是对被预测对象所处的环境作出某些假设,而预测环境假设是指 未被预测模型所考虑的一组因素,考虑到建模的成本和效益,舍去了一些与模型相关的环境 信息,从而使模型简化。因此,当环境迅速变化时,由于模型的各种假设前提不再成立,模 型的性能将会变差,弱化了对环境的适应性。
(2) 一些预测方法使用时,往往面临一个问题,即同时有多种预测模型,但预测结果 都分布在一个较宽的区域内,而使决策者难以决定取舍。
(3) 从大量的研究中发现,对于一个特定的预测领域,可供使用的信息是有限的。不 同的单一预测方法所载用的信息是不完全相同的,而任一预测方法都使用了一部分有用的信 息。所以被取舍的那些预测方法或模型总是包含了一些有用的独立信息。因此,采用某个单 一模型进行预测,结果将会导致可靠性与精度的降低。
为了克服上述单一预测模型中存在的局限性,新的组合预测方法代之发展起来。组合 预测是采用两个或两个以上不同的预测方法对同一对象进行预测,对各单独的预测结果适当 加权后取其加权值作为最终预测结果。组合预测方法的研究一直是预测领域较为活跃的一个 方面。组合预测模型聚集了各单个预测方法包含的有用信息,从而具有对未来变化的适应能 力,减少了预测的风险,提高了预测的精度。组合预测在国外常被称为Combination forecasting, Combinol forecasting或Combined forecast等,在国内也被称为结合预测或复合 预测。由于最早对组合预测方法进行系统研究的是JMBates和C.WJ.Granger,所以也有人 把组合预测称之为B - G组合预测。建立组合预测模型的关键在于科学合理地确定各单一模 型的权系数。
2.2.2组合预测方法分析
建立组合预测模型的关键是合理地确定单个预测模型的权系数。组合预测模型中的每 个模型都可以从某个角度提高预测水平。组合预测方法利用数学语言描述如下:
假设有m种预测模型对同一预测对象进行预测,则由这m种单一预测模型构成的组合 预测模型为
m
%=弘胡 (2-1)
1=1
式中 y( t时刻组合预测模型的预测值
外) r时刻第j个预测模型的预测值0 = 1,2,…,加)
处 ——/时刻第i个预测模型的权系数(心1,2,「加),£处=1,且吩0
i=l
如果外)和kj己经求得,即可进行组合预测。
组合预测方法按其综合手段的不同特点可以分为权重合成和区域合成两大类型,其中 权重合成的研究应用较广。关于权重合成的组合预测,目前有很多研究方法。大致有以下几 种:最优组合预测方法、变权组合预测方法,以及利用不同的数学方法来求解权重(心2】, 其算法的繁简程度不尽相同,这些方法的出现对促进组合预测的研究与应用起到了积极作 用。由于组合预测模型中权系数的取值一方面影响预测效果;另一方面反映各预测模型在组 合预测方法中的重要度,而重要度是粗糙集理论(Rough Set,简称RS)的核心内容之一®】。 虽然文献[64]根据粗糙集理论中的知识依赖性和属性重要性等概念,给出基于粗糙集理论的 组合预测模型权系数的计算步骤,但未涉及粗糙集理论应用的重要环节之一,即属性数据的 离散化方法,致使在应用中缺乏可操作性;另外对预测效果也未做分析。鉴于此,本节结合 有关研究文献,对属性数据的离散化方法上进行了分析与研究,同时以浙江省的粮食总产量 为研究对象,建立了基于粗糙集的粮食产量组合预测模型,并对所建立的组合预测模型的预 测效果进行了分析与讨论。
2.2.3粗糙集理论相关概念
Rough Sets理论(简称RS)是20世纪80年代初由波兰数学家乙Pawlak首先提出的 —种分析数据的数学理论⑹】。它是一种刻划不完整性和不确定性的数学工具,能有效地分 析不精确(imprecise)、不一致(inconsistent)、不完整(incomplete)等各种不完备的信息。 其主要特点是不需要知道有关数据的背景知识,或者说不需要预先给定某些特征或属性的数 量描述,仅根据观测数据,删除冗余信息,分析不完整知识的程度一粗糙度、属性间的依赖 性与重要性,找到隐含在数据中的内在规律,并生成分类规则或决策规则等1心8】。目前, 粗糙集理论已被广泛地应用于机器学习、决策分析、过程控制、模式识别与数据挖掘等领域。 粗糙集中的一些重要基本概念有以下几个®亠】。
1.知识的含义
在粗糙集理论中,“知识”被认为是一种对对象或现实对象进行分类的能力,也即根据 研究对象的属性特征对对象论域作出分类处理的能力。用集合的概念表示就是:使用等价关 系集R对离散表示的空间CZ进行划分,知识就是人对U划分的结果。由此,在[/和的意 义下,知识库K可以定义为属于R的所有可能的关系对U的划分,记为
K = (U,R) (2 -2)
这样给定一组数据U与等价关系集R,在R下对U的划分,称为知识,记为U/R。
 
2.集合的上近似和下近彳以
给定知识库K = (U,R),对于每个子集XjU和一个等价关系R,定义3个子集,即
凡(X) = {xeU|[x]R qX} (2-3)
R*(J0 = {xe[7|[x]R (2-4)
BNS =R*(X)-R,{X) (2-5)
分别称它们为X的R下近似集、R上近似集和R的边界域;POSr(X) = R*(X)称为X 的7?正域;NEGr(X) = U-R*(X)称为X的R负域。R*(X)或POSr(X)是由那些根据知识
7?判断肯定属于X的U中元素组成的集合;R\X)是由那些根据知识R判断可能属于X的
U中元素组成的集合;是由那些根据知识R既不能判断肯定属于X的又不能判断肯定 属于〜X (U-X)的〃中元素组成的集合;NEGr(X)是由那些根据知识7?判断肯定不属于X 的U中元素组成的集合。图2-2为粗糙集概念的示意图。
 
3.属性的依赖度和重要度【6470]
设S= (U, A, V, f)是一个知识表达系统,其中:U为所有对象的集合(论域), U = {X1,x2,-,Xn};厦为属性的非空集合;/为各属性值域的并集;/为信息函数,它为每 个属性赋予一个信息值。A = C{]D , CflD*0, C为条件属性的集合;D为决策属性的集 合。具有条件属性和决策属性的知识表达系统称为决策表。RS理论中应用决策表来描述论 域中对象,它是一张二维表格,每一行描述一个对象,每一列描述对象的一种属性(包括条 件属性和决策属性)。论域中的对象根据条件属性的不同被划分到具有不同决策属性的决策 类中。若U/C = {Xx,X2,-,X„} , U/D = {Yx,Y2,--,Ym},则决策属性D对条件属性C的依 赖度可定义为
 
式中|U|—— 集合U的基数或势,对于有限集合表示集合中包含元素的个数。 显然,0 5血\ ,当depc(D)接近1时,说明决策属性D对条件属性C的依赖程 度越高。depg 的大小从总体上反映了决策属性£>对条件属性Q的依赖程度。相对于决 策属性集合D,各条件属性在整个条件属性集中的重要程度可能不尽相同。若条件属性集合 中有无条件属性c,.eC对决策属性集合的分类改变不大,则认为条件属性°的重要程度不 高;否则,条件属性C,.的重要程度高。因此,可将条件属性c,•关于决策属性D的重要程度 定义为
sigJc,)(Ci)= depc(D)-depc_ic[(D) (i = l,2,…,力) (2 - 7)
sigc-{q)(Q)的值越大,则表明属性“在整个条件属性集合中的重要性越高。
2.2.4基于粗糙集理论的组合预测模型权系数确定步骤
1.建立关系数据模型
由式(2-1)可知,组合模型预测值是由各单一模型预测值加权而得,因而可将组合 预测模型中的单一模型的拟合值视为条件属性c,而将预测对象的观测值y视为决策属性 条件属性集与决策属性集可分别表示为C = W⑴“⑵,…J")} , £>=抄}。定义
£=(许,以⑵,…卫叭儿)(戶1,2,…丿),其中,(许,刃2),...,卿))和”分别是f时刻各单 —预测模型的拟合值和预测对象的历史数据,则论域"={旳,“2,…,“”},也称为样本集合。 由观测期内各单一模型的拟合值和历史数据一起构成的二维数据表就是关于组合预测方法 的关系数据模型,表中的每一行描述一个对象,每一列描述对象的一种属性。
2.建立知识表达系统和决策表
要分析各单一模型的重要度,需要利用属性对论域分类,分类的前提是将属性值离散 化,属性值离散化后便可建立知识表达系统。由于粗糙集理论中属性依赖度和重要度的评价 是建立在离散数据表基础上的,因而首先需要对连续值进行离散化,转化为决策表后再进行 后继分析,这也是粗糙集理论实际应用中的一个重要环节。
对连续属性值的离散化本质上可归结为利用选取的断点来对条件属性构成的空间进行 划分的问题,把这"维空间划分成有限个区域,使得每个区域中的对象的决策值相同。假设 某个属性有m个属性值,则在此属性上就有m-l个断点可取,选取断点的过程也是合并属 性值的过程,通过合并属性值,减少属性值的个数和降低问题的复杂度,有利于提高知识获 取过程中所得到的规则知识的适应度⑺]。
一般来说,连续数据的离散化应尽可能满足两点:
(1) 连续属性离散化后的空间维数应尽可能小即经过离散化后的每一个属性都应包含 尽量少的属性值种类;
(2) 连续属性值离散化处理后丢失的信息应尽量少。
目前国际上针对粗糙集理论中的离散化问题也提出了一些有价值的研究成果,大致可分 为两类[72~75], —类是基本上很少或不考虑粗糙集理论的特殊性,而是把其它学科中的离散 化方法借用到粗糙集理论上来,但效果不理想;另一类是注意到了粗糙集理论对决策表的特
殊要求,釆取结合方法来解决离散化问题,如在离散化过程中结合考虑属性依赖度和信息爛, 提高离散化结果的合理性。在实际应用中,通常都需要参考相关的领域知识和实际经验对离 散方法进行修正。
目前有关连续数据的离散化数学方法很多,概括起来有以下几种主要方法[72~7現基于 分级聚类法的离散方法、基于遗传算法的离散方法、基于条件信息爛的离散方法和基于自组 织神经网络SOM的离散方法等。
基于分级聚类法的离散方法为结合分级聚类法和粗糙集理论中依赖度的增类、减类算 法,可以根据问题的具体情况对不同的条件属性依据其重要性给予不同粒度的离散化措施, 提高属性离散结果的合理性。
基于遗传算法的离散方法是以遗传算法为基础,将最小断点集作为优化目标,并构造一 个新的算子来保证所选取断点能保持原决策系统的不可分辨关系,同时相应地釆用自适应变 异策略。
基于条件信息爛的离散方法是运用信息论的方法进行连续属性的离散化,并在算法中引 入Hellinger偏差HD (Hellinger Divergence)作为每个区间对决策的信息量度量,从而定义 切分点的信息爛,最终的离散化结果是使各区间的信息量尽可能平均。
基于SOM的离散化方法是通过SOM分类网络算法将连续属性分类的方法。SOM网络 是一种无教师的竞争学习型前馈网络,网络通过自组织方式利用大量的训练样本数据调整网 络权值,最后网络的输出层反映样本数据的分布情况。已有的研究文献表明卩“气自组织 神经网络的输岀情况能反映样本数据分布的大体本质特征,可以对样本属性进行量化到一个 合理的结果。
因此,在数据的离散化过程中,应根据所要解决的问题来选择一种合理的方法。
由论域、条件属性和决策属性构成的信息系统称为知识表达系统。通常将具有条件属 性和决策属性的知识表达系统称为决策表,决策表中的每一行表示一种决策规则。论域中的 对象根据决策规则的不同被划分到不同的决策类中。
3.计算各个模型权系数步骤冏• 70】
(1)计算决策属性集D对所有条件属性集C的依赖度碇Pc(Q)
刼 c(Q) =击牙 |POSc(E)|
式中|U|——集合U的基数或势,对于有限集合表示集合中包含元素的个数;
POSc(y,) 称为耳关于条件属性C的正域。
(2)删除第i种预测模型,计算决策属性集D对条件属性集C-僦}的依赖度
depc-m(D)
 
(3)计算第i种预测模型在全部预测模型中的重要性sigj,g)
sig?-{c)2J = depc(D) -depc_{c,)(D) (z = 1,2, ■•- ,m) (2 - 10)
(4)计算第i种预测模型的权系数心
kj = ” £c — (i = 1,2,…,m) (2 ~ 11)
ZS/SC-(c,J
,=1
2.2.5基于粗糙集的粮食产量组合预测模型
下面利用浙江省粮食总产量的历史数据,根据上述确定权系数的分析步骤,建立基于 粗糙集的粮食产量组合预测模型。
1.组合预测模型中单一模型的建立
当把时间因素看作影响粮食总产量的各种因素的综合时,就可建立粮食产量随时间变化 的预测模型。由于一元线性回归是各种回归法中最基本的方法,其它各种回归法均由它演变 发展而得,许多非线性预测问题经过一定的数学变换后,都可以转化成线性形式来处理,其 主要特点是当有足够的数据点(一般至少有20个以上的点)时,既适用于短期预测;也适 用于中长期预测I”】。因此,在建立模型过程中,根据粮食产量的变化趋势,确定以一元线 性回归模型、指数模型、对数模型、双曲线模型和倒指数模型作为基础模型建立组合预测模 型。利用浙江省1980-2002年粮食总产量的统计资料网】,建立如下5个单一预测模型:
模型① 外) = 1721.5843-20.0736-r (2- 12)
模型② = 1752.5991x0.9853' (2- 13)
模型③ = 1719.3329 —106.3530 ln(r) (2-14)
一 01034
模型④ = 1441.8738e ( (2-15)
模型⑤ 1 = 0.0007-000009 (2- 16)
t
以上各式中, (i = l, 2, 3, 4,5 )为粮食总产量。
 
粮食产量的历史数据及各个模型拟合值见表2-lo则由浙江省1980-2002粮食产量历 史数据及单个模型拟合值就构成了基于粗糙集的组合预测模型的关系数据模型。
 
表21由浙江省1980-2002年粮食产量历史数据及各模型拟合值构成的关系数据模型
粮食总产量/ 单个模型与组合模型拟合值
论域U 毎佛 __
万t 模型① 模型② 模型③ 模型④ 模型⑤ 组合模型
1980 1435.50 1701.51 1726.74 171933 1598.98 1616.69 1714.29
"2 1981 1419.50 1681.44 1701.27 1645.61 151&40 1512.71 1672.34
1982 1712.50 1661.36 1676.17 1602.49 1492.45 1480.96 1642.24
»4 1983 1583.50 1641.29 1651.44 1571.90 1479.64 1465.57 1671.05
1984 1817.00 1621.22 1627.07 1548.16 1472.01 1456.50 1594.58
“6 1985 1621.30 1601.14 1603.07 1528.77 1466.94 1450.51 1573.86
1986 1605.10 1581.07 1579.41 151238 1463.34 1446.26 1554.37
1987 1589.00 1561.00 1556.11 1498.18 1460.64 1443.09 1535.81
1988 1553.60 1540.92 1533-15 1485.65 1458.54 1440.64 1517,98
«10 1989 1575.50 1520.85 1510.53 1474.45 1456.86 1438.68 1500.72
1990 1586.10 1500.77 1488,25 146431 1455.49 1437.08 1483.96
"12 1991 1678.80 1480.70 1466.29 1455.06 145435 1435.75 1467.61
1992 1553.60 1460.63 1444.66 1446.54 1453.39 1434.63 1451.63
叭4 1993 1436.20 1440.55 1423.34 1438.66 1452.57 1433.67 1435.96
«15 1994 1404.00 1420.48 1402.34 1431.32 1451.85 1432.84 1420.57
W|6 1995 1430.90 1400.41 1381.65 1424.46 1451.22 1432.11 1405.43
«I7 1996 1516.80 1380.33 1361.27 141&01 1450.67 1431.47 1390.53
«I8 1997 1493.53 1360.26 1341」8 1411.93 1450.18 1430.90 1375.83
WJ9 1998 1435.20 1340.19 1321.40 1406.18 1449.74 143039 1361.33
«20 1999 1392.96 1320.11 1301.90 1400.73 144935 1429.93 1347.02
"21 2000 1217.69 1300.04 1282.69 1395.54 1448.99 1429.52 1332.87
"22 2001 1055.68 1279.97 1263.77 1390.59 144&67 1429.14 1318.88
"23 2002 942.27 1259.89 1245.12 1385.86 1448.37 1428.80 1305.05
 
根据上述有关数据离散化方法的分析,本文利用SOM网络离散方法将每个预测模型的 拟合值(属性值)为4个等级[81~82],得到特征值,再用经离散化的特征值去代替属性值, 便可建立关于粮食产量组合预测的知识表达系统与决策表,见表2-2。
 
表2-2离散单一模型拟合值与预测对象指标值(粮食总产量)构成的知识表达系统
论域U 模型① 模型② 模型③ 模型④ 模型⑤ 粮食总产量》
1 1 1 3 3 4
"2 1 1 2 3 3 4
2 2 3 4 4 1
“4 1 1 2 4 4 2
"5 2 2 3 4 4 1
"6 1 2 3 4 4 1
«7 2 2 3 4 4 1
"8 2 2 3 4 4 1
»9 1 2 3 4 4 1
W10 2 2 3 4 4 1
"II 2 2 3 4 4 1
«12 3 3 4 4 4 1
"13 3 4 4 3 4 1
«14 2 4 2 1 3 3
叭5 3 4 2 1 2 4
»16 4 4 2 1 2 2
W17 4 4 3 2 3 1
m18 4 4 3 1 2 1
w19 2 4 3 1 2 2
"20 4 4 2 1 1 2
"21 3 3 2 1 1 4
w22 3 3 2 1 1 4
“23 3 3 2 1 1 4
 
2.组合预测模型的建立
由(2-8)式计算出粮食总产量,对5个预测模型的依赖度:血氏9)=0.6957。
由(2-9)式计算减少一个预测模型后余下4个预测模型对y的依赖性 depc畑 9) (21,2,3,4,5),由(2 - 10)式和(2~11)式计算出各个预测模型的重要性 sig艮® G) d = 1, 2, 3, 4,5)和权系数kt (i = 1, 2, 3, 4,5),计算结果见表 2 - 3。
由表2-3中各模型的权系数即可建立基于粗糙集的浙江省粮食产量组合预测模型。
yt = 0.3846卯)+0.2308舁2)+0.3846讦) (2 - 17)
利用上述组合预测模型可求得浙江省1980-2002年粮食产量预测值,见表2 - 1中最后 一列。
表2-3 单个预测模型的依赖度、重要性及权系数
参数 模型① 模型②- 模型③ 模型④ 模型⑤
预测模型的依赖度depcTc,} (Q) 0.4783 0.5652 0.4783 0.6957 0.6957
预测模型的重要性Sig?_{q) (c,) 0.2174 0.1305 0.2174 0 0
预测模型的权系数為 0.3846 0.2308 0.3846 0 0
3.分析与讨论
组合预测模型的预测值是由各单一预测模型的预测值经线性加权而得,各个模型的预 测结果对组合预测结果的影响既依赖于其预测值,又取决于其相应的权系数,而它们的权重 又取决于各个模型的预测值对预测对象的依赖性改变程度即属性的重要性,若重要性程度 高,则赋予较大的权重;反之,则赋予其较小的权重。由表2-3中各单一模型的权系数可 知,基于粗糙集的组合预测权系数确定方法能根据模型预测结果所提供的信息按照其反映现 实的真实程度对预测模型及其权系数进行有效的筛选和分配,从而保存了有效预测方法所提 供的有用信息。
将各单个模型与组合模型的预测偏差列于表2 - 4。
组合模型的预测值既依赖于各单一模型的预测值,又取决于其相应的权系数,而它们 的权重又取决于预测对象对各个模型的依赖度的改变程度即属性的重要性。由表2-3中各 单一模型的权系数可知,基于粗糙集的组合预测权系数确定方法能根据模型预测结果所提供 的信息按照其反映现实的真实程度对预测模型及其权系数进行有效的筛选和分配,从而保存 了有效预测方法所提供的有用信息。评价模型的拟合精度可利用预测模型偏差绝对值的最小 值和最大值固),基于粗糙集的组合预测模型偏差绝对值的最小值均小于5个单一预测模型 偏差绝对值的最小值;而组合预测模型偏差绝对值的最大值虽高于模型①和模型②,却低于 模型③、模型④和模型⑤,造成组合模型偏差的最大值大于模型①和模型②的主要原因是由 于预测模型和样本数据离散化方法的多样性,使得在选取样本数据和确定样本数据离散化方 法上很难做到完全合理,这也是利用粗糙集理论评价属性依赖度和重要性研究中有待进一步 探讨的问题。综上分析,可看出基于粗糙集的组合预测方法具有较好的拟合效果。
由表2-1可知,组合预测模型并不是在所有时刻的预测结果都比单一模型好,但有时 组合模型的预测值比各单一模型的预测值更接近粮食产量的实际值。这是由于组合预测模型 有比较好的拟合效果即有较小的预测偏差,而预测模型偏差是反映模型预测结果对实际数据 的偏离程度,当预测模型偏差较小时,则说明模型有较好的预测结果。此外,由于组合预测 模型聚集了各单一预测模型包含的有用信息,因而在总体上对未来变化的适应能力、稳定性, 以及反映发展趋势和预测结果准确性等方面都要比各单一模型更好些。
 
表2-4 浙江省1980-2002粮食总产量历史数据及预测模型拟合误差
年份粮食总产 单空型及组合模鑿误差
量/万吨 模型① 模型② 模型③ 模型④ 模型⑤ 组合模型
1980 1435.50 266.01 291.24 283.83 181.19 163.48 278.69
1981 1419.50 261.94 281.77 226.11 93.21 9&90 252.74
1982 1712.50 -51.14 ・ 36.33 -110.00 •231.50 •220.10 -7036
1983 1583.50 57.79 67.94 ・ 11.60 ・ 117.90 -103.90 33.45
】984 1817.00 -195.8 -189.90 -268.80 -360.50 -345.00 ・222.53
1985 1621.30 -20.16 -18.23 -92.53 ・ 170.80 -154.40 -47.55
1986 1605.10 -24.03 ・ 25.69 -92.72 -15&80 -141.80 -50.83
】987 1589.00 ・2&00 -32.89 ・ 90.82 ・ 145.90 ■12&40 -53.29
1988 1553.60 -12.68 ・ 20.45 -67.95 ・ 113.00 -95.06 -35.73
1989 1575.50 ・ 54.65 -64.97 -101.10 -136.80 J1&60 -74.88
1990 1586.10 -85.33 ・ 97.85 -121.80 -149.00 -130.60 -102.24
1991 )678.80 ・ 198.10 -212.50 -223.70 -243.10 -244.50 -211.29
】992 1553.60 ・ 92.87 ・ 107.00 -118.90 ・100」0 ・ 101.97
1993 1436.20 4.35 -12.86 2.46 -2.53 16.37 -0.35
1994 1404.00 16.48 -1.66 2732 2&84 47.85 16.46
1995 1430.90 ・ 30.49 -49.25 -6.44 1.21 20.32 ・ 25.57
1996 1516.80 •136.50 -155.50 •9&79 ・8533 -66.13 -126.38
1997 1493.53 -133.30 -152.40 -81.60 -62.63 -4335 -117.80
1998 1435.20 •95.01 -113.80 •29.02 -4.81 14.54 -73.97
1999 1392.96 ・ 72.85 -91.06 7.77 36.97 56.39 -46.05
2000 1217.69 82.35 65.00 177.85 211.83 231.30 115.07
2001 1055.68 244.29 208.09 334.91 373.46 392.99 263.10
2002 942.27 317.62 302.85 443.59 486.53 506.10 362.66
 
2.2.6小结
(1) 组合预测方法的关键是合理确定各单一模型的权系数,降低权系数计算复杂程度 与加强计算结果的客观性是组合预测研究领域的一个重要内容。
(2) 与其它确定组合预测权系数的方法相比,基于粗糙集的组合预测方法不需要建立 解析式的数学模型,完全是根据相关数据来确定各个预测模型的权系数,计算过程简便,且 预测结果较准确。
(3) 如何选取具有代表性的样本数据与合理化的属性数据离散化方法还有待今后做进 —步的探讨。
2.3基于粗糙集和模糊聚类的农业机械化水平评价方法
农业机械化是农业现代化的主要标志和重要内容,是实现农业现代化的重要基础。要发 挥农业机械化在农业现代化建设中的作用,首先必须正确认识现阶段农业机械化的发展水 平。然而,农村经济体制改革和社会主义市场经济的发展,导致了农机经营体制和经营规模 发生了变化,使原有的一些评价指标和标准难以客观、全面地反映一个地区或部门的农业机 械化水平。因此,建立农业机械化发展水平评价指标体系,制定相应的评价标准和建立评价 方法,对于健全农业机械化的宏观调控和微观指导,发挥农业机械化在建设农业现代化中的 作用,具有重要的现实意义。
2.3.1评价指标体系的建立
1.评价指标设置分析
评价农业机械化发展水平的实质就是对使用农业机械所产生的社会效果、经济效果进行 科学、合理地评价。在设置评价农业机械化发展水平的指标体系时,要从实际需要岀发,适 应农机经营的多种形式和管理水平。总的说来,要遵循科学、全面、简明、可比和实用的原 则。在评价指标体系的设置过程中必须重视以下几个方面的问题:
(1)要体现农业机械化发展过程中投入与产出之间的关系。正确反映投入与产出之间 的关系,是衡量和评价农业机械化发展水平最基本的经济尺度,也是农业机械化经济效果指 标最本质的特征。农业机械化的投入包括机器、劳力、技术、能源和资金等方面;产出则可 用农产品的产量、产值、收入和利润等来表示。
(2)应较全面地反映农业机械化发展的复杂性与经济水平、技术水平之间的相互联系、 相互制约的关系。农业机械化发展水平的评价指标体系应反映出直接效果和间接效果、单项 效果和综合效果、阶段效果和最终效果、经济效果和社会效果等方面的内容。
(3 )应能够全面反映农业机械化技术进步对农业及农村经济发展的影响和管理水平对 技术应用的作用,并能比较全面而清楚地体现相互之间的关系。
(4)设置的指标要以农业部颁布的农业机械化统计指标为主要依据,也要考虑与国家 统计局的统计指标相衔接,以及和农业现代化的要求相一致,以便于纳入国民经济统计指标 和农业现代化的指标体系。
评价农业机械化水平是对农业机械在农业生产中的使用效果进行评价,在评价农业机械 化发展水平时,应把农机作业作为基础,农业机械化的效果作为核心。没有农机作业就没有 农机化效果,而农业机械化的经济效果则是对机械化作业在经济上是否合理的一种反映。农 业机械化运用效果和经济效果的协调一致是农业机械化事业顺利发展的先决条件。农业机械 化评价指标体系涉及范围广泛,具体的资料收集整理和计算评价工作也相当繁重。
2.评价指标体系框架
农业机械化评价指标体系由3个1级指标组成,1级指标又包括若干2级指标【阪阿。
(1)农业机械化作业程度。反映机械化生产方式替代传统生产方式已经达到的程度, 即农业机械化在农业生产中实际作用的大小,是评价的基础。由于本文以浙江省的农业机械 化发展水平为评价对象,从浙江省的实际出发,现阶段农业机械化评价的主体仍界定在种植 业机械化上,机械化作业程度下设农作物耕整地机械化程度、栽播机械化程度、收获机械化 程度、植保机械化程度和排灌机械化程度5个2级指标。
(2)农业机械化综合保障能力。反映农机人员、农机装备和农机化社会化服务体系对 提高农业综合生产能力、实现发展目标的保障能力。下设农业劳均农机原值、播面顷均农机 动力、农机人员受教育程度、农机社会化服务体系建设程度4个2级指标。其中,前二项反 映农业机械装备保障能力;后两项反映农机人员保障能力和农机化社会化服务保障能力。
(3)农业机械化综合效益水平。农业机械化以经济效益为核心,才能持续、健康发展, 实现发展经济、增加收入、提高人民生活水平的目的。下设4个2级指标:用农业劳均年产 值反映农业劳动生产率水平;用农业劳均播种面积反映农业劳动力的生产规模,可间接反映 农村经济结构调整和劳动力的转移情况和农业机械化的作用与效果;用百元农机原值纯收入 反映农业机械化经营的直接效益;用千瓦动力农机作业收入反映农机作业效益。
由上述3个1级指标和13个2级指标就构成了农业机械化发展水平评价指标体系,如
 
图2-3 农业机械化发展水平评价指标体系
 
 
2.3.2评价指标和标准的计算与确定
1.二级评价指标的计算
耕整地机械化舷(B J=炎械聲gff面积% 1 oo%
耕地面积
机械播栽面积 农作物播种总面积 ° 收获机械化程度血=牆|||討叱 植保机械化程度(%)=務辱尊竽粤弩一 X100%
栽播机械化程度(尽2)=
农作物播种总面积
机械排灌面积
排灌机械化程度(场5)=蒜爲蒜聶积X】。。%
农业机械原值
农业劳均农机原值讣农忌翳富㈤人) 播面倾均农机动力血卜赭(kw血〉 农机人员受教育程度(% )=初中以上文]七彎各机人员数X 100%
农机人员总数
农机社会化服务体系建设程度(B24)=乡镇农机嘗昶务站数X100%
乡镇总数
农业劳均产值為卜农林牧渔业总产值(按当年价格计算) (元从)
农林牧渔业劳动力总数
农业劳均播种面积(场2)=药耆警豐聽熹(hm2/A) 农林牧渔业劳动力总数
百元农机原值纯收入(〃33)=豐詈^^ (元/百元) 农业机械原值
千瓦动力农机作业收入(禺4)=麴辖警令 (元%W) 农业机械总动力
2. 一级评价指标和农业机械化综合水平的计算
(2-18)
(2-19)
(2-20)
(2-21)
(2-22)
(2-23)
(2-24)
(2-25)
(2-26)
(2-27)
(2-28)
(2-29)
(2-30)
采用多指标分层次进行综合评价时,应将各单项指标评价得到的各指标指数,通过一定 的数学模型转换成综合评价指数。本文采用加权指数综合评分法〔7% 841,则3个1级指标与
农业机械化发展水平的计算公式如下
农业机械化作业程度0
B _ Wji xB]i | W]2 xb]2 I W]3XB]3 I W]4XB]4〔 Wj5 X%
I =标晰标冋2 标准% 标枫标准场5
农业机械化综合保障能力B2
& =叫隔 |临X% ] 计场3 |叫4X^4
标准禺I标准禺2标准禺3标准仍4
农业机械化综合效益水平B3
n = %产场1 *畋乂% * 坊3 +乌4乂场4
标准场]标准场2标准曷3标准场4
(2-31)
(2-32)
(2-33)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
农业机械化发展水平综合评价值B
5 = W] x5] + w2 xx (2 ~ 34)
由上述3个一级指标和农业机械化发展综合水平的计算公式可知,评价关键在于:一是 确定各个2级指标的标准值;二是确定各级指标的权重。
3.农业机械化发展水平评价标准的确定
在制定农业机械化发展水平评价标准时,应遵循以下原则:
(1)相对性原则。严格地说,评价农业现代化和农业机械化的发展水平没有绝对标准,
只有相对标准,农业现代化和农业机械化的评价标准是随着现代化和机械化的发展而不断变 化的。但是,在特定的时间、地点和历史条件下可以制定反映社会平均水平和发展目标要求 的评价标准。
(2)宏观性原则。就宏观评价而言,评价指标体系是反映当前社会平均水平和总体水 平,而不是反映个别对象的发展水平。
(3)指导性原则。标准的制定是以我国基本实现现代化为标准,结合并参照我国农业 机械化发展的实际情况和国内先进地区和国际经验来制定。评价标准对推进实现发展目标起 监督和指导作用。有些具体发展指标的评价标准可以是动态的,随着社会整体的发展而不断 变化,在每年进行评价时,可根据实际发展情况对评价标准进行适当修订,并使其更具有现 实指导作用。
根据上述制定评价标准的原则,在参照国内先进地区与国际经验以及相关文献的基础 上[84殉,制定出浙江省基本实现农业现代化时农业机械化发展水平评价指标体系中各指标 的标准值,如表2-5所示。
表2-5 浙江省农业机械化发展水平评价指标标准值
指标名称 单位 标准值
耕整地机械化程度 % 100
栽播机械化程度 % 100
收获机械化程度 % 100
植保机械化程度 % 100
排灌机械化程度 % 100
农业劳均农机原值 元/人 4000
播面顷均农机动力 kW/hm2 6.0
农机人员受教育程度 % 100
农机社会化服务体系建设程度 % 100
农业劳均年产值 元/人 60000
农业劳均播种面积 hn?/人 1.2
百元农机原值纯收入 元/百元 45
千瓦动力农机作业收入 7G/kW 600
在确定农业机械化发展水平评价指标体系中各指标的标准值后,就需要采用一定的方 法确定各个指标的权重。
目前有关农业机械化发展水平评价的常用方法有综合指数法、层次分析法和模糊评判 法[87-88)等。然而,这些方法的局限性在于确定指标的权重时主要依据专家的经验,致使这 些方法的评价结果带有较大的主观成分。鉴于此,本节在分析现有农业机械化水平评价方法 的基础上,利用粗糙集和模糊理论在处理不确定性问题方面的优势,结合上述建立的评价指 标体系,提岀了基于模糊聚类和粗糙集的农业机械化水平评价方法。
2.3.3农业机械化水平评价指标权重的确定
近年来,国内外一些学者将粗糙集与其它研究不确定性问题的方法结合起来研究有关的 数据挖掘方法,其中以粗糙集与模糊理论相结合的研究最为热门。
模糊集理论和粗糙集理论中的隶属函数都能够反映概念的模糊性,从直观上看二者具有 —定的相彳以性,但两者不同的是模糊集理论中的隶属函数大多是利用专家的经验给出的,因 而具有较大的主观成分;而粗糙集理论中的隶属函数则是通过对数据的分析,经过计算直接 获得,因而具有很强的客观性。由此可以看出,将粗糙集理论和模糊集理论结合起来去描述 知识的不确定性和不精确性,比它们各自去描述知识的不确定性和不精确性能显示出更强的 功能。因此,将模糊集理论和粗糙集理论有机结合起来,充分发挥各自的优点,就能简单、 高效地处理许多具有不确定性和不精确性的问题。
模糊聚类是模糊集理论中的一种常用方法,在处理事例相关信息时,不会引起任何事例 信息的损失,却无法确定影响事例各因素的重要性大小;而模糊集理论在数据处理时无需提 供数据之外的先验信息且能够确定影响事例各因素的重要性大小。因此,若将二者进行融合, 对受多因素(指标)影响的问题进行综合评价,则可在不损失任何事例信息和不提供数据之 外的先验信息的前提下,确定影响事例各因素的重要性的大小。
利用粗糙集理论与模糊聚类方法计算权重的步骤如下:
1.建立关系数据模型
在多层次多指标体系的某一层中,设有待处理的"个样本组成的集合A = {ax,a2,-,an}, 每个样本拥有加个属性(指标),某个样本的属性值用集合可表示为ai={an,ai2,-,aim}, 若将某个样本的属性数据视为研究对象的一条信息,则可定义 Uj = {an,aj2,---,ajm}(i = 1,2,•••,“),从而论域= {u},u2,---,un}八也称为样本集合。由拥有 m 个属性的n个样本的数据所构成的二维信息表就是关于多指标评价的关系数据模型,表中的 每一行描述一个对象,每一列描述对象的一种属性。
2.建立知识表达系统
要从样本中分析出属性的重要性,需利用属性对论域进行分类,并建立论域上的知识系 统。由论域、条件属性和决策属性构成的知识表达系统可表示为e (U, A, C, Q),其中 A = CDD, Cf)Q = 0。通常将具有条件属性和决策属性的知识表达系统称为决策表,决策 表中的每一行表示一种决策规则。论域中对象根据决策规则的不同被划分到不同决策类中。 对于包含条件属性和决策属性的关系数据模型,在建立知识表达系统后,利用决策表对拥有 全部属性的论域中对象进行分类,并逐次删减某一属性后重新分类,再结合粗糙集理论中的 属性依赖度和重要度就可计算出各属性(指标)的权重[69'89]o
但当无决策属性时,则无法利用决策表对论域中的对象进行分类。此时可利用模糊聚类 方法对拥有全部属性的论域中对象进行分类,并依次通过删减某一属性后对论域中对象重新 分类,分析各属性对样本分类的影响程度。具体步骤:
(1)建立模糊相似矩阵(J?)和模糊等价闭包矩阵(e(Q)
在建立模糊相似矩阵时,应消除属性指标特征值物理量纲的影响,即将属性指标特征值 归一化,使之在区间[0, 1]之间。具体采用何种归一化方法,可视具体情况,但为了避免在 样本数据比较分散时岀现大数“吃掉”小数的情况,可采用最大最小相似系数法,矩阵中系 数的计算公式:
rij =工(aik A ajk) /》(£* "切) (2-35)
k=\ fc=l
根据模糊相似矩阵(R)求得其传递闭包矩阵根据下式
e(R) = t(R) (2-36)
即可得到其等价闭包矩阵(e(R),传递闭包矩阵t (R)的计算可釆用平方法[虬皿,即
«/?) =," (2-37)
其中,"满足公式
2™'' <n<2m (2 - 38)
(2)根据模糊等价闭包矩阵中的矩阵系数确定若干个分类的置信水平養(jt = l,2「・,p) 或置信区间,进行分类。具体过程为:
首先,在置信水平血上,以置信区间的左边界为阈值,根据全部属性的等价闭包矩 阵将论域"划分为尸个等价类,记为U/R = {Xi,X2,---,Xi,--,Xr],定义血={[“]r |ue J7} o
然后,依次从全部属性中删除各个属性,计算等价闭包矩阵,在相同置信水平心上, 将论域[/划分为s个等价类,记为U/S = {Yx,Y2, -,Yj, -,Ys},定义={[u]s |ue(7} »
其中,R和S称为在论域[/上导出的两种知识。据此分析和计算各属性对分类影响和 两种知识的互信息量,进而确定各属性所包含的信息量与权重。在样本的全部属性数据与在 删除各个属性后样本的分类相同时,由于不能提供更多的信息,这种情况本文不予考虑。
3.计算各指标的权重
(1)计算删除各指标(属性)后在各个置信水平时的互信息量/心仏,S)
信息系统中的两种知识互信息量的计算公式为
I(R,S) = H(R)-H(R\S) (2-39)
H(R)——知识表达系统的初始爛,其计算公式为
H{R)=-工 P% ) log 2 恥') (2-40)
1=]
对于概率近似空间(U,R,P),系统的不确定性可用系统的嫡H(R)来表示。若近似空 间中没有定义概率测度,则可以将论域上任何一个等价划分关系或划分看成是定义在论域上 的子集组成的。代数上的概率分布,这时在每一个集合上的概率定义为该集合的基数与论 域的基数之比。
H(S | R) —— 在已知知识R时,知识S的条件爛,计算公式为
_s
H{S 皿)=-工P0 )工 P(ry | 兀)log严必) (2-41)
i=l ;=1
P(Yj |Jf,) —— 集合与在集合九上的条件概率,计算公式为
卩旳=卅 (2-42)
条件爛H(S | R)表达知识S关于知识R的信息依赖性的程度。
互信息量反映了知识S从知识R上获取的信息量,则某一属性所含信息量可表示为
",=丄 £八/九(R,S) (i = l,2,…,m) (2-43)
p k=\
(2)根据指标(属性)所含信息量的确定权重
对各指标所含信息量进行归一化处理,进而得到各指标的权重值。计算公式为
(2-44)
2.3.4农业机械化发展水平的综合评价
现以浙江省2002年11个地区(市)的相关统计数据作为样本数据,在确定图2-3所 示指标体系中各指标权重的基础上,对农业机械化发展水平进行综合评价。
 
1.二级评价指标权重的确定
(1)耕、播、收、植保和排灌作业机械化程度5个指标权重的确定。
由2002年浙江省11个地区(市)耕、播、收、植保和排灌作业机械化程度五个单项作 业指标的统计数据组成的关系数据模型甌),如表2-6所示。
表2-6 2002年浙江省11个地市耕、播、收、植保和排灌作业机械化程度
名称 论域U 并整地机械化 栽播机械化 收获机械化
程度/% 植保机械化排灌机械化
程度/% 程度/%
程度/% 程度/%
杭州 7&21 2.58 40.65 88.25 56.71
宁波 64.53 2.47 74.95 81.72 94.05
温州 "3 53.87 0.36 31.90 51.56 51.73
嘉兴 73.49 0.29 29.25 38.56 98.71
湖州 76.65 0 36.52 4」5 97.18
绍兴 68.25 1.62 51.04 36.46 71.01
金华 w7 66.81 035 26.97 21.50 51.74
衢州 46.79 0 8.81 14.05 25.00
舟山 60.45 0 5&97 35.32 72.36
台州 »10 66.36 0.44 33.24 26.93 56.03
丽水 ⑷丨 34.14 0 1.80 7.00 11.64
根据表2-6中的统计数据, 利用式(2-35)、(2-36)计算可得所有样本数据的相似矩阵《
10000 0.7724 0.5729 0.5402 0.4614 0.6887 0.5144 0.2714 0.5067 0.5673 0.1598
0.7724 1.0000 0.5060 0.5634 0.4769 0.6937 0.4452 0.2421 0.5777 0.4935 0.1411
0.5729 0.5060 1.0000 0.6956 0.5296 0.6277 0.7708 0.4784 0.6746 0.7954 0.2789
0.5402 0.5634 0.6956 1.0000 0.7828 0.6805 0.7215 0.3919 0.7010 0.7436 0.2285
0.4614 0.4769 0.5296 0.7828 1.0000 0.5768 0.6306 0.3892 0.6474 0.6531 0.2471
R = 0.6889 0.6937 0.6277 0.6805 0.5768 1.0000 0.6390 0.3405 0.7495 0.7047 0.1985
0.5144 0.4452 0.7708 0.7215 0.6306 0.6390 1.0000 0.5328 0.6531 0.9021 0.3106
0.2741 0.2421 0.4784 03919 0.3892 0.3405 0.5328 1.0000 0.4190 0.4831 0.5830
0.5067 0.5777 0.6746 0.7010 0.6474 0.7495 0.6531 0.4190 1.0000 0.7108 0.2443
0.5673 0.4935 0.7954 0.7436 0.6513 0.7047 0.9021 0.4831 0.7108 1.0000 0.2817
0」598 0.1411 0.2789 0.2285 0.2471 0.1985 0.3106 0.5830 0.2443 0.2817 1.0000
由相似矩阵R,利用式(2-37)、(2-38)可求出等价闭包矩阵e
 
 
e(R) =
 
根据上述模糊等价闭包矩阵,可得全部样本数据在不同置信水平时的分类结果。
根据模糊等价闭包矩阵得到在不同置信水平时的分类结果为
①在0.70<2] £0.75 时,全部样本分为 4 类:, {u3,u4,w5,»6>m7>h9>mio} > %},
o系统的初始爛H(R)= 1.4911;
②在 0.75 <血 £0.80 时,全部样本分为 7 类:{u]tu2} , {“3,“7,"io},仙,%},-伽},
{»,}. {mh}=系统的初始爛 H(R) = 2.6635;
③在0.80<23 <0.85时,全部样本分为10类:仙}, {u2} , {巧},仙},{"5},叫},
{巧,“io},{»8} - {“订,{"id。系统的初始爛H(R) = 3.2776;
④在0.85 <A4 <0.90 时,全部样本分为 10 类:仙}, {u2} , {巧},{"4},{"5},{»6)>
{u7,u10} , {u8}> {u9}, {«„}« 系统的初始爛H(R) = 3.2766;
计算耕整地机械化程度(01)所含信息量。
在删除耕整地机械化程度(BG后,利用公式(2-35). (2-36)计算可得相似矩阵R
R =
 
由相似矩阵利用式(2-37)、(2-38)可求出等价闭包矩阵e CR)
 
e(R) =
 
根据模糊等价闭包矩阵,可得在不同置信水平时的分类结果。
①在0.70</1] <0.75 时,全部样本分为 3 类:{mi,u2,m3,u4)u5,w6,w7)u9,w1()} , {w8}, {"“};
②在 0.75 < < 0.80 时,全部样本分为 5 类:,M2} ' {M3,M4,m5>M6>u7>u9>m1o} * {m8)>
{"11}:
③在0.80<久3 <0.85时,全部样本分为 7 类:{“]} , {«2} , {%},{“4,"5},{"6,“7,"9,"10},
> {"(;
④在0.85 <A4 <0.90,全部样本分为9类:仙},仙},{旳},仙},仙},{"6,"9},
{M7 >M10)' {m8)' {Mlll 0
删除耕整地机械化程度(0J后,计算可得在各个置信水平时的互信息量值。
①在 0.70 < A, < 0.75 时,条件爛 H(R|S) = 1.0716,互信息量 Zo’oCb,,5,,) =0.4105;
②在0.75< A2 <0.80 时,条件爛H(R|S)=0.1818,互信息量7o.75(C5, >^5,,) = 2.4817;
③在 0.80 <2}< 0.85 时,条件爛 H(R|S)=0,互信息量 /o go (Cb,,Cb”)= 3.2726;
④在0.85<A4 <0.90 时,条件爛H(R|S)=0.1818,互信息量厶阳(5 ,Cb“)= 3.0956。
由此可得耕整地机械化程度(0|)所含信息量何环=1.8505。
同理,可得其它4个指标所含的信息量: 根据上述5个指标所含信息量,利用公式(2-44),计算可得5个指标的权重。
 
(W", W]2, Wj3, Wm,w“)= (0.1814, 0.2075> 0.2109> 0.2109, 0.1893)。
(2)农业劳均农机原值、播面顷均农机动力播、农机人员受教育程度、农机社会化服务 体系建设程度4个指标权重的确定
由2002年浙江省11个地区(市)农业劳均农机原值、播面顷均农机动力播、农机人员 受教育程度、农机社会化服务体系建设程度4个单项作业指标的统计数据组成的关系数据模 型,如表2-7所示。
表2 -7 2002年浙江省11个地区(市)农业机械化综合保障能力的4个单项指标值
名称 论域U 农业劳均农机.
原值/元•人" 播面顷均农机
动力/kW • hm'2 农机人员受教育
程度/% 农机社会化服务
体系建设程度/%
杭州 2093.43 12.69 61.08 100.00
宁波 »2 1317.72 11.06 55.87 100.CM)
温州 860.15 7.25 47.62 93.94
嘉兴 站4 1534.77 9.31 54.49 100.CX)
湖州 154430 12.72 53.20 100.W)
绍兴 "6 1478.40 11.96 66.20 99.12
金华 1034.27 10.57 64.90 1(X).OO
衢州 »8 765.89 4.54 69.77 1(X).OO
舟山 »9 946.11 13.88 67.79 90.91
台州 u10 879.53 7.90 53.09 98.41
丽水 »11 585.47 5.69 75.05 91.75
 
根据表2 -7中的统计数据,可求得农业机械化综合保障能力4个2级指标所含的信息量。
农业劳均农机原值(521)所含信息量巧?, =20267;
播面顷均农机动力(%)所含信息量叭” =19203;
农机人员受教育程度(场3)所含信息量何b” =2.0267;
农机社会化服务体系建设程度(B24)所含信息量巾“ =16037。
根据上述4个指标所含信息量,可求得农业机械化综合保障能力4个2级指标的权重:
(W21, w22, W23, w24) = (0.2675, 0-2534, 0.2675, 0.2116)
(3)农业劳均年产值、农业劳均播种面积、百元农机原值纯收入、千瓦动力农机作业
收入4个单项作业指标权重的确定
由2002年浙江省11个地区(市)农业劳均年产值、农业劳均播种面积、百元农机原值 纯收入、千瓦动力农机作业收入4个单项作业指标的统计数据组成的关系数据模型,如表 2-8所示。
表2 -8 2002年浙江省11个地市农业机械化综合效益水平的4个单项指标值
名称 论域" 农业劳均年
产值/元•人" 农业劳均播种
面积/hn? •人" 百元农机原值纯
收入/元・百元" 千瓦动力农机作业
收入/元• kW_1
杭州 15833.49 0.2013 33.59 515.31
宁波 17695.31 0」867 57.85 701.33
温州 "3 7603.48 0.15H 54」3 824.29
嘉兴 18116.02 0.3496 37.89 459.36
湖州 »5 14206.99 0.2045 27.61 377.07
绍兴 15284.45 0.2022 30.19 368.90
金华 6793.89 0.1336 33.57 586.71
衢州 "8 8212.44 0.2083 38.82 601.69
舟山 41368.54 0.0762 40.52 722,75
台州 WJ0 12563.98 0.1383 46.43 888.38
丽水 »11 7641.08 0.1511 34.87 454.55
根据相同的方法,可求得农业机械化综合效益水平的4个单项指标所含的信息量。
农业劳均年产值(鬲「)所含信息量羽阳=1.8982;
农业劳均播种面积(爲2)所含信息量=1.8450;
百元农机原值纯收入(B33)所含信息量=1.7360;
千瓦动力农机作业收入(尽4)所含信息量羽% =1.7520。
则利用式(3-44)可求得农业机械化作业综合效益水平4个2级指标的权重:
(W31,W32, W33, W34)= (0.2625, 0.2551, 0.2401, 0.2423)
2. 一级评价指标权重的确定
在计算出所有2级指标的权重后,利公式(2-31)〜(2-33)可分别计算出11个地区 (市)农业机械化作业程度、农业机械化综合保障能力和农业机械化综合效益水平3个1 级评价指标值,结果见表2 - 9。
根据表2 - 9中的数据,利用相同的方法,可求得上述3个一级指标所包含的信息量 农业机械化作业程度(0)所含信息量% =2.5569 农业机械化综合保障能力(血)所含信息量也2 =2.2455
 
农业机械化综合效益水平(尽)所含信息量沪乌=2.1842
根据3个1级指标所含信息量可以求得3个指标的权重为
(W],W2,W3)= (0.3660, 0.3214, 0.3126)
表2 - 9 2002年浙江省11个地区(市)农业机械化水平3个一级评价指标值
名称 论域U 农业机械化
作业程度/% 农业机械化
综合保障能力/% 农业机械化
综合效益水平/%
杭州 »1 52.64 76.84 49.95
宁波 63.06 70.26 59.95
温州 "3 37.17 63.71 54.78
嘉兴 ”4 46.38 71.34 54.12
湖州 "5 40.88 71.06 40.52
绍兴 "6 44.61 73.91 41.99
金华 32.17 70.78 47.42
衢州 1&04 64」2 52.97
舟山 44.55 69.04 65.57
台州 W1O 35.43 65.53 56.68
丽水 «11 10.25 67.44 43.52
3.农业机械化发展水平的计算
再利用式(2-34)计算出11个地区(市)的农业机械化发展水平,见表2-10o
表2 10 2002年浙江省11个地区(市)农业机械化水平的综合评价值
 
名称 杭州 宁波 温州 嘉兴 湖州 绍兴 金华 衢州 舟山 台州 丽水
农业机械化 发展水平/% 59.58 64.40 51.20 56.82 50.47 53.21 49.35 43.77 5&99 51.75 39.03
将表2-10中各地区(市)以种植业为主体的农业机械化发展水平评价结果与浙江省从 事农机管理工作的有关专家进行交流,认为除舟山市的综合评价结果稍微偏高了些,其余 10个地(市)以种植业为主体的农业机械化综合评价水平与实际情况基本一致。
由表2-10可知,浙江省各地区的农业机械化水平是极不平衡的,如农业机械化水平最 高的宁波市(64.40%)与最低的丽水市(39.03%)二者相差25.37%。究其原因是在宁波、 杭州等经济发达地区的农机装备水平高,加之劳动力、产业结构和规模经营都得到比较合理 的转移、调整与开展,因而农业机械化水平较高;而农业机械化水平低的丽水、衢州等市除 了经济相对落后等因素外,还与其自身地处山区丘陵,地块小、水田多,机械化本身难度大 有关,等等。这些都说明农业机械化是一个受地理环境、经济基础和技术水平等许多不确定 因素影响的系统。此外,从各层次各指标的权重分配结果来看,本文所提方法在一定程度上 能够反映出,在利用多指标对农业机械化水平进行评价时,应以农机作业为基础,并根据实 际情况考虑引导性,给予各指标不同的权重的评价要求,从而揭示了农业机械化水平评价指 标体系各指标之间所隐含的规律。
2.3.5小结
(1) 在数据挖掘领域,将粗糙集与模糊理论相结合是近年来粗糙集与其它研究不确定性 问题方法中结合的研究热点。一方面,粗糙集在描述模型方面能力较其它方法弱,而这模糊 集理论在这一点上非常的强;另一方面,模糊集理论不能对需解决的问题提岀自己的数学公 式,而利用粗糙集理论这一问题则能简单地加以解决。将模糊集理论和粗糙集理论相结合能 发挥各自的优点,实现简单、高效地处理具有不确定性和不精确性的问题。
(2) 在多指标综合评价的问题上,将模糊聚类与粗糙集理论结合起,可在不损失研究对 象信息和不提供数据之外的先验信息的前提下,通过分析评价指标体系中各指标所包含的信 息量来计算各指标的权重。
(3) 农业机械化发展水平是一个受多种不确定性因素影响的综合性指标,合理确定各指 标的权重是评价的关键。本文将模糊聚类与粗糙集理论相结合,从评价指标的统计数据出发, 根据各指标中含信息量的大小来确定其相应的权重,克服了现行农业机械化发展水平评价方 法中存在的主观因素对权重分配影响,使得评价结果具有相对客观性。
2.4农业机械总动力变化的灰色系统分析
2.4.1弓|言
农业机械总动力是指用于农、林、副、渔的各种动力机械的动力总和,包括耕作、收获、 植保、排灌、渔业、加工、畜牧和农用运输等其它机械。农业机械动力与结构是反映和评价 农业机械化水平的一个重要指标,是农业生产的动力来源。目前有关农业机械总动力的研究 主要停留在总量变化的预测方面,而对影响农业机械动力变化因素的分析还不够深入氏~95】。 农机总动力的需求变化受自然、经济、技术和社会等多种因素的影响,而这些因素的大部分 是“灰色”的,因而可认为农业机械总动力这一系统是受“灰因素集”的制约,这也说明农 业机械总动力的变化具有灰色系统的特点。因此,利用灰色系统理论和方法分析影响农业机 械总动力变化的因素,能为从总体上把握农业机械总动力的变化趋势,正确认识农业机械总 动力的宏观发展特征,制定农机动力发展规划和出台相关政策提供科学依据。
灰色系统(Grey Systems,简记为GS)理论是控制论的观点和方法延伸到社会、经济 系统的产物,是自动控制科学与运筹学等数学方法相结合的成果,也是系统科学体系中一个 分支,它是由我国学者邓聚龙教授于20世纪80年代前期提出的卩宀刀。目前已广泛地应用 于农业和社会经济领域,并取得了显著成就[9—04】。与研究“随机不确定性”的概率统计和 研究“认知不确定性”的模糊数学不同,灰色系统理论的研究对象是"部分信息已知,部分 信息未知”的“小样本”、“贫信息”不确定性系统!101~,021o它通过对“部分”已知信息的生
成、开发了解现实世界,实现对系统运行行为和演化规律的正确把握和描述。
2.4.2灰色系统理论相关概念
1.关联性和关联度
客观世界中存在着大大小小的各类系统,都是由许多因素组成的。这些系统及系统因素 之间,相互关系非常复杂。特别是表面现象变化的随机性容易混淆人们的直觉,掩盖事物的 本质,使人们在认识、分析、预测和决策时得不到充分全面的信息,不容易形成明确的概念。 因此,不仅不同系统之间的关系是灰的,同系统中不同因素之间的关系也是灰的。人们一时 会分不清哪些因素关系密切,哪些因素关系不密切,也就是说难以找到主要矛盾,抓住主要 特征与主要关系。为此,灰色系统理论提出了关联度分析的概念,其目的就是通过一定的方 法理清系统中各因素的主要关系,找出影响最大的因素,把握矛盾的主要方面。
对两个系统或两个因素之间关联性大小的量度,称为关联度。它描述系统发展过程中因 素间相对变化的情况,也就是变化大小、方向及速度等指标的相对性。如果两者在系统发展 过程中相对变化基本一致,则认为两者关联度大;反之,两者关联度就小。可见,灰色关联 度分析是对一个系统发展变化态势的定量描述和比较。只有弄清楚系统或因素间的这种关联 关系,才能对系统有比较透彻的认识,分清哪些是主导因素,哪些是潜在因素,哪些是优势 而哪些又是劣势。因此,对于一个灰色系统进行分析研究时,首先要解决如何从随机的时间 序列中找到关联性,计算关联度,以便为因素判别、优势分析和预测精度检验提供依据,为 系统决策打好基础。因此,灰色因素间的关联度分析是灰色系统分析、预测和决策的基础。
灰色系统理论的关联度分析与数理统计学的相关分析是不同的,两者的区别在于:一是 理论基础不同,关联度分析是基于灰色系统的灰色过程,而相关分析则基于概率论的随机过 程;二是分析方法不同,关联分析是进行因素间时间序列的比较,而相关分析是因素间数组 的比较;三是数据量要求不同,关联分析不要求数据太多,而相关分析则需要有足够的数据 量;四是研究重点不同,关联度分析主要研究动态过程,而相关分析则以静态研究为主。因 此,关联度分析适应性更广,在社会经济系统中的应用更有其独到之处。
2.关联度分析步骤
关联度分析一般包括下列计算和步骤:原始数据变换、计算关联系数、求关联度、排关 联序和列关联矩阵等五个步骤。在应用中是否进行所有步骤,可视具体情况而定。
设有巾个时间序列
凶°)(0}, {嘉°%)},…,{X律)(r)},(戶 1, 2,…,N)
N为各序列的长度即数据个数,这巾个序列代表巾个因素(变量)。另设定时间序列:
闵°)(/)}, (/=1, 2,…,N)
该时间序列称为母序列,而上述加个时间序列称为子序列。关联度是两个序列关联性 大小的度量。根据这一观点,可给关联度一个量化模型,其计算方法与步骤具体如下:
(1)原始数据变换
由于系统中各因素的量纲(或单位)不一定相同,如劳动力为人,产值为万元,且有 时数值的数量级相差悬殊,等等,这样的数据很难直接进行比较,且它们的几何曲线比例也 不同。因此,对原始数据需要消除量纲(或单位),转换为可比较的数据序列。有关原始数 据变换的方法目前有以下几种:
①均值化变化:先分别求出各个序列的平均值,再用平均值去除对应序列中的各个原 始数据,所得到新的数据列即为均值化序列。其特点是量纲唯一,其值大于0,并且大部分 近于1,数列曲线互相相交。
②初值化变换:分别用同一序列的第一各数据去除后面的各个原始数据,得到新的倍 数数列,所得到新的数据列,即为初均值化序列。其特点是量纲为一,各值均大于0,且数 列有共同的起点。
③标准化变换:先分别求出各个序列的平均值和标准差,然后将各个原始数据减去平 均值后再除以标准差,所得到的新数据序列即为标准化序列。量纲为一,其均值为0,方差 为lo
一般情况下,对于较稳定的社会经济系统数列作动态序列的关联度分析时,多采用初 值化变换,因为这样的数列多数是增长的趋势。若对原始数列只作数值间的关联比较,可用 均值化变换,如产业结构变化的关联分析等。
(2)计算关联系数
经过数据变换的母数列记为子数列记为则在时刻戶丘时,母数列记
{X°(r)}与子数列{^,(0}的关联系数可用下式计算
min min | x。(&) - x,- (k) \ +p max max | x0 (k) - x,- (k) |
§0i 伙)=~~| * ,,, TTTj !~. * ,,, 77T7 (2 ~ 45)
IX。(k) -xj(k)\+p max max \x0(k)~ Xj(k)\
i k
因为比较序列相交,故一般取minmin I勺仗)-旺伙)1= 0 , p称为分别系数,其意义是削 i k
弱最大绝对差数值maxmax |勺伙)-齐伙)|太大引起的失真,提高关联系数之间的差异显著 i k
性,pe(0, 1), —般情况下可取0.1~0.5o关联系数反映两个被比较序列在某一时刻的紧密 (靠近)程度,其取值范围在0-1之间。
(3)求关联度
关联度分析实质上是对时间序列数据进行几何关系比较,若两序列在各个时刻点都重
合在一起,即关联系数均等于1,则两序列的关联度也必等于1;另一方面,两比较序列在 任何时刻也不可垂直,所以关联系数均大于0,故关联度也都大于0。因此,两序列的关联 度便以两比较序列各个时刻的关联系数的平均值计算,即
心討)
式中心为子序列i与母序列0的关联度,N为比较序列的长度(即数据个数)。
从上述分析可知,关联度与下列因素有关:母序列{如)(0}不同,则关联度不同;子序 列{&()}不同,则关联度不同;参考点0 (或数据变换)不同,关联度不同;数据序列长 度N不同,关联度不同;分别系数°不同,关联度不同。
一般说来,关联度也满足等价“关系”三公理,即自反性、对称性和传递性。
(4)排关联度序
将巾个子序列对同一母序列的关联度按大小顺序排列起来,便组成关联序,记为{X}。
它直接反映各个子序列对于母序列的“优劣”关系。若r0a>r0b,则称{X。}对于相同母序列
{X。}有优于{心}的特点,记为{乙|竝}》{兀丨心};若rOa <rOh,则称{乙}对于母序列 {X。}劣于陲},记为{乙|竝川{兀|竝};若rOa=rOb,则称{九}对于母序列{X。}等价于 {九},记为{Xa\X0}~{Xb\X0},等等。
根据上述几种关系,可定义有代表性的关联序,即“有序”与“偏序”。若关联序{X}为 有序。那么所有元素之间必存在以下几种关系之一:“优于”(》),“劣于”(Y),或等价于
(〜)。若关联序{X}为偏序,则不是所有元素都可比较的。
一般来说,各因素只要能构成关系,则总是“有序”;只有在无“参考点”或无参考母 序列的情况下,才可能出现“偏序”现象。
(5)列出关联矩阵
若有n个母序列厲},{孔},…,{/„} 5北2)及m个子序列的} , {X2},…,{X”} (m * 1), 则各子序列对母序列区}有关联度[巾,/,…』^],各子序列对母序列{Y2}有关联度 冋吃,…,%],类似地,各子序列对母序列{『”}有关联度[『”"2,…,仏]。
将勺(i = l, 2,…,”力=1, 2,…")作适当排列,可得到关联矩阵:
 
关联度矩阵(简称关联矩阵),不仅可作为优势分析的基础,而且还可作为决策的依据。
2.4.3农业机械总动力影响因素的灰色关联分析
1.影响农机总动力增长的因素分析
农业机械化是增强农业综合生产能力,提高土地生产率、劳动生产率和扩大生产规模的 主要影响因素,它的发展受到如工业化程度、自然环境、农村社会经济水平等众多因素的影 响。如何定量分析各种影响因素对农业机械化发展的作用,并把重要的影响因素转化为可量 化的分析指标,是农业机械化系统分析工作的重要内容。在实际分析中,需要确定分析指标 的数量,建立各个指标与农业机械化发展水平关系的定量分析模型。在国内目前的技术条件 和社会经济水平条件下,就某一区域而言,农业机械化能否快速发展,除了受到技术进步与 创新,以及政府的支持和宏观调控力度外;另一方面还需要视农业生产对它有无需求和经济 条件上有无可行性,这种需求和经济的可能程度可以归纳为以下几个方面a】:
(1) 增强农业综合生产能力,提高土地生产率和农业劳动生产率,扩大已有农业生产 规模的需求;
(2) 促进农业生产技术进步、降低生产成本、减少损失、增加农民收入,提高农产品 数量和质量的需求;
(3) 提高生活物质条件,降低劳动强度,改善生产环境的需求。
上述三个方面的需求构成了促进农业机械化发展的动力因素。综合生产能力提高和生产 规模扩大可用农业劳均粮食播种面积和农业劳均产值这二个指标综合反映;而降低生产成 本,提高经济效果,增加农民收入,改善生产条件,可用农民年纯收入和粮食单位面积产量 两项指标综合反映。因此,可选择这4个指标作为在总量层次上分析农业机械总动力与其主 要影响因素之间关系的定量分析指标。
下面以1981-2003年浙江省农业机械总动力、农民人均年纯收入、农业劳均粮食播种面 积、粮食单产和农业劳均年产值进行关联分析。以上各指标的统计数据如表2-11所示。
2.农机总动力与影响因素关联度的计算与分析
根据上述影响农业机械总动力的因素分析,本文以农业机械总动力作为灰色关联分析的 参考数列,Xo(M)表示农业机械总动力在不同时刻的数据;以粮食单位面积产量、农业劳均 粮食播种面积、农民年纯收入和农业劳均产值数据项为关联数列,记为%,. (i=l~4), Xi(k)
表示各影响因素在不同时刻的数据,并根据关联度计算公式,得到关联数列对参考数列的灰 色关联度。然后根据关联度的大小,按顺序排列起来组成关联序,从而判断关联数列(影响 因素)对参考数列(农业机械总动力)的影响大小。
各时刻的关联系数可利用公式(2-45)计算,「仏)表示参考数列与关联数列在第丘个
时刻的关联系数,其大小可作为数列间关联程度的衡量尺度。对于分辩系数0,本文计算时 取0.5,由于关联系数表示数列在各个不同时刻的关联程度,所以它的数不止一个,造成信 息过于分散,不便于比较进行整体性比较,而灰色关联度将各个时刻关联系数集中为一个值, 是从总体上衡量数列之间的关联程度。关联度则利用公式(2-46)来计算。不同时刻的关 联系数和整个分析期内的关联度的计算结果及关联序见表2-llo
表2 11 1981-2003年浙江省农机总动力及其影响因素的统计数据
年份 农机总动力
/万kW 粮食单产
/kg •Im'2 农业劳均粮食播种
面积/hrr?•人" 农民人均纯收入
/元•人I 农业劳均产值
/元人
1981 584.62 4205 0.2155 280.40 610.11
1982 628.10 4981 0.2124 346.00 729.43
1983 681.86 4551 0.2058 358.86 701.69
1984 754.49 5218 0.2450 44637 1037.62
1985 810.02 4956 0.2592 548.60 1379.35
1986 88931 5069 0.2506 609.31 1519.69
1987 974.62 4911 0.267 725.00 1809.89
1988 1075.91 4840 0.2546 902.00 2241.63
1989 1133.48 4823 0.2463 1011.00 2352.62
1990 1215.73 4856 0.2444 1099.00 2480.81
1991 1265.46 5020 0.2422 1211.00 2693.03
1992 1352.03 4910 0.2364 1359.00 2965.35
1993 1417.88 5049 0.2296 1746.00 3955.34
1994 149734 5122 0.2308 2225.00 5812.55
1995 1639.80 5084 0.2456 2966.00 7581.66
1996 1707.59 5272 0.2562 3463.00 8306.32
1997 1733.33 5199 0.2596 3684.00 9080.87
1998 1798.84 5127 0.2539 3815.00 9101.84
1999 1912.53 5062 0.2563 3948.00 9363.25
2000 1990.01 5359 0.2201 4254.00 10415.20
2001 2017.24 5628 0.1904 4582.00 10694.95
2002 2053.21 5709 0.1785 4940.00 1185331
2003 2039.68 5557 0.1635 5431.00 13348.04
 
 
表2 12 1982-2003年浙江省农机总动力和影响因素的灰色关联系数和关联度
年份 粮食单产 农业劳均粮食播种面积 农民人均纯收入 农业劳均产值
X] X2 兀4
1982 0.98816 0.99044 0.98294 0.98699
1983 0.99095 0.97754 0.98781 0.99824
1984 0.99463 0.98356 0.96827 0.95730
1985 0.97798 0.98051 0.94154 0.91308
1986 0.96681 0.96243 0.93380 0.90460
1987 0.94850 0.95079 0.90918 0.87618
1988 0.93026 0.93313 0.86979 0.83372
1989 0.92070 0.92033 0.84655 0.82746
1990 0.90862 0.90677 0.83326 0.82233
1991 0.90450 0.89832 0.81018 0.80344
1992 0.88926 0.88322 0.78395 0.78303
1993 0.88247 0.87115 0.70749 0.69384
1994 0.87254 0.86053 0.63051 0.56896
1995 0.85210 0.84661 0.54190 0.48865
1996 0.84652 0.84149 0.49370 0.46231
1997 0.84176 0.83932 0.47473 0.43548
1998 0.83192 0.82884 0.46618 0.43709
1999 0.81641 0.81536 0.45966 0.43228
2000 0.81195 0.79420 0.43864 0.40218
2001 0.81320 0.78174 0.41633 0.39507
2002 0.81017 0.77407 0.39462 0.36616
2003 0.80924 077105 0.36669 0.33333
关联度 0.89603 0.88746 0.70686 0.68355
关联序 I 2 3 4
 
3.结果分析与讨论
(1)农业机械总动力与粮食单产的关联分析。农业机械化对粮食生产有直接增产和间 接增产的作用,直接增产的作用表现在节约农时、抗灾害、改善作物生长环境等方面;而间 接增产作用主要表现在促进精量施药、精播良种、地膜覆盖等农艺技术措施的实现等方面。 关联分析结果表明,粮食单产与农业机械总动力显著相关,整个分析期内关联度为0.8960, 在20世纪80年代、90年代和本世纪初的关联度分别为0.9642、0.8646和0.8111,其关联 序在上述三个时期内均处在第1位,虽然二者的关联度呈现下降趋势,但下降的幅度是最小 的。这表明若要提高粮食单产,即使在经营面积扩大受到限制的条件下,就必须要增加农业 技术和装备的投入,而农业机械化是保证投入产出效益的有效手段之一。
(2)农业机械总动力与劳均粮食播种面积的关联分析。劳均粮食播种面积在一定程度 上反映了农业经营规模的大小。所谓规模经营是指在一定生产力水平和经营环境下,经营者 为取得最佳经济效益所能够经营的最大土地面积,虽然土地面积只是规模经营的一个条件, 但在规模经营中,农业机械可以在各个生产环节中充分发挥其功效,从而降低生产成本、达 到高产、高效的目的。在整个分析期内,农业机械总动力与农业劳均粮食播种面积的关联度 为0.8875,关联序排在第2位,与排在第1位的农业机械总动力与粮食单产关联度仅相差 0.0085 o由表2-12可知,在20世纪80年代近乎一半时期其关联系数处于第1位,到了 20 世纪90年代,虽然其关联度排在第2位,但与农机总动力和粮食单产的关联度非常接近。 这就从理论上解释了发展农业机械化对促进农业经营规模具有重要作用,因此,进行土地规 模经营是提高粮食单产的有效途径之一。
(3)农业机械总动力与农民人均纯收入的关联分析。目前,农业机械化是实现农民增 收的重要手段之一。一方面是农业机械化不仅能够提高粮食单产和节省种子、农药、化肥等 农用物资,而且有助于机械化运输、加工等多种经营经营的开展,实现创收节支的效果。关 联分析的结果表明,农业机械总动力与农民人均收入在整个观测期内的关联度为0.7069,且 在观测期内二者的关联度变化幅度是非常大的,从二者关联系数变化趋势可以看岀,其关联 度在20世纪80年代同粮食单产、劳均粮食播种面积、农民人均纯收入三个指标与农业机械 总动力的关联度相差不大,分别为0.9642、0.9623、0.9300和0.9122,到了 20世纪90年代 和本世纪初,农业机械总动力与农民人均纯收入的关联度却大幅度下降,分别下降到0.6202 和0.4041,在上述四个影响因素中,其关联序基本上处于第3位。这说明仅有农民人均收入 的增长,而没有进行土地适度规模经营和提高粮食单产的要求,农业机械总动力的增长将是 缓慢的,进而也就会影响农业机械化水平的提高。
(4)农业机械总动力与农业劳均产值的关联分析。在各种农业生产技术手段中,农业 机械化对提高劳动生产率具有非常突出的优势,同时农村产业结构和劳动力结构的调整,都 有赖于农业机械化的发展。从分析期内的总体情况来看,农业机械总动力与农业劳均产值的 关联度处于剧烈的变动之中。从二者的关联系数变化情况来看,其关联度的变化与农业机械 总动力和农民人均纯收入的关联度呈相同的变化态势,即在20世纪80年代有非常高的关联 度,且其关联序一度排在第1位(1983年),进入20世纪90年代和21世纪初,农业机械 总动力与农业劳均产值的关联度快速下降,与20世纪80年代相比,其下降幅度分别为0.3195 和0.5380,其关联序一直处于最后一位。这表明农业机械化的发展有力地促进了农业劳动力 的转移和农业产业结构的调整,与此同时,使农业劳动力能够从事其它农村经营,从而导致 
农业劳均产值的结构生了重大变化。
综上所述,可以看出一旦有提高粮食单产、增加农民收入和扩大土地经营规模,以及调 整农业产业结构的需求,或者四者同步增长,农业机械化就会有较快的发展。因此,随着农 业机械总动力的增长,机械化作业领域不断扩大,作业水平和作业效率不断提高,每个劳动 力负担的耕地面积也将会不断增加,即从事种植业的劳动力数量将会随之减少,从而使原有 的农村种植业劳动力转移到其它产业的劳动力数量增多,劳动力的结构趋向合理,随之农民 的经济收入得到提高,这样农民用于发展农业机械化的资金就会增多,使原有农业机械技术 装备将得到改善,进而提高农业机械化的水平。
2.4.4农业机械总动力的灰色预测
在利用灰色关联度对影响农业机械总动力各种因素分析的基础上,还必须对农业机械总 动力的发展变化的趋势进行总体把握。根据前述分析,利用灰色系统理论中的GM (1, 1) 模型对浙江省的农业机械总动力进行预测。
1.灰色数列GM (1, 1)模型
灰色数列预测主要是指利用GM (1, 1)模型,对时间序列数据进行数量大小的预测。 例如劳动力预测、各业产值预测,就是利用历年统计资料,对其未来的发展进行预测。这类 预测不仅应用最广,而且方法步骤也有普遍意义。其建模步骤具体如下:
(1)对数据序列
X(o)={x(®(l), x(°)(2),…,x⑼(N)}
作一次累加生成,得到
X°)={x⑴⑴,x(l)(2), ■■■, x⑴(N)}
 
 
 
(2)构造累加矩阵B与常数项向量弘,即
(2-51)
_7(x("(N_1) + xU)(N))
Yn =[x(o)(2), x(°)(3),…,x(°)(M]
(3)用最小二乘法解灰参数&
=(btb)-'btyn
(4)将灰参数&代入到时间函数
i(0) (r +1) = (x(0) (1)-上)严 + -
a a (2 - 54)
 
 
(5)对左⑴求导还原得到
i(0) (Z + l) = -a(xw (i) - -)e~a,
a (2-55)
或 i(o)(z+l) = x(,)(/ + l)-i(1)(r) (2-56)
 
 
(6)计算x(°)(0与M (r)之差严⑴及相对误差e⑴
?0)(/) = i(0)W-x(0)W (2-57)
 
(2-58)
(7)模型诊断及应用模型进行预报
为了分析模型的可靠性,必须对模型进行诊断。目前较为通用的检验方法是对模型进
行后验差检验,即先计算观察数据离差“
sf =^(x(0)(f)-^(0)(0)2
/=]
及残差的离差S2
1 册一1
心-(严⑴T叫))2 巾-1台
再计算后验比C及小误差概率P
P = {|严⑴-严⑴l< 0.6745s】}
根据后验比c及小误差概率p对模型进行诊断,当p>0.95和X0.35时,模型可靠,这 时可根据模型对系统行为进行预测。另外,当所建立的模型残差较大、精度不够理想时,为 提高精度,一般可以对其残差进行残差GM (1, 1)模型建模型分析,以修正预报模型。
利用1981 - 2003年浙江省农业机械总动力的统计数据,如表2-13中的第二列,运用 上述GM(1, 1)模型,建立浙江省农业机械总动力的灰色预测模型:
x(Z+l) = 14880.1227e00511/ ±14295.5227 (2-64)
模型的拟合值及其绝对误差和相对误差如表2-13中的3~5列所示。
 
 
表2 13 1982-2003年浙江省农机总动力及GM (1, 1)模型的预测误差
年份 农机总动力/万kW 拟合值/万kW 绝对误差/万kW 相对误差/%
1982 628.10 779.58 -151.48 -24.12
1983 681.86 820.42 -138.56 -20.32
1984 754.49 863.41 -10&92 -14.44
1985 810.02 908.64 -98.62 -12.18
1986 88931 956.25 -66.94 -7.53
1987 974.62 1006.35 -31.73 -3.26
1988 1075.91 1059.07 16.84 1.57
1989 1133.48 1114.55 18.93 1.67
1990 1215.73 1172.95 42.79 3.52
1991 1265.46 1234.40 31.06 2.46
1992 1352.03 1299.07 52.96 3.92
1993 1417.88 1367.13 50.75 3.58
1994 149734 1438.75 40.59 2.74
1995 1639.80 1514.13 125.67 7.66
1996 1707.59 1593.46 112.13 6.58
1997 1733.33 1676.94 56.39 3.25
1998 1798.84 1764.80 34.05 1.89
1999 1912.53 1857.25 55.28 2.89
2000 1990.01 1954.56 35.45 1.78
2001 2017.24 2056.96 -39.72 -1.97
2002 2053.21 2164.72 ■111.51 -5.43
2003 2039.68 2278.14 -238.46 -11.69
 
与此同时,后验比c=0.1897<0.35,而小误差概率p=1.000>0.95,由此可知道,所建立 GM (1, 1)模型具有较好的拟合精度,可用于浙江省农业机械总动力的预测。
在此基础上,利用建立的GM (1, 1)模型对浙江省2004 - 2020年的农业机械总动力 进行预测,结果如表2-14。
由表2-14可知,到2020年时,浙江省的农业机械总动力将达到5427.37万kW,根据 对浙江省粮食单产和总产量的需求预测,在2020年,浙江省粮食播面倾均农机动力将在 6-lOkW/hm2,达到在农业机械化发展高级阶段的粮食播面倾均农机动力要求。
表2 14 2004 - 2020年浙江省农业机械总动力预测值
年份 农机总动力/万kW 年份 农机总动力/万kW
2004 2397.49 2013 3796.21
2005 2523.09 2014 3995.09
2006 2655.28 2015 4204.40
2007 279439 2016 4424.67
2008 2940.79 2017 4656.48
2009 3094.86 2018 4900.44
2010 3257.01 2019 5157.18
2011 3427.64 2020 542737
2012 3607.22
 
2.4.5小结
(1)随着数据挖掘技术的发展,数据挖掘的方法不断增多,但现有的一些数据挖掘方法 需要大样本数据,而对于不具备大样本数据特点的小样本数据的背后同样隐藏着某种规律。 由于灰色系统理论的研究对象是部分信息己知,部分信息未知的小样本、贫信息的不确定性 系统。因而利用灰色系统理论和方法能够有效地挖掘具有小样本、贫信息特点的数据中的内 部规律。
(2)农业机械动力及结构是反映和评价农业机械化发展水平的一个重要指标,其需求变 化受自然、经济、技术和社会等多种因素的影响。本文利用灰色系统中的关联度分析和GM
(1, 1)模型对浙江省农业机械总动力增长的影响因素进行了关联分析和预测,从而为正确 认识农业机械总动力的宏观发展特征和制定农机动力发展规划和出台相关政策措施提供科 学依据。
2.5视情维修制拖拉机合理更新期计算方法
2.5.1引言
拖拉机零件在使用中所受的磨损情况和耐久性是不均衡的。随着拖拉机使用年限的增 加,不仅会增加其维修、油料等费用,而且也会降低作业的数量和质量。因此,加强拖拉机 寿命的研究,才能确保拖拉机适时更新换代和取得最佳的经济效益。大修是拖拉机在使用寿 命期间必须釆取的一项技术措施。由于在大修理过程中,换上去的配件质量及装配水平,测 试条件和修复旧件寿命等因素都难以达到原机标准,不可避免地造成整机技术状态恶化;同 时,大修理后拖拉机与新拖拉机相比较,技术故障发生频繁,造成拖拉机停歇时间延长,日 常维修费用增多,拖拉机的使用费用增加,且修理周期也一次比一次短。这说明拖拉机的修 理质量对拖拉机的作业成本和效率有很大影响。于是,当拖拉机使用到一定年限并经过几个 大修周期后,就需要农机管理人员从经济的角度考虑是对拖拉机进行大修理延长其使用寿 命,还是购买新拖拉机。若是对拖拉机进行修理,在什么情况下进行才是经济的、合理的; 若是更新在什么时候开始。这些问题都需要经过科学分析,才能做出合理决策。
2.5.2拖拉机维修制度与更新期计算方法的回顾
由于各国经济条件和技术水平的差异,目前有关农业机器寿命的研究国内主要集中在 机器经济寿命(或称为最佳更新期)的计算方法上,而国外则集中于农业机器的技术寿命研 究。文献[107]对农业机器寿命的计算方法作了比较全面的综述。
拖拉机是农业机器中非常重要的一种动力机器。更新平均成本原理是计算拖拉机合理 更新期常用方法之一,即拖拉机合理的更新期应使得拖拉机整个使用期间的总平均作业成本 最低由于各地区经济和技术发展水平以及修理体制的不同,平均作业成本中各项目 所占比重也不同,更新期的计算方法也是不一样的。目前,主要有两种修理制度:一是定期 大修制(time-based-prevention maintenance).大中型拖拉机采用较多;二是换件制亦称故障维 修制(run-to-breakdown maintenance),即坏什么修什么,没有定期专门的大修,小型拖拉机 和农具大多釆用2久国内外的专家学者对釆用这两种修理制度的拖拉机更新期的计算方法 有着较多的研究,并有着较为成熟的数学计算模型。然而这两种维修制度都不同程度存在问 题,从而影响了与二者相对应的计算方法合理性。
换件制是一种事后维修,虽有可能使某些零件一直使用到故障损坏之前,但是由于拖 拉机技术状态早期恶化,非但不能使零部件的技术寿命得到充分利用,还常常引起严重的事 故损坏,使拖拉机修理费用过高,甚至无法修理而导致早期报废。
定期大修制不顾及拖拉机制造质量、使用条件、操作技术水平、以及维修质量等因素的 差别,按照相同的规定周期强制地进行保养或修理,在实践中往往造成浪费,不仅增加维修 费用和时间,还增多停机次数和时间,降低了拖拉机利用率和生产率。
随着科学技术的进步,机械设计和技术水平的提高,以及现代管理科学和测试技术的发 展’从上个世纪的六十年代开始岀现了视情维修制(on-condition maintenance),定期对拖拉 机进行检测,按照技术状态的需要对拖拉机进行维修,因此也称按需维修制(或按状态维修 制)。实行视情维修制不是取消大修,而是将原来以规定作业量为基础确定拖拉机修理的方 式,改变为以拖拉机的实际技术状况为基础来确定拖拉机修理的方式,但是与这种修理制度 相对应的计算方法尚未见报道,下面就采用视情维修制拖拉机的更新期计算方法进行探讨。
2.5.3基于统计分析法的视情维修制拖拉机合理更新期计算方法
由于拖拉机的技术状况对单位作业量使用成本有重大影响,因此,机器更新平均成本 原理同样适用于确定视情维修制拖拉机的最佳更新期,其关键就是要合理确定不同修理周期 的作业量和整个寿命期内的修理周期数。
一般说来,拖拉机随着作业量(使用年限)的增加,技术状况将不断下降,其结果是各
种作业消耗(油料、维修费用)也将不断增加。在不同修理周期内,拖拉机单位作业量的平 均使用总成本都会经历一个逐渐下降,当下降到一定程度时,再逐渐上升的变化过程。由于 在不同的修理周期内,这一变化过程的速度是不相同的。因而如何寻求在不同修理周期内的 最低单位作业量使用总成本是确定修理周期作业量的关键。对此,可通过建立拖拉机单位作 业量使用总成本与拖拉机作业量之间的关系模型,模型中的参数则可利用拖拉机作业消耗的 各种统计数据,结合有关统计分析方法来确定。
1.拖拉机大修理周期作业量(间距)的确定
拖拉机在不同修理周期内的单位作业量的成本,可用下面的计算公式表示
 
 
 
式中C“ ——第一次大修前的整个使用期间单位作业成本,元/标准公顷[标准公顷:拖拉机工作量的计量单位。即耕地机组在地势平坦,土壤比阻为5N/cm'左右的熟地上作业,耕
深为20~22cm时,每耕翻一个作业公顷为1个标准公顷。其它作业可通过标准公顷折合系数, 将其折合成标准公顷。]
C” —— 第i-1次到i次大修期间(即第i个大修周期内)的单位作业成本,元/标准公顷
Ko——拖拉机的购置费用,元
R,}——拖拉机在第M次大修的修理费用,元
CEi—— 第i-1次到i次大修期间的费用总额,元
Li—— 拖拉机在第i次大修时的余值,元
S —— 拖拉机在第i-1次大修时的余值,元
Qi——拖拉机在第M次到i次大修期间的作业总量,标准公顷。
用拖拉机大修后的使用成本来确定大修理的经济周期,就是确定拖拉机在不同修理周期 内达到的最小成本,这就需要分析单位作业量成本与修理周期的关系。
在不同修理周期内拖拉机的购置价值可用公式表示为
K、= Ko —L[
瓦=Z,t+R,t-厶 (i > 2)
式中K\ ——拖拉机在第1次大修后的价值,元
氐 ——拖拉机在第7-1次大修后的购置价值,元
这样(2-65)、(2 - 66)式可改写为
C _ Ko _ 厶 | J = K] } Cei 21 a q, Qi a
C =厶-1 + Ri-i _ Lj + Cgi = * Cgj
zi~ Qi a
由(2-69)、(2-70)可知,单位作业量成本由两部分组成:一部分是分摊到单位作业 量上的拖拉机价值K/Q;另一部分是分摊到单位作业量的经营费用Ce心
在K/Q冲,K对于各个不同的修理周期来说有不同的值,但对于某一具体的修理周期 来说,&可视为是一常量,而0则是一个变量。随着修理周期的延长(即作业量的增加), 分摊到单位作业量上的拖拉机价格是按双曲线关系递减的。在中,分摊到单位作业量 的经营费用(4,)一般来说是随着修理周期的延长而增加的,Q也是随着修理周期的延长而 增加的。这样,在经营费用中实际上也包括两部分:一是其变化率与作业量。的变化率相 同的,这部分的费用可视为一个常量,以C,表示;另一部分则与0的变化率不同,是一个 随修理周期变化而变化的费用,以表示。Gm的变化是脉动式的,即每经过一次大修, Gm沿直线下降一水平,然后再逐步增大,直到下次大修前达到最高值,大修后又下降一水 平。但Cim变化的总趋势是上升的,它表现在两方面:一是每次达到的最大值均较前一次修 理周期的最大值大;二是经过大修后每次直线下降的水平,后一修理周期均较前一修理周期 大修后的小。值可用下面的经验公式〔I”】计算
C,-„, (2-71)
式中Cm——第,个修理周期可变经营费用C,的初始值,元
b, ——第j个修理周期可变经营费用的增长系数
—— 第j个修理周期可变经营费用的指数
式中的Cm bj、r,可通过分析统计资料获得。
在式(2-71)中,Cim对于一个确定的周期来说也是一个常量,这样在经营费用中就出 现了两个常量Gm与G,因此可用一个新常量来代替。即
a,=C,+Cm (2-72)
这样单位作业量的使用成本公式(2-66)可改写为
Czi = + +biQi,'~x (2-73)
公式(2-63)表明单位作业量的使用成本是修理周期内作业量(即修理周期间距)的 函数。确定修理周期就是找到拖拉机在某一修理周期内单位作业量使用成本的最小值C2imina 对公式(2-63)求导,并令其等于零。求得单位作业量使用成本最小时周期作业量 Qi =lj~ K, (2-74)
采用这种方法确定修理周期间距,与国内传统的定期大修制和换件大修制相比mm,其 优点在于既可防止拖延修理造成机况恶化,又可防止提前修理造成浪费。因此,用此法确定 修理周期间距更符合拖拉机技术状态变化和零件磨损规律。
2.拖拉机最后修理周期的确定
将式(2-74)代入式(2-63)中,可得拖拉机在第/个修理周期内单位作业量成本
 
 
在计算出几个修理周期后,就可进行比较,看哪一个修理周期的这两项费用之和最小,
这个最小费用对应的大修理周期就是最后的修理周期。最后修理周期可用公式表示为
C” = min{C”Fin 丨 i = 1,2, 3,
上述公式说明当第”个修理周期的C”值最小时,拖拉机应该修到这个周期(即大修n-1 次),若超过这个修理周期后,还进行大修理,则是不经济的。
3.拖拉机更新期的确定
当拖拉机使用到最后修理周期时立即更新,此时即为拖拉机的最佳更新期。但从经济的 角度来说,是否立即更新,还需比较此时拖拉机单位作业量使用成本与相同新拖拉机单位作 业量使用成本。若要继续使用达到最后修理周期的拖拉机,其单位作业量使用成本应不高于 相同新拖拉机的单位作业量使用成本,才是经济合理的。新拖拉机在第一年的单位作业量使 用成本可用下式确定
(2-77)
式中C,)——新拖拉机在第1年内的单位作业量使用成本,元/标准公顷
% ——新拖拉机在第1年内的经营费用总额(不包括折旧费),元
2,! ——新拖拉机在第1年内的作业总量,标准公顷
当C”=Cn时,即第"个大修理周期的单位作业量费用等于相同新拖拉机的单位作业量 的费用,从经济的角度来说,拖拉机在使用到第"个修理周期时应停止使用,用新拖拉机去 替换旧拖拉机。 '
当Cn<C}l时,即第n个大修理周期的单位作业量费用小于相同新拖拉机的单位作业量 使用费用,从经济的角度来说,可延长拖拉机的使用期限,直到C”=Cn时,再用新拖拉机 去替换旧拖拉机。即拖拉机达到最佳更新期后,继续使用一段时间再更新。
2.5.4小结
(1) 大修是拖拉机在使用寿命期间必须采取的一项技术措施。不同维修制度所对应的更 新期计算方法是不同的。拖拉机现行的两种维修制度所对应的更新期计算方法存在着一定的 不合理性。本文根据机器视情维修制度的思想,首次给出了视情维修制拖拉机合理更新期的 计算方法。本文的研究思路与方法,也可拓宽到其它农业机械设备中。
(2) 随着现代科学技术的发展,拖拉机和其它各种农业机械设备的适检性以及不拆卸诊 断技术将得到提高和完善,这些都能为农业机械利用视情维修制来确定合理更新期提供可靠 保证。
(3) 利用拖拉机的实际作业量来确定大修理周期更符合拖拉机技术状态变化和零件磨损 规律。当拖拉机在最后大修理周期的单位作业量费用小于相同新拖拉机的单位作业量费用 时,应延长拖拉机的使用期限,以确保经济收益的最大化。
2.6农业机械化投资项目可行性研究的评价方法
2.6.1弓|言
在农业机械化管理领域,可行性分析是研究论证农业机械化系统中某一子系统的建设、 发展、实施和推广方案的可行性,以定性与定量分析相结合方式分析与综合,最后提出是否 可行的技术经济性结论。它是包括多学科综合性科技咨询的活动。从技术、经济、生态和社 会等领域就提岀的方案做系统分析,并根据它在特定自然条件和机器装备满足农业技术要求 的情况下,进行经济性分析与论证,评估方案是否可以立项,是否有推广价值。预期得到的 经济效益等问题,提出可供决策者决策的权威性技术经济的论证报告。
可行性研究不仅是确定项目建设向银行申请贷款、编制计划的依据,也是与各有关部 门互订协议、签订合同、确定相互责任和联系协作,以及进行科研试验、设备制造及选购、 安排企业组织管理、机构设置和教育培训等工作的依据。
可行性研究大致可分为以下三阶段。
(1)机会研究阶段,又称投资机会鉴定。是在项目投资前根据市场、资源、政策、管 理条件等情况,对项目的性质、任务、内容、规模、投资及经济指标做出粗略的估计和较详 尽的分析,认为初步可行的项目才列入规划。
(2)初步可行性研究。在正式做可行性研究之前,预先做一下可行性研究。对所拟项 目的社会需求情况、环境条件、技术适应性和经济性进行调查分析和必要的试验,初步判断 项目是否具有生命力,准确度应达到80%左右。经初步可行性研究,认为可行的项目才列 入计划。
(3)详细可行性研究。在充分调查研究和试验的基础上,对项目进行全面的详细技术 经济论证,并提出可供选择的几个方案,准确度要求达到90%左右。经详细可行性研究确 定可行时,才可开始实施项目。
3.6.2投资项目可行性研究评价方法概述
在对项目进行可行性研究的过程中,除了对项目在经济和技术上做定性分析外,还需做 定量分析。在分析和论证农业机械化系统的工程方案时,可行性研究的定量分析方法主要有 静态评价方法和动态评价方法[,13~,,41O
1.静态评价方法
静态评价分析是不考虑时间变化引起的资金价值的变化,即不考虑时间因素对投资效果 的影响。在投资方案的初选阶段,是可行性研究中的机会研究和初步可行性研究中常用的一 种方法。具体说来,静态评价方法可以分为以下几种:
(1)投资回收期法。投资回收期是指项目投产后,以每年取得的净收益将初始投资全 部回收所需的时间。一般从投产时算起,以年为计量单位。投资回收期反映了初始投资得到 补偿的速度。在多方案评价时,一般以投资回收期最短的方案为最优方案。
(2) 投资效果系数法。又称收益率或投资收益率法。是项目投产后,生产达到设计能 力的正常年份获得的盈利与总投资之比。
(3) 追加投资回收期法。一般说来,在满足相同需求的情况下,投资相对大的方案, 其生产成本要相对低些。追加投资是指两个相互排斥方案所需投资的差额。追加投资回收期 是指投资大的方案,通过每年所节约的成本额来回收比另一方案多花的投资所需的时间。当 追加投资回收期小于标准抵偿年限时,说明追加部分的投资效果是好的,即投资大的方案比 较有利。
2.动态评价方法
由于投资项目在不同的时间点上所投入的费用和产出的收益在同样的数量上其价值是 不同的。因此,为了获得正确的经济效果评价,必须把不同时间点上的金额换算成相同时间 点上的金额,然后进行比较,这是方案对比的重要条件。通常将考虑时间因素的评价方法称 为动态评价方法。动态评价方法包括以下两种:
(1) 净现值法。净现值是指工程项目方案在使用年限内的总收益现值与总费用现值之 差,它可表示为经济寿命内逐年净收益现值之和。用净现值为标准选择方案往往趋向于选择 投资盈利多的方案。
(2) 内部收益率法。又称内部报酬法,它是使项目在计算期内净现值为零(即总收益 现值与总费用现值相等)时的折现率,称为该项目方案的内部收益率。当内部收益率大于标 准折现率时,则认为该方案可行;反之则方案不可行。
3.盈亏分析法
为了使建设项目在投产后保持赢利,需认真研究成本、售价、产量和盈亏之间的相互关 系。赢利的多少取决于产量的大小及成本的高低,而成本又分为可变成本和固定成本,产量 少则单位产品分摊的固定费用就多,从而导致单位产品的成本就高,反之亦然。当产量达到 不赢不亏的水平时,称为盈亏平衡点。在单位售价与可变成本一定的条件下,产量在平衡点 以上就能保持赢利。
4.敏感性分析法
敏感性分析法是在经济效益分析的基础上进一步分析某些不确定参数变化对决策目标 影响的敏感程度。如果某些参数可能变化很大,但对决策目标影响不大,即在决策时该参数 不敏感;反之某些参数稍有变化,则在很大程度上影响决策目标,它们在决策时是高度敏感 的。敏感性分析包括:确定分析指标、设定不确定性因素、计算分析不确定因素的变动对分 析指标的影响程度和建立对应的数量关系、找出敏感因素、综合效益分析结果的进一步评价 及选择既可靠又现实的替代方案等六个基本步骤。
上述各类可行性研究的评价方法对于提高项目选择的合理性,降低项目选择的风险性起 到了积极的作用。但也不尽合理,如动态评价方法中的净现值法,其计算模型中各参数的选 取一般都是确定型的,当外界环境因素影响很大,使得模型中参数的取值很难合理,从而影 响到模型的计算结果,进而影响项目选择的可靠性与合理性。因此,要强化评价方法对环境 的适应性,必须对现有的评价模型进行改进和完善。
2.6.3风险型和不确定型投资项目的净现值(£NPV)分析法
净现值法(NPF)是农业机械化投资项目经济分析中常用方法之一1,13-"4]-其数学模型为
NPV(i0) = Y —— (2-78)
幺(1 +订
式中: NPV(ia)—— 项目寿命周期内的净现值;
F, —— 项目第/年的净现金流量;
n 投资项目的寿命周期,a;
t——现金流量发生的年份序号; i。——基准收益率,即投资者的目标收益率。
NPVd0)是反映项目在计算期内获利能力的动态指标。当碑处0)20时,投资项目经济 可行;反之则不可行。且在多方案对比时,NPV(i0)的值越大,则表明方案相对优越。
现行的净现值法中各参数耳、”和i。一般都是确定型的,但考虑到经营风险及不确定性 因素的影响,那么项目的寿命周期"也应为随机变量,且由于投资、成本、价格和销售量等 也都是随机变量,弦也就使得由它们决定的项目各期净现金流量F,也是随机变量。
基准收益率通常由投资者根据行业同类投资项目的赢利水平,以及对项目财务分析的 预测和投资者的意愿来确定。对于确定型项目,一般把银行贷款利率定为项目的基准收益率, 但通货膨胀往往被投资者忽略,通货膨胀的结果是导致项目实际收益率下降。而对于风险型 项目,投资者往往是在银行贷款利率的基础上凭主观经验加一点风险贴水率来确定基准收益 率,一般来说,项目风险性越大,则基准收益率定得越高,即加进的风险贴水越多。但究竟 何种程度的风险配以何种水准的风险贴水,是极难确定其规格而且是相当主观的。与前两者 相比较,受不确定性因素影响的投资项目,确定其基准收益率的难度就更大了。因此,扩大 现行净现值法使用范围的关键是如何合理确定基准收益率。
1.基准收益率的确定
(1)确定型投资项目的基准收益率
如前所述,对于确定型的投资项目,由于通货膨胀会导致项目实际收益率的下降。因此, 考虑到通货膨胀的影响,原计划的基准收益率应进行调整。
资金的时间价值有两个方面,一是资金投入生产或存人银行,资金将随时间的推移而 增值;二是由于通货膨胀的影响,货币将随时间的推移而贬值。二者的综合作用,则有:
巧。=恥严% (2-79)
(1+厂)
式中: pt0——f年后资金数量
 
p0——起始年资金数量
i ——银行贷款利率(等于确定型项目的基准收益率认
r——通货膨胀率
t 年份
(2-80)
(2-81)
1 + r
由式(2-81)可知,由于通货膨胀的影响,投资项目的基准收益率将会下降。因此, 要得到预期的基准收益率,须提高项目的基准收益率,使项目的实际收益率等于无通货膨胀 时的基准收益率,即Ir=i0,整理得
如=心+rx(l+ %) (2 - 82)
咕——出现通货膨胀时的基准收益率
在基准收益率重新确定后,即可利用式(2-78)判断投资项目的经济可行性。
(2)风险型投资项目的基准收益率
投资项目的风险性是指项目实施以后将出现的结果(净现值)不能肯定,但各种结果出 现的概率是可以预先估计出来。对于存在种种不确定因素的投资项目,其经营风险性可用概 率性来表示,这种概率性表明了不确定因素的变动及其对经营效果的影响。由于经济现象很 少有以过去的同样模式重复出现,因而很少有类似的历史资料可供参考,因此对于其中的大 部分因素都不大可能用建立在大量数据基础上的客观概率来表达,此时可利用主观概率进行 类似分析。当概率分布已知时,可用随机变量的期望值和标准差可描述这种经营风险性,期 望值反映了平均最有可能达到的值的水平;标准差则反映了平均的离散程度。
在风险性情况下,通常把净现金流量坊看成是一种随机变量。假设项目第t期随机净现 金流量F,的各离散取值为Fa、巧2、…、碌,且互不相关,其对应发生的主观概率分别为Pn、 Pc、…、P*,则该项目第/期随机净现金流量的期望值和标准差可分别表示为:
E(巧)=£ 耳坊 (2;83)
1
k
o•(巧)=£(F厂 E(FJ)2p’j (2-84)
J=1 -
由于E(巧)最接近巧实际值,因而可用它近似表示项目每期的净现金流量;标准差“爲) 表示与其期望值E(巧)的离散程度,其值越小,说明实际发生的净现金流量与期望值越接近, 则净现金流量的可能风险损失越小。
 
对于风险型的投资项目,要给出每期随机净现金流量的概率分布是比较困难的,特别是 在农业机械化领域,除了经营风险外,项目还要受到气候等自然因素的影响,因而就更增加 了估计相应概率分布的难度。因此,需要有一种计算风险型项目各期随机净现金流量期望值 和标准差的简单方以进行近似分析。这种方法就是假定各期随机净现金流量服从某种分布, 常用的一种估计是服从一般的正态分布N(a, a);另一种估计是假定服从〃分布卩⑸。
若各期净现金流量服从0分布,则可在根据类似项目的历史资料的基础上,给岀各期 随机净现金流量的最乐观估计值、最悲观估计值耳2和最可能估计值坊3,则第r期的E(耳) 和b(刁)分别为:
£(仔)=良(你+4乂耳3+耳2)
o
6巧)=\("-耳2)
o
如前所述,对于风险型投资项目通常是在无风险型投资项目的基准收益率上增加一点 风险贴水率(Risk premium rate)来作为其基准收益率。由于风险贴水率是对由风险引起的 收益率的补偿。因此,可以将风险贴水率定义为收益的可能风险损失与投资额之比,即单位 投资收益的可能风险损失⑴忙 若把第f期的风险贴水率记作rpr (/),则有
rpr ⑴=
EI(t)
式中 RLV (/) ——第r期净现金流量(收益)的可能风险损失
投资原值折现到第t期的贴现值
根据前面分析,可以将标准差<7(巧)作为项目的第r期风险损失,即用°(坊)表示(2-87) 中的砂卩(r)。
由此计算出投资项目各期的风险贴水率rpr (Z),即
E(7)x(l + 0,
i —— 为无风险项目的银行贷款利率
E(i) 次性投资期望值,等于-E0o),即第0期净现金流量期望值的相反数。
那么,第/期的基准收益率为:
「02 ⑴=° + 0*(0 ( 2 - 89 )
当通货膨胀和经营风险并存时,应将第t期投资项目的基准收益率定为:
»03(z) = «oi +rpr(t) (2 - 90)
(3)不确定型投资项目的基准收益率
投资项目的不确定性是指当采取某个方案之后各种结果可能发生的概率无法预先估 计。这时可采取等概率法进行处理,将不确定性问题转化为风险型问题。依照前述风险型投 资项目的分析过程,那么,此时该投资项目第/期的,E(f;)和b(Fj可表示为:
 
 
7=1
°■(巧) = &£ (耳-E(FJ)2 卩
*丿=1
利用式(2-83)可计算出其风险贴水率。再按式(2-89)或(2-90)计算出基准收 益率。
2.风险型和不确定型投资项目的净现值(ENPV)计算模型
设投资项目为一次性投资,寿命周期"为常数,参照式(2-78)计算投资项目的期望
净现值的公式,可将计算风险型和不确定型投资项目的净现值的模型表示为:
(2-93)
同理,当砂/N0时,项目经济可行;反之则不可行。且在相同寿命周期的多方案对 比时,EVP/值最大的方案为最优方案。
2.6.4应用示例
若某投资项目的寿命期为5a。银行贷款利率i=10%,通货膨胀率『=4%,由分析人员 根据相关资料得到各期随机净现金流量的最乐观估计值你、最悲观估计值巧2和最可能估计 值Fi3 1,17],以及由此计算出的E(F,)、cr(^). rpr (/)和如(。,如表2-15所示。
表2 15 某投资项目各期随机净现金流量单位:百万元
t ", F.2 巧3 E(几) 少心 如⑴
0 ・10.0 -15.0 -13.0 -12.833 0,833 0.06 0.204
1 5.0 3.0 4.0 4.000 0.333 0.02 0」64
2 8.0 4.0 6.0 6.000 0.667 0.04 0.184
3 8.5 6.0 7.0 7.083 0.417 0.02 0」64
4 11.0 6.0 9.0 8.833 0.833 0.04 0.184
5 11.0 5.0 8.0 8.667 1.000 0.05 0」94
 
再由式(2-93)可得ENPF=7.441百万元>0,由此可知该投资项目在经济上是可行的。
2.6.5小结
(1)项目可行性分析是一项多学科综合性科技咨询的活动。它要求从技术、经济、生 态和社会等领域就提出的方案做系统分析,并根据在特定自然条件和机器装备满足农业技术 要求的情况下,进行经济性分析与论证,评估方案是否可以立项。定量分析是项目可行性分 析中非常重要的一个环节,计算方法的选择对评价结果正确与否有很大影响。
(2)在对投资项目进行可行性分析时,考虑通货膨胀、风险性和不确定性因素对投资 项目基准收益率和净现值的影响,可有助于提高项目选择的合理性和有效性。
参考文献
[1 ] Jiawei Han.数据挖掘概念与技术[M].北京:机械工业出版社,2001.
[2]Gartner Group. The top 10 technologies to watch in 1998[EB/OL]. bttp://kdnuggets.com/news/ 98/n03.html#iteml.2002-12-25.
[3]Fayyad U. Data mining and knowledge discovery in databases implications for scientific
database [A]. Scientific and Statistical Database Management, Proceedings, Ninth International Conference on Data Mining and Knowledge Discovery[C]. IEEE, 1997,2-11.
[4]Cheng QM, Jason TL, Wang, et al. DNA sequence classification via an expectation maximization algorithm and neural networks: a case study. System, Man, and Cybernetics, Part C: Application and Reviews 卩J.IEEE Transactions on Data Mining and Knowledge Discovery. 2001, 31(4): 486-475.
[5]Adomavicius G, Tuzhilin A. Using data mining methods to build customer profiles[J]. Computer, 2001, 34(2):74-82.
[6]Syeda M, Yan QZ, Pan Y. Parallel granular neural networks for fast credit card fraud detection.
Fuzzy Systems[A]. Proceedings of the 2002 IEEE International Conference.[C], 2002, 1:572〜577.
[7]业宁,董逸生,张爱珍.现代信息数据的挖掘与发展.南京林业大学学报(自然科学 版),2003,27(3):79〜83.
[8]Bezdek J C, Pal S K. Fuzzy models for pattern recognition: methods that search for structures in data[MJ. IEEE Press, 1992..
[9]梁伍七,江克勤.数据挖掘中的模糊聚类分析及应用[J].安庆师范学院学报(自然科学 版).2004,10(2):65-67.
[10]万江新,聂承启,尹江.数据挖掘中的模糊分类实现技术[J].计算机与现代化.2003, 11:21-25.
[11]刘耀和,胡宝清.模糊关联规则及其挖掘算法[J].应用科学学报.2003, 21(4):373〜376.
[12]Konopnicki L, Rousseeuw P J. Finding groups in data: an introduction to cluster analysis[M].
New York: JohnWiley & Sons, 1990.
[13]Agrawal R, Imielinski T, Swami A. Mining association rules between sets of items in large database[R]. InACM SIGMOD Conf Management of Data, 1993.
[14]Lin D I, Keden Z M. Pincer Search: A new algorithm for discovering the maximum frequent set[R]. In 6th Intel Conf Extending Database Technology, 1998.
[15]Savasere A, Omiecinski E, Navathe S. An efficient Mining association rules in large database[R]. Zurich, Switzerland: In Proc of the VLDB Conference, 1995.
[16]Srikant R, Agrawal R. Mining generalized association rules[R] In 2Set VLDB Conf, 1995.
[17]Yen S J, Chen ALP. An efficient approach to discovering knowledge from large databases[R]. In 4th inti Conf Parallel and Distributed Info Systems, 1996.
[18]Park J S, Chen M, YuP S. An effective hash based on algorithm for mining association rules [R]. InACM SIGMOD Conf Management of Data, 1995.
[19]Brin S, Motwani R, Ullamn J, et al. Itemset counting and implication rules for market basket data[R]. InACM SIGMOD Conf Management of Data, 1997.
[20]陆建江.数据库中布尔型加权算法及广义模糊型加权关联规则的挖掘[J].系统工程理 论与实践,2002228〜32.
[21]程继华,施鹏飞.多层次关联规则的有效挖掘算法[J].软件学报,1998, 9(12):937^941.
[22]肖利,金远平,徐宏炳等.基于多维标度的快速挖掘关联规则卩].软件学报,1997, 10(7):744753.
[23]陆建江,钱祖平,宋自林.正态云关联规则在预测中的应用[J].计算机研究与发展, 2000,37(11):1317〜1320.
[24]肖利,王能斌,徐宏炳等.挖掘转移规则:一种新的数据挖掘技术[几计算机研究与发 展,1998,35(10):902〜906.
[25]程继华,施鹏飞.概念指导的关联规则的挖掘[J].计算机研究与发展, 1999,36(9):1092〜1096.
[26]谢志鹏,刘宗田.概念格与关联规则发现[几计算机研究与发展,2000, 37(12):1415^1421.
[27]程岩,黄梯云.粗糙集中定量关联规则发现及其规则约简的方法研究[;]•管理工程学 报,2001,15(3): 73〜77.
[28]倪志伟,蔡庆生,方瑾.用神经网络来挖掘数据库中的关联规则[JJ.系统仿真学报, 2000,23(8):867〜871.
[29]Pawlak 乙 Rough sets[J]. Inter J of Computer ^nd Information Science, 1982,11(2):341〜356.
[30]GRZYMALA BAUSSE J W. LERS: A System of Knowledge Discovery Based on Rough Sets[AJ. Tsumoto S ed. Proc of 5th InL Workshop RSFD96[C]: Tokyo: Morgan Kanfinann
RSFD, 1996,443744.
[31]石金秀,黄士涛,雷文平.粗糙集与决策树结合诊断故障的数据挖掘方法[J].郑州大学
学报(工学版).2003, 24(1): 109〜112.
[32]杨宝华,钱运军,胡学钢.基于粗糙集(Rough Set)理论的数据挖掘(KDD)过程及实现[几 计算机农业.2003, 7:11〜13.
[33]Swiniarski R. Rough Sets and principle component analysis and their application in feature extraction and selection, data models building and classification[M].Pal S, Skowron A. New York: Springer-Verlag, 199&
[34]Lenarcik A, Piasta 乙 Probalilistic rough classifiers with mixture of discrete and continuous variable[A]. Lin T Y, Cercone N. Rough Sets and Data Mining[C]. Boston: Kluwer Academic Publishers, 1997.
[35]钟玲,许壮志,薛建.粗糙集理论在数据挖掘中的应用[J].沈阳工业大学学报.2003, 25(4):313 〜316.
[36]赛煜,王海洋.一种基于粗糙集理论的最简规则挖掘算法[J].计算机工程.2003, 29(20):77〜79.
[37]陈丽雯,陈燕,任宏远.基于粗糙集的属性约简算法改进卩].微机发展.2003, 21(6):109 〜113.
[38]吴艳艳.粗集结合决策树的一种数据挖掘算法[J].计算机工程与科学.2004, 21 (6):60 〜62.
[39]ZIARKO W, SHAN N. KDD-R: A Comprehensive System for Knowledge Discovery in
Database Using Rough Sets[A]. Lin T Y, Wildberger A M, eds. Soft Computing[C]. San Diego: Simulation Councils Inc, 1995, 298-301.
[40]SLOW INSKI R, STEFANOWSKI J. “Rough DAS" and “Rough Class" Software Implementation of Rough Sets Approach.[M]. Intelligent Decision Support: Handbook of Applications and Advances of Rough Sets Theory. Dordrecht: Kluwer Academic Publishers, 1992,445756.
[41]James P, Callan. Constructive induction on domain information [J]. AAAI, 1991,2.
[42]Gamberge, Dragan. A minimization approach to propositional inductive leaming[R]. InProc.S111 European Conference on Machine Learing(ECMl-95), Berlin, 1995.
[43]Hong J. Learning from examples and a multi-purpose learning system AE5[J]. Chinese Journal of Computer. 1989, (12):98〜105.
[44]Sheikholeslami G, Chatteijee S, Zhang A. WaveClusten A multiresolution clustering Approach forVLDB[R]. In proc 1998 Int ConfVLDB, New York, 1998.
[45]汪惠,王宁.基于小波分析和B-J方法的数据挖掘和预测[几系统工程. 2003,21(6):109〜113.
[46]王建州,杨勇.基于统计分布的小波分析对时间序列孤立点数据识别与换算[几西北师 范大学学报(自然科学版).2004,本40⑵:3〜7.
[47]Lu H, Setiono R, Liu H. Neurorule : A connectionist approach to data mining[R]. Int Conf VLDB, 1995.
[48]Rumelhart D E, Hinton G E, Williams R J. Learning internal rqiresentations by error propagation [A]. Cambridge, MA:M1T Press, 1986.
[49]Lawrence S, Giles C L, Tsoi A C. Symbolic conversion, grammatical inference and rule extraction for foreign exchange rates prediction[A]. Y Abu-Mostafa. Natural Networks in the Capital Markets[C]. Singapore: World Scientific, 1997.
[50]Mitchell M. An Introduction to Genetic Algorithms[M]. Cambridge, MA:MIT Press, 1996.
[51]季文赞,周傲英,张亮,等.一种基于遗传算法的优化分类器的方法[J].软件学报,2002, 13(2):245〜249.
[52]孙志胜,曹爱增,梁永,等.基于遗传算法的聚类分析[几济南大学学报(自然科学 版).2004,18(2):127〜129.
[53]Han J, Kamber M. Data Mining Concepts and Techniques [M]. Morgan Kaufmann Publishers, 2001.
[54]周水庚,周傲英,金文,等.FDBSCAN: 一种快速DBSCAN算法[J],软件学报,2000, 11 (6):735〜744.
[55]周水庚,周傲英,曹晶.基于数据分区的DBSCAN算法[J],计算机研究与发展,2000, 37(10):1153〜1159.
[56]郭建生,赵奕,施鹏飞.一种有效的用于数据挖掘的动态聚类算法[J],软件学报,2001, 13(2):582〜591 ・
[57]俞蓿,王军,叶施仁.基于临近方法的高维数据可视化聚类方法[J].计算机研究与发展, 2000, 37⑹:714-720.
[58]Keim D A, Kriegel H P. VisDB: Database exploration using multidunrasional visualization[R]. In Computer Graphics and Applications, 1994.
[59]Cleveland W. Visualizing Data[M]. Summit, NJ: Hobart Press, 1993.
[60]何勇.粮食产后系统的分析、评估与优化[D].浙江大学博士学位论文,199&
[61]王景,刘良栋,王作义组合预测方法的现状和发展[J].预测,1997⑹:37〜3&
[62]程轶.常用预测方法及评价综述.四川师范大学学报(自然科学版)[J], 2002, 25(1): 70-73.
[63]张文修,吴伟志,梁吉业等.粗糙集理论与方法[M].北京:科学技术出版社,2001.
[64]钟波,肖智,周家启.组合预测中基于粗糙集理论的权值确定方法[JJ.重庆大学学 报.2002, 25(7): 127-130.
[65]Pawlak Z. Rough sets[JJ. International Journal of Information and Computer Science. 1982.11(5):314-356.
[66]Szladow A. Ziarko 乙 Rough sets: working with imperfect data[J],AI Expert, 1993July.
[67]Pawlak 乙 Grzymala-Busse J, Slowinski R. Rough sets[ J] .Communications of the ACM.
[68]韩祯祥,张琦,文福拴.粗糙集理论及其应用[J].信息与控制.1998, 27(1): 37-45
[69]赵显桥,曹欣玉,兰泽全等.基于粗集理论的煤灰结渣模糊综合评判权系数确定方法研
究[J].煤炭学报,2004, 29(2): 222-225.
[70]于达仁,胡清华,鲍文.融合粗糙集和模糊聚类的连续数据知识发现[J].中国电机工程 学报,2004, 24(6):205-210
[71]候利娟,王国胤,聂能.粗糙集理论中的离散化问题[J].计算机科学,2000.27(12):89-94.
[72]凌方,王建东.一种连续属性离散化的新方法[J].数据采集与处理,2002.17⑵:179〜182.
[73]安利平,仝凌云.粗糙集理论中一种属性离散化算法[J].河北工业大学学报,2002, 31(3):39-43.
[74]徐如燕,鲁汉榕,郭齐胜.基于信息论的连续属性离散化[J].计算机工程与设计,2002, 23(2):62-64.
[75]代建华,李元香,刘群.粗糙集理论中基于遗传算法的离散化方法[J].计算机工程与应 用,2003.8:13〜14.
[76]张艳,李晓雷,谈小强.基于粗集理论的柴油机磨损模式识别方法[J].内燃机学报, 2001(4):373-376.
[77]陈遵德.Rough Set神经网络智能系统及其应用[J].模式识别与人工智能.1999,12(1):1-5.
[78]李增芳.基于人工智能和虚拟仪器技术的发动机故障诊断专家系统研究[D].浙江大学 博士学位论文.2004.
[79]朱永达.农业系统工程基础郑州:河南科学技术出版社,1987.
[80]《浙江年鉴》编辑委员会.浙江年鉴[M].杭州:浙江人民出版社,1981-2003.
[81]冯志鹏,杜金莲.粗糙集与神经网络集成在故障诊断中应用研究[J].大连理工大学学报, 2003,43(1):70-76.
[82]许东,吴铮.基于MATLAB 6.x的系统分析与设计一神经网络[M].西安:西安电子科 技大学出版社,2002.
[83]张青.基于神经网络最优组合预测方法的应用研究[J].系统工程理论与实践,2001(9): 90-93.
[84] 展广伟.农业技术经济学[M].北京:中国人民大学出版社.1986.
[85] 白人朴,杨敏丽.农业机械化发展水平评价指标体系及评价标准研究[Z].农业机械化 软科学研究成果汇编(农业部农业机械化管理司),2001.
[86] 夏阿国,魏芳勋,徐星明.浙江省农业和农村现代化进程评价与预测研究报告[R], 199&
[87] 白人朴,杨敏丽,刘清水.中国农业机械化发展水平地区分类研究[J].中国农机化, 1999,3: 65-68.
[88] 郑文钟,何勇.浙江省农业机械化水平评价方法及应用研究[J].浙江大学学报(农业与 生命科学版),2001,(27):191〜194.
[89] 刘佳,魏采乔,王西彬.粗糙集综合评价法在绿色制造评价中的应用研究[J].重庆环境 科学,2003,25(12):64〜67
[90] 杨崇瑞.模糊数学及其应用[M].北京:农业岀版社.1994.
[91] 汪培庄,韩立岩.应用模糊数学[M].北京:北京经济学院出版社.1992
[92] 关凯书,刘智军,陈锦铭.自适应性神经网络预测模型及其在农机动力需求预测中的应 用卩].农业工程学报.1998,14(4): 177-181.
[93] 关凯书,张丽,张美华.我国农机总动力需求的模糊神经网络预测模型[J].农业机械学 报.1999, 30(5): 86-8&
[94] 张淑娟,何勇,荣亭.山西省农机总动力需求的灰色一马尔可夫预测模型[J].山西农业 大学学报[J]. 2001, 21(3): 299〜302.
[95] 傅泽田,穆维松.农机动力总量分析模型在农业机械化系统分析中的应用卩].中国农业 大学学报.1998,3(6):49-53.
[96] 邓聚龙.灰色系统理论教程[M]・武汉:华中理工大学出版社,1990.
[97] 邓聚龙.灰色系统基本方法[M].武汉:华中理工大学出版社,1992.
[98] 刘会玉,林振山,张明阳.农业现代化与农村经济发展的灰色关联分析卩].农村经济. 2004,4: 77-79.
[99] 王道波,张广录.农业生产资料对农村(农业)经济发展的影响研究[J].农业系统科学 与综合研究.2005,21(1): 12-15.
[100] 陈风英,李君.安徽省农业生产结构变动与农民收入增长灰色关联分析[J].阜阳师范 学院学报(社会科学版).2004, 3: 86-87.
[101] 郑远强.海南省热带农业与三大产业关联分析[J].海南大学学报(人文社会科学 版).2004,22(3):278-282.
[102] 吴子岳,王耀华.农场农业机械化程度影响因素的多维灰评估[JJ.农业工程学报,1997, 13⑷:8-12.
[103] 孙巍,张德骏.中国农村种植业生产经济系统的灰色关联辩识与分析卩].农业系统科
学与综合研究.1995,11(2): 104109.
[104] 于稳法.影响粮食生产的因素分析及政策建议[J].农业系统科学与综合研究. 2005,21(2): 133〜135.
[105] 熊和金,陈德军.基于灰色系统理论的数据挖掘技术[J].系统工程与电子技术.2004, 26(2): 184-186.
[106] 陈德军,熊和金,陈绵云.灰色趋势关联聚类及其在数据挖掘中的应用卩].系统工程 与电子技术.2004, 26(5): 599-601.
[107] 王福林.农业机器经济寿命计算的研究现状及其分析卩].农业机械学报,1995, 26(2): 111-115.
[108] 余友泰.农业机械化工程[M].北京:中国展望出版社,1987.
[109] 常福田.拖拉机最佳更新年限的预测研究[J].农机化研究,1987 (2) :71〜74.
[110] 张缔庆,陈济勤.农业机器运用管理学[M].西安:西安交通大学出版社,198&
[111] 陈忠慧.农业机器运用管理学[M].北京:中国农业出版社,1993.
[112] 冯崇毅主编.汽车运输企业管理[M].北京:人民交通出版社,1998.
[113] 刘天福.农业机械化可行性研究[M].沈阳:辽宁人民出版社,1990.
[114] 戴有忠.农业机械化工程[M].哈尔滨:东北农业大学出版社,1996.
[115] 周裕兴,李国抒.技术经济学[M].广州:华南理工大学出版社,1995.
[116] 李晓红.关于风险型投资项目的经济分析卩].中国农业大学学报.1998,3(2):6〜9.
[117] 杨季美,毕儒详.技术经济学[M].北京:中国铁道出版社,1994.
第三章农业机械化信息管理系统与系统集成
为提高农机管理部门的决策水平,人们在加强农机管理领域的数学方法研究的同时,还 利用系统工程理论方法、网络技术、多媒体技术、数据库技术和计算机技术等各种现代管理 理论和信息技术,研制开发农业机械化信息管理系统(MIS)和决策支持系统(DSS)卩7, 这些系统的使用,对促进农机部门管理决策的现代化发挥了重要作用。然而,目前在农机管 理部门中各种信息处理系统主要使用基于字符的属性信息,而常见的信息中有80%以上含 有空间属性信息同。因此,若把具有空间信息处理功能的地理信息系统GIS与传统MIS/DSS 相结合,则将有助于农机管理部门充分利用各种属性和空间信息,从而进一步提高农机管理 部门决策水平。系统集成是实现MIS/DSS与GIS有机结合的一种有效方法。现就信息系统 集成的产生、内容和方法等有关问题进行探讨。
3.1信息系统集成
3.1.1信息系统集成的产生与必要性
目前,各类信息系统已在许多领域得到广泛的应用,这些系统的使用为提高组织机构的 工作效率发挥了积极的作用。但是,由于系统之间互不沟通,大量冗余的数据和信息重复存 储于各个子系统内,而决策者所需的综合信息却无法从这些系统中提取,若用网络相连这些 系统,而软件和硬件异构问题又制约了系统之间的通讯。这就形成了人们常说的组织内部的 “信息孤岛”现象,即信息分散,不能共享,多种硬件平台和软件平台共存,以至于各个应 用部门的信息系统相互独立,不能为高层决策提供一致的信息服务。“信息孤岛”的存在, 使得花费大量资金、人力建立起来的信息系统没能给组织的整体效益带来太大的改善⑺。
农机管理部门目前使用的各种MIS/DSS都是信息系统的理论、方法和技术在农业机械 化领域的具体应用,因而也同样存在“信息孤岛”现象。随着我国农业机械化事业的快速发 展,农机部门管理决策过程中对信息种类、数量的需求将会有大幅度增加,因而客观上需要 将提供各种信息的信息系统进行集成,实现彼此间协调地工作,最大限度地减少数据冗余, 并确保数据的一致性和完整性,从而为农机管理部门的各级决策者提供及时、准确、综合而 适用的信息。因此,信息系统集成也是今后农业机械化领域信息化实践的一项重要内容。
现代意义上的集成概念是与20世纪60年代出现的集成电路相联系的。集成电路的集成 思想主要是降低各种组成部分连接的复杂性,从而提高设计和实现效率。集成虽然最早始于 集成电路领域,但其概念应用范围己从硬件为主的集成电路扩展到软硬件并重的计算机集成 制造(Computer Integrated Manufacturing Systems, CIMS),再到偏重信息的综合集成研讨厅 [8-17] (Hall of workshop of Meta Synthetic Engineering, HWMSE),也就是将专家经验、统计 数据和信息资料、计算机技术三者有机结合起来,构成高度智能化的人机结合集成系统,以 解决复杂的实际问题。
集成的核心思想在于组成系统的各子系统之间的有机结合,从而形成一个统一的整体, 以取得系统的最佳效益。从系统集成概念的应用发展过程可以看岀,集成思想在生产和科研 的各个领域都发挥了重要的作用。新的信息系统的建立、已有信息系统的逐渐扩充以及不同 系统之间资源与信息资源共享,都需要利用集成思想来指导信息系统的分析、设计和建设。
系统集成的必要性主要表现在以下几个方面:
1.组织的需求
组织的需求是信息系统集成的动力。目前,在各级农机管理部门已具备一定的计算机应 用基础,并建立了农机信息统计、农机安全监理等业务信息系统。随着农机部门管理现代化 进程的继续,决策者需要更多的各类综合信息进行决策,而现有的分散的信息系统已不能满 足组织的需要,因为它存在以下问题:
(1)信息分散,缺乏一致性;
(2)信息为各个应用部门所独占,不能共享;
(3)大量的数据或信息被闲置,没有得到应有的处理和很好的利用,或仅仅进行了初 步的加工,缺少用于控制、预测和辅助决策。
因此,通过系统集成,一方面可以统筹规划农机部门的资源,提高资源的利用率,实现 大范围的数据共享;另一方面,还能理顺农机管理组织的业务及信息流程,强化各级决策环 节,进而提高农机管理部门工作效率和综合效益。为此,需要建立一个集成的信息系统,以 满足农机管理决策对信息的需求。
2.产品的多样性
(1)农机信息系统建设是一项复杂的系统工程,期间要涉及多种硬件、软件和技术, 几乎没有一个厂商能够提供信息系统建设所需要的全部产品和技术。因此,在信息系统建设 过程中必然要求使用多家的产品和技术构成系统开发的解决方案。
(2)从信息系统的安全和发展的角度来看,采用多家信息技术公司的产品可以降低对 某个特定供应商的依赖性,有利于农机管理部门的信息安全。
3.系统的异构性
异构性是系统集成的根源,由于系统中存在着异构的成分导致了系统中各个子系统无 法实现有效的交互,才有了系统集成的必要。
系统的异构性可以分为以下几种:
(1)目标与语义异构:各个子系统被用于不同的任务或实现不同的职能;或者同一个 符号赋予不同的语义;
(2)体系结构异构:如数据库类型有:关系型、层次型、网状型;专家系统结构有: 框架、黑板,等等;
(3)系统类型异构:经典控制系统、数据库系统、专家系统;
(4)程序设计语言异构:采用不同类型的编程语言;
(5)操作系统异构:基于不同的操作系统。
3.1.2系统集成的定义、内容及特点
1.系统集成的定义
系统集成是从20世纪90年代起,才在计算机领域得到广泛的讨论和应用,并引起了 计算机业界的极大关注。可以说,系统集成是开发系统驱动的,顺应计算机技术的发展潮流。 到目前为止,系统集成还没有一个统一的定义。美国IDC公司认为,系统集成是将软件、 硬件与通信技术组合起来为用户解决信息处理的业务tl8~20]o IBM公司不系统集成定义为将 信息技术、产品与服务结合起来实现特定功能的业务。美国大型系统集成商INPUT公司认 为系统集成是由一家厂商全面承包用户的大型复杂信息系统,负责系统设计,利用硬件、软 件与通信技术实施包括资源调查、文档管理、用户培训与运行支持在内的全面项目管理。
但就总的思想来说,人们已有一种共识:系统集成是一种思想、观念和哲理,是一种指 导信息处理系统开发的总体规划、分布实施的方法和策略,它不仅是一种技术,更包含艺术 的成份。系统集成提供了一体化的解决方案。
根据上述分析,本文对信息系统集成作如下定义:信息系统集成是一个寻求整体最优的 过程,是根据总体信息系统的目标和要求,对分散的现有各种信息子系统或多种硬件、软件 产品和技术,以及相应的组织机构和人员进行组织、结合、协调或重建,形成一个和谐的整 体信息系统,为组织的管理决策提供全面的信息支持。
由上述定义,可以得岀信息系统集成具有3个基本特征:
(1) 具有整体的,一致的目标,即建立一个统一的信息系统;
(2) 以原有的信息系统或已有的技术为基础进行结合与协调;
(3) 多种意义上的集成,其中人的集成占主导地位。
2.系统集成的内容[21~22]
从广义而言,系统集成是指一个组织机构建设信息处理系统的全过程,内容包括入的 集成(最终用户掌握和利用信息处理系统功能,从而融入信息系统中)、组织机构的集成(再 造工程)、管理和技术的集成、计算机系统平台的集成。其主要内容有:
(1) 设计阶段的集成。应用系统设计的集成就是将要完成系统总目标的应用系统划分 为有区别而相对独立的分系统或子系统,又要使它们在支撑环境或支撑平台上相互配合、协 同工作合成为一个有机整体。
(2) 支撑环境的集成。支撑环境的集成改革就是要解决如何利用客观条件为应用系统 提供统一的支撑环境来支持应用系统的运作,完成系统总目标。具体来说,在设计过程中要 解决以下几个问题:一是通信与网络平台的集成;二是系统硬件的选型与配置;三是系统软 件的选型与配置。
(3) 工程实施阶段的集成。由于大中型信息系统的复杂性,系缺成过程中通常涉及 多个厂家和多种类型的产品,这就使得支撑环'境的建立和应用系统的开发所需的产品不能完 全由一个厂家提供,而是需要各产品生产和开发商合作完成。
(4) 维护期的集成。维护期的集成任务在于对建成系统运行中岀现的各种问题进行分 析和确定故障源,完成故障的排除和系统的改进和优化。
从狭义上讲,系统集成特指计算机系统集成,包括计算机硬件平台、网络系统、系统 软件、工具软件以及应用软件的集成,以及围绕这些系统的相应咨询、服务和技术支持,等 等。具体包括:
(1) 功能集成一系统集成的目标
系统集成的任务是利用计算机、数据库和网络通信等各种技术重新组织和安排应用系统 的业务流程,从而实现既定的系统功能。功能集成是既是系统集成的出发点,也是系统集成 的归宿点。因此,在系统集成过程中,必须以实现所需系统功能为切入点,分析应用系统的 业务流程。
(2) 数据集成一系统集成的核心
数据是各种信息系统的血液,数据集成是系统集成的核心。缺少数据集成的集成系统 其不足是显而易见的。例如各部分连接松散或脱节、众多的数据文件、难于维护发展、自动 化程度低等。从系统集成软件技术来看,数据集成主要包括建立统一的数据模型和统一的数 据库管理系统两个方面。
(3) 设备集成一系统集成的基础
设备集成的主要内容是将应用系统所覆盖的各种通信、计算、控制和处理等资源设备联 结起来,从而形成一个相互通信的有机整体(或称为集成系统的基础设施)。设备集成主要 解决应用系统如何组织信息的问题,设备集成的主要任务是在于技术选择和产品选择。技术 选择的主要工作是确定网络协议集的标准,即为“网络平台”确定规范;产品选择是在统一 标准的前提下,选择性能价格比高、服务好的产品和供应商,进而具体实现网络平台或通讯 平台。
(4) 技术集成一系统集成的保证
集成系统能否实现预先既定的各项功能,技术集成起着至关重要的作用。系统集成需 要多方面的技术,包括数据库技术、网络通信技术、多媒体技术、可视化技术、并行工程与 计算机支持的协同工作,人工智能与优化技术以及工程设计理论和管理科学等等。单独运用 其中一种技术往往不能满足一些工程项目的需要,只有综合利用才能提高系统的信息处理和 空间分析能力,进而增强组织或企业的利用各种信息提高决策能力。概括起来,技术集成包 括:应用层集成、数据库层集成、操作系统集成、网络骨架集成和用户节点层的集成等五个 部分。
(5) 人机集成一系统集成的关键
系统集成是一种系统思想、方法和技术,不是某种计算机硬件系统或软件系统,而是通 过人利用多种硬件和软件技术,将多个单独的信息系统重新优化和组合,形成一个有机的统 一整体。因此,若没有人的集成,再好的硬、软件系统也只是一种摆设。可以说,人的集成 是系统集成的灵魂。在系统集成过程中主要涉及到系统集成人员、原系统开发维护人员、各 级管理者(用户)以及组织机构的决策者。
3.系统集成的特点
系统集成是指多个系统的有机结合,用以实现系统结构和功能的创新。系统集成是为 了达到系统目标将可利用的各种资源有效地组织起来的过程。系统集成的结果是将部件或多 个不同的小系统通过一定联接成大系统。系统集成在概念上绝不只是联通,而是有效的组织。 有效的组织意味着系统中每个部件的功能都能得到有效的利用,或者反过来说,为了达到系 统的目标所耗的资源最少。系统集成是要达到系统的某一目标,这个目标就是1+1>2,即系 统的总效益大于各子系统的效益之和。事实上对于信息系统而言,集成系统所完成的效益是 每个分系统所无法完成的。因而系统集成具有以下几个特点:
(1) 应用综合。系统集成的目标是实现应用综合,为用户提供解决方案必须周密地解 决各种应用的综合化、或称为一体化、系统化。例如,一个应用部门往往按业务分析各单位 单独提出的信息要求,容易缺乏“横向”综合;当按目前业务提出需求时,容易忽视与历史 ,和未来的有机联系,缺乏“纵向”综合。因此,系统集成要实现应用系统在业务上的“横向” 综合,时间上的“纵向”综合,技术上的跨领域综合。
(2) 技术综合。为了实现应用综合,系统集成实现者必须掌握多学科的技术知识,并 且通过技术综合充分体现系统经过“集成”加工的特点。系统集成实现者一般都需要掌握计 算机技术、通信技术和管理科学的基础知识,并熟悉当今流行的技术、产品和服务,尤其是 发展趋势。此外,系统集成实现者必须在应用领域具备特长。这就要求系统集成者不仅要掌 握信息技术,还要掌握有关的专业知识,且应用领域的专业知识是决定技术综合成功与否的 关键。
(3) 服务综合。系统服务的内容通常跨越从系统的分析、建设到使用维护的“全过程”, 包括从战略高度替用户进行发展策略制定和应用系统的分析设计,再到系统设备采购、安装、 测试,应用软件开发投入实际运行,人员培训和系统运行和维护的技术支持等。
3.1.3系统集成的方法、层次与框架
1.系统集成的方法
有关系统集成的含义、内容、理论与方法等是随着计算机技术、信息技术、网络通讯技 术以及应用需求的发展而不断完善和发展。虽然不同应用领域内对系统集成的定义、实现和 侧重点不尽相同。但从系统集成方法论的角度看,目前尚没有可供直接使用的方法。当今有 关系统集成的方法从其实现的方式上,主要有以下几种0~27】:
(1)内容集成:数据仓库可以说是信息系统内容集成的典范。W.H.Inmon给出数据仓 库的形式化定义:数据仓库是一个用来支持管理决策的、面向主题的、集成、时变、非易失 性的数据集合。它通过数据综合方式提供了一个集成数据环境,但是这种集成方式是单向、 自下而上的集成。
(2)传统的分析集成方法,如战略数据规划方法、结构化分析法、数据流图、实体一 关系模型、面向对象分析方法等等,分别在不同层面(主要集中在功能、结构以及数据库的 分析和设计方面)对系统集成问题提供了一些解决方式。国内外对于系统集成方法的研究取 得了一些成果:利用agent理论开发了一个ADEPT的集成框架,将各个子系统视为一个个 智能代理,通过这些智能代理之间的交互来实现系统集成,但是agent理论本身比较复杂, agent交互研究目前正处于进行中,没有很好的可以直接利用的理论;利用本体论(Ontology) 和基于活动(Activity-Based)的分析方法开发了一个名为TOVE的测试床,将系统中的功 能以本体论的形式统一表示出来,实现知识的共享,对于新开发的系统如果釆用这种方法无 疑是很有好处的,但是对于现有的系统该方法很难加以利用。
2.系统集成的层次
不同的组织层次对信息系统应用的需求是不同的,根据集成的目标,可将信息系统的集 成分为以下的3个层次:
(1)模块层次的集成。这是系统集成的最低层次,在这一层次中侧重于各子系统内模块 的优化组合,通过不同模块之间的有机组合从而形成一个功能比较完整的子系统。
(2)子系统层次的集成。这是系统集成的中间层次,目前许多组织机构都建立了功能比 较完善的子系统,要将这些子系统有机集合起来,可以根据系统整体性要求,对原有各子系 统进行综合、协调,从而集成得到一个整体功能最优的信息系统。
(3)系统层次的集成。这是系统集成的最高层次,在当今信息社会,不同部门之间的信 息交流非常频繁,各种组织机构中信息系统不应在是信息社会中的一个“信息孤岛”,而应 成为信息社会的一个组成部分。因此,组织机构在系统集成过程中,要考虑如何通过网络等 其它通信工具和手段与其他组织或部门进行信息交流。
3.系统集成框架
异构性是系统集成的根源,由于系统中存在的异构成分导致了系统中各个子系统无法 实现有效的交互,才有了系统集成的必要。目前,通过构造系统集成框架是解决系统异构的 —种非常好的方法。利用系统集成框架,可使现有的各子系统能够以尽可能少的修改来合成 为一体,实现彼此通讯与合作,进而以较低代价完成各个子系统之间的交互和信息资源共享。
系统集成框架实质上是一种系统集成机制卩8~29]。系统集成框架的体系结构是最优的、 标准是开放的,通过系统集成框架可以降低系统集成实施过程中的复杂程度,实现各类系统 的有机集成和整体功能的优化,从而确保集成系统的开放性和标准化,并提供多用户的单一 接口。
目前,集成平台被认为是一种理想的系统集成框架,它能提供材类系统在信息和功能 集成过程中所需要的信息处理和通信服务功能。利用集成平台作为系统集成框架有以下几个 方面的优点:
(1)利用统一的系统集成平台,可以实现多种信息的共享,通过对信息的融合和深层 次的挖掘还可以产生大量的新的有用信息。
(2)按照系统集成平台提供的接口标准,一方面,使得系统的改造和更新都有据可依; 另一方面,有利于集成系统的标准化。
(3)利用系统集成平台能降低集成的复杂程度,作为系统开发人员,只要求知道应用
系统如何与集成平台发生产生联系,而无需知道与其它应用系统发生联系。
(4)利用系统集成平台能减少各子系统的重复部件,共享某些功能,减少系统冗余, 增强系统的性能/价格比,进而提高集成系统的整体功能和保持系统的一致性。
(5 )利用系统集成平台拥有的协调与反馈机制可以使整个集成系统成为一个有机的整 体,实现各单独子系统不能完成的功能,从而增强系统的整体功能。
系统集成时,集成框架的使用与否,一方面对系统集成的复杂性、易维护性和运行的 高效性都有着重要影响;另一方面,还将导致各子系统间的连接和通信方式的完全不同。图
3 - 1反映了增加的一个新子系统与原集成系统中的各子系统的关系。
 
图3-1两种集成模式中新增子系统与已有子系统的相互联系
没有利用集成框架的系统集成模式通常被称为基于孤立应用模式。在这种集成模式下, 每当在集成系统中增加新的子系统时,都需要额外工作来解决新的子系统与原来已存在的子 系统之间的集成关系,造成系统接口的重复设计和开发,进而导致用户接口的不一致和系统 功能的重复。这种模式的主要缺点是各子系统间的通信不充分,系统的可扩充性与可移植性 很差。
利用集成框架的系统集成模式被称为基于组件的系统集成。在这种模式下,以组件的形 式,将各子系统的应用于不同的层次。按照集成框架统一制定的接口定义标准,每个组件定 义自己的接口,发布应用功能,而其它组件则可以根据其提供的接口信息,调用其提供的功 能。因此,在系统集成时,由于应用接口已明确定义和分类,即使各子系统是由不同机构开 发的,仍可快速实现各类子系统之间的集成。从而降低开发、维护费用。
3.2管理信息系统、决策支持系统和地理信息系统
3.2.1管理信息系统
管理信息系统(Management Infbrmation System,简称MIS)是20世纪80年代才逐渐 形成的一门新科学,其概念至今尚无统一的定义。WalterT.Kennevan给MIS的定义为,以 口头或书面的形式,在合适的时间向经理、职员以及外界人员提供过去的、现在的、预测未 来的有关企业内部及其环境的信息,以帮助他们进行决策。Gordon B. Davis把MIS定义为 一个利用计算机硬件和软件,手工作业,分析、计划、控制和决策模型,以及数据库的用户 -机器系统〔珂。它能提供信息支持企业或组织的运行、管理和决策功能。而中国企业管理百 科全书则将MIS定义为一个由人、计算机等组成的能进行信息的收集、传输、储存、加工、 维护和使用的系统。管理信息系统能实测企业的各种运行情况,利用过去的数据预测未来, 从企业全局出发辅助企业进行决策,利用信息控制企业的行为,帮助企业实现其规划目标。
上述有关MIS的各种定义反映了 MIS作为一个新学科的特点,就是其理论基础尚不完 善,其概念方法尚未明确统一。但从国内外学者给MIS所下的定义来看,人们对MIS的认 识在逐步加深,MIS的定义也在逐渐发展和成熟。管理信息系统是在管理科学、系统科学、 运筹学、统计学以及计算机科学等学科的基础上形成的一个综合的多元目的学科。管理信息 系统的总体结构如图3-2所示。
 
 
图3-2 管理信息系统总体结构
一般说来,管理信息系统具有以下儿个方面的基本功能:
(1)准备和提供统一格式的信息,使各种统计工作简化,使信息成本最低;
(2)及时全面地提供不同要求、不同细度的信息,以期分析解释现象最快,及时产生 正确的控制。
(3)全面系统地保存大量的信息,并能很快地查询和综合,为组织决策提供信息支持。
(4)利用数学方法和各种模型处理信息,以期预测未来和科学地进行决策。
管理信息系统是一类面向程序化决策的计算机系统,能利用一定的规章或公式来解决结 构化决策的问题。在农业机械化领域,管理信息系统是使用时间最早、范围最广的一类信息 系统。比较典型的运用有农机管理和监理部门利用管理信息系统进行农机信息统计、牌照管 理,农业机械化企业利用线性规划来求拖拉机运输的最短路程,农机销售用经济批量公式来 求定货批量,等等。
3.2.2决策支持系统
以支持管理者做决策为目标的决策支持系统,是在管理信息系统基础上发展起来的一 个新兴领域⑶]。如果说管理信息系统是为了更有效地提供管理决策所需要的信息,则决策 支持系统是根据这些信息来做出面向高层管理的有效决策。
决策支持系统(Decision Support System,简称DSS)是在管理信息系统的基础上发展 起来的新兴科学,最早是由美国Scoot Morton教授于1970年在"管理决策系统” 一文中首 先提出。之后,许多学校和公司开始研制DSS,并成功地获得了应用。决策支持系统的基 本结构如图3-3所示。
DSS概念从提出至今已有二十多年时间,但这门学科本身还没有形成一个完整的理论 体系。关于DSS的定义也没有一个统一看法,但都从不同的角度给予解释。如Gorry和Scoot Morton把DSS定义为支持决策者对半结构化、非结构化问题进行决策。Ginzberg和Stohr 把DSS定义为支持决策制定活动的计算机信息系统,这种决策活动不可能完全由自动的系 统来完成。Johe Little把DSS看作是一个基于模型的程序集合,用来处理数据并作出判断, 以支持管理者作出决策,这种系统必须具有简单性、完善性、适应性及易于控制、易于通讯。 Bonozok和Whinston认为DSS是由三个部分组成的计算机系统:语言系统 提供用户与 DSS通讯;知识系统一存储系统中的知识(如数据、模型及程序);问题处理系统——制 定决策的核心部分。Vazony认为DSS是一种处理非结构化问题和给决策者提供灵活决策的 一种新技术。Sprague与Watson认为,DSS能广义地定义为决策辅助和决策支持实施系统。 或者狭义地定义交互式的、面向非程序化与非结构化决策的计算机系统。
 
图3-3决策支持系统结构
1.人机对话部件
决策支持系统不能代替人的决策,它只能支持人的决策。因此,人机对话部件是DSS 的重要组成部分。通常人机对话部件应当具有以下几个方面的功能:
(1) 提供多样化的显示和对话形式。当今计算机几种常见的人机界面技术有:菜单、 窗口、多媒体等形式,命令语言和自然语言等。
窗口、多媒体等显示形式,能增加系统的美观及直观程度,能大大提高系统的友好程 度及使用效率。目前,计算机无论是微机或者是工作站上的软件都在向这个方向发展,如 PC机上的Windows系统,SUN工作站上的SUNVIEW界面,效果都很明显。
菜单可用于引导用户逐级进入系统和使用系统,对初级用户更是适宜,用户只要按照 菜单提示,点击几个选择键即可操作和使用系统。若用命令语言来操作,可以减少交互操作, 更有效地控制系统的运行。对于不熟悉计算机的管理决策者,使用自然语言更方便,但对计 算机技术就要求更高,需采用人工智能技术,如自然语言和问题分析等技术。
(2) 输入输出转换。系统在输入中与用户的对话,要转换成系统能够理解和执行的内 部表示形式。当系统运行结束后,应该把系统的输出结果按一定的格式显示或打印给用户。
(3) 问题处理。利用DSS语言系统编制实际解决决策问题的程序,它控制人机交互, 模型运行,数据调用达到有机的统一,解决决策问题。
2.数据部件
数据部件包括数据库和数据库管理系统。经过几十年的发展,目前数据库组织方法和 数据库管理系统都非常成熟。
(1) 数据库存储的组织形式。数据库用来存储大量数据,一般组织成易于进行大量数 据操作的形式。典型的数据组织模型有:网络模型、层次模型和关系数据模型。数据库由数 据库管理系统来管理和维护。
(2) 数据库管理系统功能。数据库管理系统都具有数据库建立、删除、修改与维护、 数据存储、检索、排序、索引和统计等功能。
(3) 数据库管理语言体系。一般来说,数据库管理系统应提供语言体系供用户使用数 据库或与某种程序设计语言的接口。这个语言体系一般由两个部分构成:一是数据库定义语 言(DDL):提供定义数据库中数据的组织形式,如数据模式、数据依赖关系等手段;二是 数据库操纵语言(DML):提供对数据库中的数据进行操作,包括数据库的建立、删除、数 据字典的建立和维护、数据存储、检索等手段。
3.模型部件
模型部件由模型库和模型库管理系统组成。
模型库用于存放模型,它有自己的特征。模型不同于数据,它有如下两种形式:
(1) 模型的表示形式:它总是以某种计算机程序形式表示的,如数据、语句、子程序 以及对象等。这种物理形式在模型库中具体为:模型名称及相关的计算机程序、模型功能的 分类、模型的输入输出数据、控制参数等属性,它可以类似于数据的形式表示出来。
(2) 模型的动态形式:它可以某种方法运行,进行输入、输出、计算等处理。这种形 式的属性是无法或很难用类(数据组织的形式来描述的。
目前,决策支持系统已在农机管理领域中的某些方面得到应用,但由于农机管理决策 过程中的复杂性和决策支持系统自身的一些因素的原因,DSS在农业机械化领域的应用范 围和效果远不及管理信息系统。
3.2.3地理信息系统
1.地理信息
地理信息是指表征地理系统诸要素的数量、质量、分布特征、相互关系和变化规律的 数字、文字、图像和图形等的总称。地球表面的岩石圈、水圈、大气圈和人类活动等是最大 的地理信息源。地理科学的一个重要任务就是迅速采集地理空间的集合信息、物理信息和人 为信息,并实时地识别、转换、存储、传输、再生成、显示、控制和应用这些信息。
地理信息属于空间信息,其位置的识别是与数据联系在一起的,这是地理信息区别于 其他类型信息的最显著的标志。地理信息的这种定位特征,是通过经纬度或公路网建立的地 理坐标来实现空间位置识别的,地理信息还具有在二维空间的基础上实现多专题的第三维结 构的特征。而各个专题、实体之间的联系是通过属性编码进行的,这就为地理系统各圈层之 间的综合研究提供了可能,也为地理系统多层次的分析和信息的传输与筛选提供了方便。
2.地理信息系统
地理信息系统(Geographic Information System,简称GIS)是以采集、存储、管理、描 述、分析地球表面及空间和地理分布有关的数据的信息系统。它是以地理空间为基础,在计 算机硬、软件环境的支持下,对空间相关数据进行采集、管理、操作、分析、模拟和显示, 并采用地理模型分析方法,适时提供多种空间和动态的地理信息,为地理研究、综合评价、 管理、定量分析和决策服务而建立起来的一类计算机系统。简而言之,地理信息系统是以计 算机为工具,具有地理图形和空间定位功能的空间型数据管理系统,它是一种特殊而又十分 重要的信息系统。
从学术与技术的角度来看,地理信息系统是上个世纪60年代开始迅速发展起来的一门 新技术,结合计算机、系统工程、经济管理等多学科的知识,属于跨学科的技术系统。它所 涉及的内容主要包括〔血351:
(1) 有关计算机的硬件、软件;
(2) 空间数据的获取及计算机输入;
(3) 空间数据模型及其数据表达;
(4) 属性数据的数据库存储及处理;
(5) 数据的共享与视觉化;
(6) 地理信息系统的项目管理、开发、质量保证与标准化;
(7) 地理信息系统的机构设置与人员培训等。
一般来说,地理信息系统按其内容可以分为三大类[377】:
(1) 专题信息系统(Thematic Information System)o这是具有有限目标和专业特点的 地理信息系统,为特定的目的服务的,如矿产资源管理信息系统、农作物估产信息系统、灾 害监测信息系统,等。
(2) 区域信息系统(Region Information System)□主要以区域综合研究和全面的信息 服务为目标。可以有不同规模,如国家级、地区或省、市级和县级等为不同行政级别的区域 信息系统,也可以是按自然分区或流域为单位的区域信息系统。
(3) 地理信息系统工具(GIS-Tool)。也称为地理信息开发平台或外壳,它是具有地理 信息系统基本功能的工具软件或开发平台,供其他系统调用或进行二次开发。国内外已在不 同档次的计算机设备上研制了一批地理信息系统工具,如Mapinfo、Arcinfo等。将地理信 息系统外壳与数据库系统结合,用以完成图形、图像数字化、地理数据的存储管理、查询检 索、结果输出等任务,就可以开发出相应的决策支持系统和专家系统等。
另外,也可以从其他角度对地理信息系统进行分类。例如:
按数据结构的不同可以将地理信息系统分为:基于多边形的即矢量型地理信息系统和 基于格网的即栅格型地理信息系统。
按系统用途可将地理信息系统分为:自然资源清查信息系统、城市地理信息系统、规 划和评价信息系统、空间分析型的地理信息系统,等等。
按系统职能的不同,可以分为:地形信息系统、专题信息系统、土地资源信息系统、 地籍信息系统,等等。
地理信息系统的基本功能如图3 - 4表示。
 
图3 -4地理信息系统的功能图
如前所述,农业机械化是一项地域空间性很强的工程,在管理与决策中必然要涉及大量 的空间信息,因而将GIS引入农业机械化领域,必能在多方面增强农机化信息管理系统的 功能,进而提升农机管理部门的现代化程度。目前有关GIS在农业机械化领域的应用研究 主要有两方面:一是GIS作为精细农业技术体系的重要组成部分;二是在农业机械化管理 中,分析影响农业机械化发展因素的空间分布情况。从研究和应用的总体情况看,基本上都 集中于前者,而涉及后者的还比较少。
通过上述对MIS、DSS和GIS的功能和结构分析,可以看出3种系统在功能和结构上 各具特色,部分功能具有交叉,例如都具有数据采集、存储、处理、分析和输出等基本功能。 但侧重点不同,MIS的优点在于信息管理;DSS能提供各种定量分析模型,具有强大的数 据处理能力,但大多数DSS不能灵活、直观地描述对象的空间位置、空间分布等信息,不 能为决策者或决策分析人员提供一种空间数据可视化的决策环境,在此环境下决策者只能利 用自己的经验、知识,直观详细地了解和分析过程中的各主要因素及其相关关系和影响后, 才能做出决策;GIS侧重点在空间信息的分析和表达,目前大多数GIS的功能尚停留在空间 数据的釆集、存储、管理、查询、分析和显示、制图的水平上,空间信息的处理和分析能力 较弱,缺乏对复杂空间问题决策的支持能力。卜珂,难以满足农机系统各级决策者的要求。 因此,通过系统集成平台,将目前在农机管理部门使用的MIS/DSS与GIS三种信息系统集 成到一个应用系统中,在发挥各自优势的同时,又能形成集成后的对农机管理决策中所需数 据的高效处理和管理功能。尤其是GIS与DSS中数学方法的结合既有助于GIS对空间数据 处理功能的提升,又能方便实现空间分析数据及结果在GIS中进行编辑、转换、查询、组 织和可视化表达,以及制图等,从而满足农机管理部门对各种属性和空间信息处理的需求。
3.3 MIS/DSS与GIS集成模式
系统集成的关键是如何实现GIS与MIS/DSS中的应用模型的集成,目前GIS与MIS/DSS 各自的发展都具备了两种技术集成的条件。GIS与MIS/DSS中应用模型集成可以采用两种 方法。一种是利用程序设计语言,重新开发一个集空间分析和决策支持于一体的G1S系统。 这种支持系统的特点是信息冗余少、集成紧密、运行稳定、效率高,但存在开发周期长、工 作量巨大和成本高的问题;另一种是采用GIS与决策模型的系统集成技术,将GIS的空间 数据管理功能与MIS/DSS中的决策模型的分析、评价、预测、模拟和决策等功能“组合” 起来,构成解决某一决策问题的空间决策支持系统。这种方法能充分利用现有信息技术资源, 缩短开发周期,降低费用,并便于系统升级和维护。根据GIS与MIS/DSS集成的紧密程度, 将二者的集成分为松散型集成、嵌入型集成和链接型集成三种集成模式。如图3-5所示。
 
A.松散型集成 B.嵌入型集成 C.链接型集成
图3-5 G1S与M1S/DSS集成的3种模式
 
3.3.1松散型集成
在这种集成方式中,GIS与决策支持系统是各自独立的,彼此通过输入瀚出功能进行 信息交流,系统没有统一的数据结构和操作界面。决策时用户通过调用决策支持系统的应用 模型进行决策分析,决策结果以决策支持系统的数据格式保存。然后再调用GIS系统,手 工输入决策支持系统的结果数据,或通过GIS的输入功能将结果数据转化为GIS能够处理 的数据格式与空间数据结合,实现数据地图化〔心人这种集成方式是通过文件交换机制来 实现二者之间的数据交换,是最简单的一种集成,存在的不足是系统结合松散,操作不方便。
3.3.2嵌入型集成
一般是以GIS或决策支持系统为载体,另一个为附件嵌入到载体中。若以GIS为载体, 则利用一些GIS提供的宏命令编写一些简单的决策模型,将这些决策模型直接嵌入到GIS 中,所形成的系统具备较强的空间分析功能,但决策支持能力较弱。如果以现有的决策支持 系统为载体,则一般是用开发决策支持系统所用的程序设计语言来编制一些空间分析模块, 将GIS具备的部分功能直接嵌入到决策支持系统中,所形成的系统具备较强的决策支持能 力,但空间分析功能较弱。这两种嵌入型集成方法所产生的系统,集成程度高,系统结合紧 密,但系统整体功能不强〔仏旳。根据二者紧密程度可以分为3种方式。
1.G1S的全宏语言开发模式
以地理信息系统为集成平台,用地理信息系统提供的二次开发语言如MapBasic、 Avenue、AML 等宏(Macro Language)或者脚本语言(Script Language),在 GIS 平台上将 已开发好的专业模型的源代码进行改写,使其从语言到数据结构与GIS系统完全兼容,从 而成为GIS系统整体的一部分,这种集成方式是当今GIS应用系统常用的一种开发方式, 并且将会一直存在,它可以保证GIS系统与模型在数据结构、数据处理等方面的兼容性, 但这种集成方式不符合现代软件集成的发展潮流。其存在的不足之处表现在以下几个方面: —是GIS开发商虽然普遍提供了二次开发语言,且功能也越来越强大,但是对于较为复杂 模型的构造能力仍然有限;二是GIS开发者必须花费大量的时间去读懂专业应用模型的源 代码,且基于二次开发语言的集成系统运行效率普遍较低;三是现有GIS缺乏动态分析能 力,二次开发语言也不提供对内存和缓冲的操作,因而系统的动态分析功能的实现比较困难。
2.GIS内嵌可执行程序方式
它以GIS的宏语言命令驱动应用程序,GIS系统和MIS/DSS中的应用分析模型之间的 集成是通过对共同数据文件的读写操作实现,GIS系统则进一步通过中间数据与空间数据的 转换来实现空间数据的GIS操作功能。虽然这种方式在本质上与松散集成中的独立可执行 程序方式是一样的。与独立可执行程序集成方式不同的是GIS系统与M1S/DSS中的模型是 由不同编程语言实现的,但集成系统有基本统一的界面,具备一个无缝的集成操作环境。
这种集成方式有两个方面的优点,一是符合软件工程学所要求的模块化开发原则,便 于开发工作的组织管理,系统的运行性能优于独立的可执行程序方式;二是以这种方式开发 出来的集成系统具有基本统一的界面环境,操作方便。但主要缺点是系统开发人员必须了解 模型运行的全部过程,并能对复杂的模型进行合理的结构分解,以实现模型与GIS系统本 身之间的数据相互转换及模型对GIS功能的调用,因而模型的分解比较困难,此外,模型 组合也不容易。
3.GIS内嵌函数库方式
这种集成方式是将开发好的模型以库函数的形式保存在函数库中,系统集成人员通过 调用库函数将模型集成到GIS系统中。函数库包括静态链接库和动态链接库两种,二者的 本质区别就在于动态链接不是在链接生成可执行文件时把库函数链入应用程序,而是在程序 运行中根据需要进行链接。
这种集成方式的优点是能实现GIS与MIS/DSS中应用模型实现高度无缝集成,函数库 一般都有清晰的接口,系统开发人员不必花费大量的时间去研究代码,使用比较方便。此外, 函数库经过编译,不会出现开发者因改动源代码而导致模型运行结果不正确的情况。这种集 成方式的不足在于函数库无法与GIS数据有效结合,因而不能用于复杂模型与GIS的集成。 同时,由于开发者不能对库函数进行修改,不仅降低了 GIS与模型集成的灵活性;而且使 得函数库的可扩展性变差。此外,静态函数的使用还在一定程度上受语言的限制,必须依赖 其开发语言。
相对于松散型集成而言,嵌入型集成具有统一的界面和数据逻辑模型以及内存消耗与 一体,提供透明的文件转换机制实现双向信息共享,用户通过GIS内置的宏编程语言直接访 问模拟模型,但其不具备模拟过程中模型开发和用户交互功能,可以保持各自的数据结构, 数据间的连接是通过数据类型转换器实现。
3.3.3链接型集成
是基于具备 OLE (Object Linking and Embedding,对象链接嵌入,简称 OLE) Automation 功能的GIS (如Maplnfb , Arclnfb)和可视化程序设计语言(如VB、VC等)而设计的。 利用可视化程序设计语言设计一个统一的人机界面,调用DSS决策分析模块中的应用模型 和操作GIS地图的功能菜单,对地图的各种操作主要是通过程序设计语言和GIS的OLE Automation的链接集成完成。这样集成的系统,由于采用了链接技术,不仅提高了应用系统 的空间分析和决策支持功能以及系统的集成程度,而且使系统的整体功能得到加强,可以说 是目前最佳的系统集成方法。
3.4本章小结
在分析系统集成概念、特点、内容、层次和框架的基础上,对实现管理信息系统、决策 支持系统和地理信息系统三者集成的一些关键问题进行了研究,主要结论有:
(1)信息系统集成是一个寻求整体最优的过程,是根据总体信息系统的目标和要求,对 分散的现有各种信息子系统或多种硬件、软件产品和技术,以及相应的组织机构和人员进行 组织、结合、协调或重建,形成一个和谐的整体信息系统,为农机部门的管理决策提供全面 的信息支持。
(2)MIS、DSS和GIS三种系统在功能结构上各具特色,MIS的优点在于信息管理; DSS虽能提供各种定量分析模型,并具有强大的数据处理能力,但不能灵活、直观地描述 对象的空间位置、空间分布等信息;GIS侧重点在空间信息的分析和表达,却缺乏对复杂空 间问题决策的支持能力,若利用系统集成平台将上述3种系统进行系统集成,则能实现农业 机械化领域对各种类型数据进行处理和管理功能。
(3)GIS与DSS二者集成的关键是如何实现GIS与DSS中的应用模型的集成。根据 GIS与DSS集成的紧密程度,将二者的集成分为松散型、嵌入型和链接型三种集成模式。 从集成系统的信息冗余度、集成紧密度、运行稳定性和效率,以及开发周期、工作量和成本 等方面综合考虑来看,链接型集成是目前实现GIS与DSS集成的理想模式。
参考文献
[1]鲍一丹,何勇.农业机械多媒体决策支持系统的研究[J].浙江大学学报(农业与生命科学 版),2001,27 (2) :187〜190.
[2]何勇,鲍一丹.农业机械化数据库管理系统的研究[J].科技通报,1995,11 (3) :147~152.
[3]张玉宝,朱瑞祥,刘淑珍.农业机械化管理信息系统的研究与开发[J].农机化研究,2002, 11.61-63.
[4]张毅,朱瑞祥,张玉宝.基于广域网的农业机械化管理信息系统设计[J].农机化研究, 2003,7. 170-172.
[5]晏国生等.计算机在农机化管理中的应用[M].北京:清华大学岀版社,199&
16]汤国安,陈正江,赵牡丹,等.ArcView地理信息系统空间分析方法[M].北京:科学出版 社,2002.
[7]高展,张惠侨,熊泗洲.系统集成与现代企业[J].机械设计与研究,1999,2:35〜39.
[8]李德仁,关泽群.空间信息系统的集成与实现[M].武汉:武汉测绘科技大学出版 社,2000.
[9]万麟瑞,李绪睿.系统集成方法学研究[J].计算机学报,1999, 20(10): 1025-1031.
[10]王黎明,毛汉英.区域可持续发展综合集成研讨厅体系研究[J].地理研究,199& 17(4):408-414.
[11]王慧斌,徐小群.综合研讨厅体系及应用研究[J].信息与控制,2001,30(6):516-521.
[12]胡代平,王浣尘.建立支持宏观决策研讨厅的预测模型系统[J].系统工程学报,2001, 16(5):335〜339.
[13]胡晓惠.研讨厅系统实现方法与技术的研究[J].系统工程理论与实践,2002, 22(6):1-10.
[14]操龙兵,戴汝为.综合集成研讨厅的软件体系结构[J].软件学报,2002,22(6):11〜18
[15]王丹力,戴汝为.综合集成研讨厅体系中专家群体行为的规范[J].管理信息学报,2001, 4(2): 1-6.
[16]于景元.钱学森的现代科学技术体系与综合集成方法论[几中国工程学,2001, 3(11):10-18.
[17]戴汝为.钱学森论集成智慧工程卩].中国工程学,2001, 3(⑵:14~20.
[18]张佐.系统的概念、方法与实现[几测控技术,1999, 18(9): 3~6.
[19]胡晓峰.系统集成与系统综合集成卩].测控技术,1999,18(9):11-13.
[20]王行刚.系统集成服务与系统集成技术卩].计算机应用,1997, 17(2): 1-2.
[21]刘鲁,张朝辉,姚忠.信息系统集成方面的若干问题[几北京航空航天大学学报,1998, 24(4): 331 〜335.
[22]刘彦保,张根耀.系统集成与信息系统[J].延安大学学报.199& 17(2):44-47.
[23]Pan J C, Tenenbaum J M. An intelligent agent framework for enterprise integration[J], IEEE Transactions on Systems, Man and Cybernetics, 1991, 21(6):1391~1408.
[24]Roda C, Jennings N R, Mamdani E H. The Impact of Heterogeneity on Cooperating Agents. Pro[A].AAAI Workshop on Cooperation among Heterogeneous Intelligent Systems[C].Anaheim, USA,1991.
[25]Alty J L, Griffiths D, Jennings N R. Mamdani E H. Advanced Decision Environment for Process Tasks: Overview and Architecture [A].Proc. BCS Expert System 94 Conference (Application Track)[C],Cambridge, UK, 1994.
[26]Mark S. Fox and Michael Gruninger, Ontologies for Enterprise Integration [A]. Second Conference on Cooperative Information Systems[C], Toroto,1994.
[27]Fadel F, Fox M S, Gruninger M. A Resource Ontologies for Enterprise Modeling [A]. Proceedings of the Industrial Engineering Research Conference[C], 1994.
[28]Rossak W. Some thought on system integration: A conceptual framework[J]. Journal of System Integration, 1991, 1:97〜114.
[29]徐宝明.集成化管理信息系统的理论与设计方法研究[D].华南理工大学博士学位论文,
广州:华南理工大学,1998.
[30]何勇,郑文钟.管理信息系统的原理方法及应用[M].杭州:浙江大学出版社,2005.
[31]薛华成.管理信息系统[M].北京:清华大学出版社,1999.
[32]罗云启.数字化地理信息系统Maplnfb应用大全(M].北京:北京希望电子出版社,2001.
[33]宜晨,童晓民,潘茜.Mapinfo4.0实用培训教程[M].北京:电子工业出版社,1998.
[34]张剑平,任福继,叶荣化等.地理信息系统与Maplnfb应用[M].北京:科学技术出版社, 1999.
[35]罗云启,曾琨,罗毅.数字化地理信息系统建设与Maplnfb高级应用[M].北京:清华大 学出版社,2003.
[36]李胜乐,陆远忠.Mapinfo地理信息系统二次开发实例[M].电子工业出版社,2004,1.
[37]刘光.地理信息系统二次开发教程(语言篇)[M].清华大学出版社,2003,1.
[38]Hainning R. P. Designing spatial data analysis modules for geographical information systems.[M] In: Fortheringham, S. and Rogerson, P(eds). Spatial Analysis and GIS, London, Taylor Francis, 1994.
[39]Burrough, P.A. Methods of Spatial Analysis in GIS[J]. International Journal of Geographical Information Systems, 1994,4:221-236.
[40]Fedra. GIS and Environmental Modeling, In M. F., Goodchild, B. O. Parks and L. T. Steyaert, 1993, Environmental Modeling with GIS. New York: Oxford University Press, Chapter 5.
[41]马蔚纯.基于地理信息系统GIS的城市水环境数值模拟研究[D].上海:华东师范大学 博士学位论文,1997.
[42]Wu, F. L. Simland: a Prototype to Simulate Land Conversion through the Integrated GIS and CA with AHP Transition Rules[J]. International Journal of Geographical Information Systems, 199& 12(1):363〜382.
[43]Yoon, J. Watershed-Scale Nonpoint Source Pollution Management Based on Spatiotemporal Parameter Model and Gis Linkage. In: Pascolo, P and Brebbia, C. A.(eds). GIS Technologies and their Environmental Applications. Computational Mechancis Publication, Southamton, UK, 1998:3〜12.
第四章 基于GIS的农业机械化信息管理与决策支持
系统设计与实现
根据农业机械化管理工作的特点和要求,本章结合前面章节有关数据挖掘方法和信息系 统集成方面的研究工作,完成基于GIS的农业机械化信息管理与决策支持系统的系统分析、 系统设计和系统实施。
4.1系统总体结构设计
基于GIS的农业机械化信息管理与决策支持系统的总体框架如图4 - 1所示。
 
图41基于GIS的农业机械化信息管理与决策支持系统总体框架
 
基于GIS的农业机械化信息管理与决策支持系统是一个由人和计算机等组成的能进行 信息收集、传递、贮存、加工、维护和使用的系统,是一个集现代管理理论、系统工程、现 代数学方法和计算机等构成的系统,是针对如何提高农机管理部门的工作效率和管理决策水 平而建立的能信息管理和辅助决策的信息系统。
4.1.1系统分析
系统分析阶段的主要任务是进行调查研究,可行性分析,确定目标,完成逻辑设计。系 统可行性分析是根据系统开发任务规定的目标和要求进行技术经济分析[心】。本系统的目标 是帮助农机管理部门对农业机械化工作中遇到一些问题进行综合分析,并辅助决策,以期提 高农机部门的管理现代化程度。因此,无论从长远或是近期来看,该系统都是必需。
农业机械化管理工作中涉及的信息的性质决定了系统的特点,农业机械化管理系统是一 个信息贮存规模庞大,数据关系复杂,数据处理操作繁琐的系统。此外,由于信息的组成复 杂,还要求系统具有较高的安全性,良好的可维护性,以及较大的升级潜力,以满足农机管 理部门的新增需求。
4.1.2系统设计
系统设计阶段的任务是将逻辑模型转化为物理模型。根据系统分析提出的任务和技术要 求,设计各种实施方案。从系统的整体出发,尽可能提高系统的效率、工作质量、可靠性和 可变更性,权衡利弊,选择合适的方案。设计的全过程一般可分为总体设计和详细设计〔I】。
1 •总体设计
按照“模块化”设计思想进行。模块是计算机软件中具有独立加工处理功能的基本单元。 这种基本单元的划分原则是模块内部联系紧密,模块间偶合关系简单。模块的内部联系称为 凝聚度。本系统采用三种不同大小的凝聚,分别为相似凝聚、过程凝聚和数据凝聚。此外, 本系统在确保完成预定任务的前提下,尽可能安排了合适的模块大小及限定了适当的模块数 量及系统层次,以保证系统执行的效率。系统共分为9个功能模块,并视需要进一步建立不 同功能模块的下级子模块。
2.详细设计
总体设计阶段确定了各种模块,详细设计过程则针对每一个具体模块进行,主要完成代 码设计、输入输出格式设计、人机对话接口设计、输入数据检验处理及各模块程序框图设计 等,以上过程也可总称为人-机事物设计。
(1)代码设计:代码是唯一标识一个实体的字母数字组成符号。
(2)输入输出格式设计:本系统输入输出格式设计着眼于通用性,即应能满足大多数 用户的需要,能为普通用户所接受。在输入方面,一是给出一个十分友好的输入界面,能提 供尽可能多的帮助信息;二是具备较高的记录与输入效率,及尽量减少输入工作量。在输出 方面,一是提供了屏幕输岀和打印机输出;二是输出报表能容纳尽可能多的信息,以满足决 策和进行各种系统分析的需要。
(3)人-机设计:为了充分发挥管理人员的主观能动作用,应对各种变化的环境,以 及实现系统调用的人工控制,必须安排一系列的人-机接口,实现人-机交互会话。通常有 以下3种形式:一是菜单形式:把所有的分支功能都显示出来,用户要调用哪个功能,只需 选中并点击该菜单项即可控制下一步的执行过程;二是是否回答式,操作人员是否作下一步 执行,只需回答“是(Y)”或“否(N)”,便可确定分支去向;三是一般回答式,根据显示 器上的提示问题,回答各种规定的命令和文件名,去控制系统的下一步的执行。人-机对话 要尽量简单,键入工作量小,以方便用户控制系统的运行。
4.1.3系统实施
系统实施阶段是具体实现系统设计阶段规定的物理模型。将系统分析和系统设计这两个 阶段的工作成果组合成一个整体,完成信息系统在业务领域实施。系统实施包括程序设计、 程序调试、系统调试、项目管理和系统转换等内容。对于基于GIS的信息管理和决策支持 系统,它主要包括3部分内容〔7】:一是数据库设计;二是方法库和模型库设计;三是GIS 功能的集成。
1.数据库设计
主要包括数据库结构设计和数据库输入界面设计等。
数据库设计是整个系统建立的基础,它的建立好坏直接影响系统质量,故必须在具体设 计数据库结构前必须根据系统分析阶段提出的要求,统筹考虑数据之间的关系,确定应建立 哪些数据库,每个库文件内部的数据存放结构(如字段名称、记录性质及长度等)。由于数 据结构设计为本系统的主要工作之一。因此,本文将在后面详细论述数据库的设计。
数据输入是系统运行的首要步骤,而且是系统操作中最繁重的一项工作,数据输入的质 量好坏与速度快慢,直接关系到整个系统的运行质量与运行速度。鉴于此,本系统在设计这 一模块时,给出了清晰、直观友好的输入界面,使得输入工作变得高效简捷。同时,在数据 输入后,系统还提供数据备份功能,以确保数据的安全性。
2.模型方法库设计
模型方法库的设计是本文的主要内容之一,通过模型方法完成数据挖掘工作。系统开发 始终是贯穿了结构化系统分析的思想。在程序设计上,运用软件工程的思想方法和技术,采 用结构化分析设计的方法,数据处理功能强,分类、检索速度快等优点,应用Visual Basic 语言设计岀多功能目录菜单的模块化程序,把一个命令文件作为一个功能模块,这样一来, —个复杂的系统将被分解为各个模块后,基本上可以独立理解,可读性及可维护性增强。
3.GIS功能的集成
GIS功能设计是本文的另一个主要工作内容,本文选用professional Maplnfb地理信息系 统工具软件作为GIS功能的开发平台,并运用软件工程和系统集成的思想和技术,借助开 发应用系统的计算机语言,将地理信息系统工具软件平台Maplnfb融入到所开发的系统中, 使GIS成为应用系统的一个子系统,从而实现跨平台的GIS功能操作。
Maplnfb Professional是一种功能强大、直观的桌面地理信息系统,由美国Maplnfb公 司推出的一个地理信息系统软件。Maplnfb不仅具有电子地图的显示、管理、建立和修改功 能,而且还能在电子地图上对地图对象与属性数据库中记录的自动联接,从而可以根据数据 库中的数据动态改变地图对象的可视属性,也可以通过地图来查询相应对象的数据库信息。 Mapinfo具有如下技术特点【4町:
(1) 地图表达与处理功能。Maplnfb能够利用点、线、区域等多种图形元素,以及丰 富的地图符号、文本类型、填充模式和颜色等表现类型,可详尽、直观、形象地完成电子地 图数据的显示。同时,对于位图文件和航片、照片等栅格图像,也可以进行屏幕显示。
(2) 关系型数据库管理功能。Mapinfo内置关系型数据库管理系统,支持SQL查询, 具有动态链接关系型数据库的功能,并可以直接读取FoxPro、Lotus 1-2-3Microsoft Excel、 Access以及ASCII文件中的数据。此外,还可运用地理编码(GeoCode)功能完成数据库与 图形的有机结合,实现在图形的基础上对数据库进行操作。
(3) 数据查询分析功能。Maplnfb的精华是其分析查询功能,即它能够精确地在屏幕 上查询、分析与其相应的地理数据库信息。对于相对简单的分析查询,Maplnfb提供了对象、 区域、缓冲区以及一些常用的逻辑与数据的分析査询函数;而对于较复杂的分析查询,则可 通过MapBasic编写的查询程序来实现。
(4) 数据的可视表达方式。Maplnfb采用地图、浏览表格及图表等三种不同的方式对 数据库内容进行描述,这三种视图均可动态链接。对于属性数据和查询分析的结果,Mapinfo 还采用专题图的方式将数据和分析查询结杲显示在屏幕上,以便用户迅速地了解和判断有关 的属性数据和查询结果。
(5)系统开发工具。Maplnfb系统软件提供了 MapBasic作为与Maplnfb配套的用户开 发工具,用户使用MapBasic可以设计、建立符合自己特点和要求的纯用户化的应用系统。 此外,利用MapBasic还可以将多媒体技术引入GIS,从而使系统更加形象、生动。
(6)图形输入输出功能。使用Mapinfo软件可处理通过扫描仪、数字化仪输入的数据 信息。同时,利用其相应的硬件支撑平台,Mapinfo在调整版面内容及相对比例之后,可以 通过绘图仪、打印机输出任意比例的图形、表格、图表,或直接将窗口中显示的矢量地图转 换为bmp文件或Metafile文件。
(7)OLE与地图数据资源。Mapinfo具有对象链接与嵌入(OLE)功能,允许Visual Basic、Visual C++、PowerBuilder 和 Delphi 把 Mapinfo 地图作为一个对象加以调用, Maplnfb地图也可方便地嵌入到Word、Excel等环境中。
(8)硬件操作平台。Mapinfo可支持多种硬件操作平台,能够适应配置较低的工作环 境。Mapinfo和MapBasic有可用于多种操作系统等多种硬、软件平台的版本,而且用 MapBasic编写的程序可以运行在任意一种硬件平台之上。
(9)用户界面。Maplnfb的用户界面十分友好,釆用了人们所熟悉的Windows形式的 窗口操作。Maplnfb中文版的菜单、对话框与Help信息全部釆用汉字显示,易学易用。
要实现上述3方面的内容,在系统实施过程中选择程序设计语言是非常重要的,它要求 所选择的语言具有很强的程序设计能力、数据库编程能力和跨平台的集成能力。综观当今各 种程序设计语言,本文选择微软公司发布的Visual Basic 6.0作为系统应用程序的设计工具, Visual Basic 6.0具有以下特点*叫
(1)Visual Basic 6.0具有强大的程序设计能力,能够实现各种复杂的模型计算功能,
(2)Visual Basic 6.0具有强大的数据库编程能力。在数据库应用开发领域完全可以和 专门的数据库编程语言相媲美。与其它数据库管理系统相比,利用Visual Basic 6.0以上版本 作为数据库开发平台有以下优点:一是简单性,Visual Basic 6.0为每一种数据访问模式提供 了相应控件,通过控件用户可以方便地连接到数据库,只要编写少量的代码甚至不编写任何 代码就可以访问和操作数据库;二是灵活性-Visual Basic 6.0不像一般的数据库管理系统(如 FoxPro, Access等)那样局限于特定的应用程序结构,也不需要用某些指令对当前打开的数 据库进行操作,因而比较灵活;三是可扩充性。Visual Basic 6.0是一种可以扩充的语言,其 中包括在数据库应用方面的扩充。在Visual Basic 6.0中,可以使用ActiveX控件,这些控件 可以由Microsoft公司提供,也可以由第三方根据COM标准开发。有了 ActiveX控件,可 以很方便地在Visual Basic中增加新功能,扩充Visual Basic数据存取控制的指令系统。而在 其它数据库开发平台中,目前使用ActiveX控件的并不多。
(3)Visual Basic 6.0 具有许多关于 OLE (Object Link Embed) Automation 处理功能' 能够与提供对象链接与嵌入(OLE)功能的地理信息系统软件工具平台进行有机集成,如 Visual Basic能把Maplnfb, ArcView等GIS软件平台的地图作为一个对象加以调用。
设计具体措施如下:
釆用模块化结构和多层次目录菜单。程序模块为倒树状结构,具有唯一的如口和出口。 在菜单调用上,规定逐级调用,上级调用下级,调用结束返回上级,保证整个系统的层次性 和模块化,使模块相对独立,程序设计功能划分模块,使系统路径清晰、程序易读、易维护、 易扩充、易修改和灵活性好。
采用计算机主动型人机交互方式。本系统有完整的交互语言,人机对话,屏幕提示,功 能齐全,全屏幕输入输出,直观简化操作,尤其便于非计算机专业人员使用。
采用多样的查询方式。根据用户的不同要求,本系统设置了逐条查询、浏览查询和条件 查询。对于报表格式输出,本系统为用户提供了各类可选打印介质(屏幕、打印机和磁盘)。
实现多库关联和连接。在功能模块设计时进行多选择建立关联和连接。可以使两个或多 个数据库通过连接操作形成一个新的数据库,以满足用户对各种信息的需求。
4.1.4系统评价
系统评价是系统开发过程的总结。具体包括以下几个方面:
(1) 系统运行管理工作。包括实现各种功能的信息管理全过程,组织管理数据收集, 整理输入,数据处理,结果输出及结构分类。系统运行的硬件、软件管理及辅助设备管理。
(2) 系统维护,即根据运行过程中存在的问题,有计划有组织地修改应用软件,使系 统能正确适应用户要求,适应环境条件变化。并且在系统的维护中,对程序的修改必须严格 按规定及使用权限进行。
(3) 提出系统改进和扩展方向。由于用户的需求和系统运行的外部环境是不断变化的, 系统开发后就不可能一劳永逸,一般一个系统运行3~5年后将会出现不能适应用户需求的情 况,因此,此时应在总结现有系统运行情况的基础上,进行较大的改进升级和功能扩展,以 满足用户的新需求。
4.2系统数据库详细设计
数据库设计就是把现实世界中一定范围内存在的应用处理和数据抽象成一个数据库的 具体结构过程。具体来说,就是对于一个给定的应用环境,确定一个最优数据模型与处理模 型的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立既能反映现实世 界信息与信息之间的联系,又能被一定的数据库管理系统(DBMS)所接受,同时还能实现 系统目标并有效地存取管理数据的数据库。
数据库的设计是一个复杂、繁琐的过程,它通常要求包括:制定整个数据库的使用目的 和目标,分析和评价各种设计方案和雏形试验。例如,在给一个组织开发数据库时,一方面, 首先必须了解数据库的使用目的,了解目前存在的问题和制约因素,然后拟定出各种可执行 方案,测试各种方案,根据测试结果来计划总体数据库实施方案。另一方面,既要考虑数据 的特征,又要兼顾应用目的,仅仅依据数据特征来进行数据库的设计往往会忽略用户将如何 使用这些数据。按照应用目的的设计的数据库是根据用户的使用目的来对数据库进行设计, 便可使设计岀的数据库既充分利用了技术上的优势,又兼顾了用户的应用目的。
数据库设计目标:
(1) 满足用户要求。设计者必须充分了解用户各方面的要求与约束条件,尽可能精确 地定义系统的需求。
(2) 良好的数据库性能。数据库的性能包括多方面的内容,在数据存储方面,既要考 虑数据的存储效率又要顾及其存取效率;在应用方面,不仅要满足当前应用的需要又要能满 足一个时期内的需求可能;在系统方面,当软件环境改变时,容易修改和移植。另外,还要 有较强的安全保护功能。因此,在数据库设计时必须从多方面考虑,对这些性能进行权衡。
(3) 对现实世界模拟的精确程度。数据库通过数据模型来模拟现实世界信息类别与信 息之间的联系。模拟现实世界的精确程度取决于两方面的因素:一是所用数据模型的特性, 二是数据库设计质量。就目前情况而言,现有的数据模型对于一般的信息系统能够表示现实 世界中各种各样的数据组织以及数据之间的联系,所以能否精确描述现实世界关键在于数据 库设计者的能力和水平。为了提高设计质量,必须充分了解用户要求,掌握系统环境,利用 良好的软件工程规范和工具,充分发挥数据库管理系统的特点。
(4) 能被某种数据库管理系统接受。数据库设计的最终目的是确定在数据库管理系统 支持下能运行的数据模型和处理模型,建立能满足用户需求的数据库。因此,在设计中必须 了解数据库管理系统的主要功能和组成。尽管数据库管理系统的功能因不同系统而有所差 异,但一般都应具有:数据库定义、数据库管理、数据库维护和数据库通信等功能。
4.2.1地理信息数据库
地理数据库是地理信息系统最基本、最重要的组成部分,也是投资比重最大的部分。 其主要功能是对数据的管理及查询检索,并且能对专题数据进行覆盖分析和其它评价,这是 GIS其它功能的基础。地理信息系统的应用效果取决于良好的数据结构设计,数据的完整、 正确,能精炼地表达及无误差传播,数据质量和标准化程度以及数据的维护更新能力何。 因此,地理信息数据库的建立除了要遵循一般数据库设计的规则外,还要符合地理信息的一 些特点,受一些特殊约束。
由于本文主要考虑将地理信息数据库与农业机械化管理工作中属性数据库的连接,使 地理信息服务于各地有关农业机械化管理信息的表达,侧重于对已建立的地理信息在农业机 械化管理中的应用。因此,如何建立地理数据库不是本文的研究内容,对其结构设计不作详 细的介绍。
本文在研究过程中使用经过数字化的浙江省行政区划图,在地理信息数据库包含了一 张地理信息表,其中原有字段为:AREA、PERIMETER、CHINA_CITY. POLYTYPE. GB90 和NAME,分别记录了浙江省各个多边形的县(市)的面积、编号、名称等属性值。为了 与农业机械化管理过程中有关农机统计信息数据库的连接,利用Mapinfo软件对原有的地理
信息表进行修改,添加了名称、父地区名、TAG等字段。名称字段记录了各个地区的中文 名称,父地区名记录了各个地区(市)的上一地区名称;TAG属性则是为了及时反映农业 机械化管理信息在地理空间上的变化。根据上述分析,地理信息数据库主要包含的字段如表 4 - 1所示。
表41浙江省行政区划电子地'图结构地理信息表
字段名 数据类型 必填字段 其它要求
AREA 数字
PERIMETER 数字
CH1NA_CNTY 数字
POLYTYPE 数字
GB90 数字
NAME 文本
名称 文本
父地区名 文本
TAG 数字
 
为了防止用户擅自修改地理信息数据库中的这些属性而导致错误,系统不提供对地理信 息数据库修改的功能。
4.2.2农机化属性信息数据库
农机化属性信息库的设计是采用Microsoft Access 8.0软件完成。农机属性数据库主要 是根据农机部门在管理决策工作中所要解决的问题,利用应用系统中的建立数据库文件功能 模块可随时建立。例如,在进行农业机械化发展水平评价时,可以将农业机械化水平评价指 标体系中的各个指标作为数据库中属性表结构的字段,并结合每个指标值的数据类型和取值 范围确定该字段的数据类型和宽度,根据第二章中的农业机械化水平评价指标体系,可建立 农业机械化作业程度的数据表,该表结构中的字段和字段参数的取值如表4 - 2所示。
表4-2农业机械化作业程度表结构参数
字段名 数据类型 必填字段 其它要求
耕整地机械化程度 数字 0-1
栽播机械化程度 数字 0-1
收获机械化程度 数字 0~1
植保机械化程度 数字 0~1
排灌机械化程度 数字 0~1
 
此外,为了实现农机信息数据库与地理信息数据库的连接,在有关各县市的农机属性信 息数据库设计时还应考虑了二者在共有字段参数设置上的相同性,如以县市名称作为连接的 共同字段。
4.2.3地理数据库与农机信息数据库的互访
在完成地理数据库和农机信息数据库的定义后,就可以方便地实现二者的互访。由于大 量的农机统计数据都具有空间属性,将GIS集成到应用系统中后,就形成可视化系统,进 而能提供丰富的地图数据,通过地理编码(Geocode)和创建点等手段,用相同字段能够方 便地将属性数据绑定到地图上,并且一一对应2~1現绑定后的数据不再是单纯的表格属性 数据,而是带有空间特性的地图属性数据,与某一个空间数据相联系,可通过一定的方式表 达在地图上。
4.3系统菜单和功能模块设计
基于GIS的农业机械化信息管理和决策支持系统的设计是采用结构化设计,其基本思 想是把系统分解为逻辑组织相对独立,功能单一的程序模块。把系统分析与系统设计两个阶 段的工作成果有机结合起来,把逻辑模型转换为物理模型。其目标是使模块间的联系尽可能 少,而块内的联系尽可能紧密。
43.1主控菜单设计
主控菜单是反映整个应用系统的基本外廓。用户进入系统后,首先是进入主控菜单, 从主控菜单用户就能基本了解整个系统的功能。本系统设计的主控菜单容纳了较多的信息, 使用户能一目了然,在屏幕的顶端是个“基于GIS的农业机械化信息管理和决策支持系统” 的标题。然后是按系统逻辑运行的步骤建立起主控菜单,依次进入各子系统或功能模块。
在设计系统的各级菜单时,遵循以下原则:
(1)画面美观、清晰、层次分明;
(2)多分支选择结构;
(3)单入口单出口流程;
(4)友好的用户界面,方便用户使用。
4.3.2功能模块设计
1.文件操作功能模块
该模块主要完成对属性数据库和表文件及地图文件操作、专题地图保存、各种图表的打 印及退出系统。具体内容如下:
(1)属性数据库操作包括:①建立新库和新表,建立表文件包括字段名称、类型及 长度的定义,建好一个新库后可直接输入属性数据;②修改库结构,包括字段内容、类型 及宽度,以及字段的插入、删除;③表文件连接,是对2个数据库按关键字段联结;④显 示库信息,是显示数据库的字段信息或字段内容;⑤利用结构化查询语言(SQL)提供多 种灵活的数据库表文件查询;⑥根据需要把数据库文件按记录或字段根据给定的条件排序。
(2)空间数据库操作主要包括地图数据表的打开、关闭;
(3) 对创建的各种专题地图、生成的各种属性数据表进行保存;
(4) 打印各种专题地图、属性数据,设置计算机打印参数以及退出系统。
2.数据编辑功能模块
(1) 数据编辑过程中的复制、剪切和粘贴等基本操作;
(2) 空间数据库中的表文件结构修改、记录的增加和删除,及各种操作结果的保存等。
3.地图操作功能模块
(1) 创建各种主题的专题地图、修改专题地图的制作参数;
(2) 通过调整生成的各种专题地图的次序控制图层,根据需要对图层进行标注:
4.统计查询功能模块
(1) 利用结构化查询语言(SQL)对地图数据库的数据进行一般和高级查询,查询结 果主要在地图中显示;
(2) 统计图制作:利用Mapinfo的统计图制作功能完成与空间数据有关统计图制作。
5.数据挖掘功能模块
根据农机管理部门目前可能遇到问题,主要设计了以下几类挖掘方法:一类是预测方法, 如时间序列法、回归预测法等,能方便地调用数据库中的数据进行各种预测分析;二是评估 方法,如综合评价和灰色关联度等方法;三是聚类和相关分析方法,如Q型和R型聚类方 法,简单相关和复相关分析法等;四是技术经济分析方法,如计算农业机器的更新期、折旧 费等。
6.系统工具功能模块
(1) 对应用系统的按钮工具栏、状态栏根据具体需要进行显示和隐藏操作的相互转换, 以及专题地图的列表;
(2) 文件转换是把数据库文件转换为数据文件或把数据文件转换为数据库文件。
7.窗口操作功能模块
主要用于对应用系统操作过程中出现各类窗口进行调整,如窗口的平铺、层叠;图例窗 口的显示与隐藏等。
&系统维护功能模块
主要用于系统的维护和管理,提供各种常用的设置,如用户的增减、用户密码的修改和 管理、重新登入等操作。
9.系统帮助功能模块
该模块主要提供了系统详细的使用和操作说明。
4.4 基于Maplnfb的GIS功能设计
根据前面章节有关系统集成方法分析,本文以Mapinfo Professional 7.0为地理信息平 台,并采用动态链接型集成方案将GIS的功能集成到VB开发的应用系统中。
4.4.1OLE Automation 技术
OLE (Object Linking and Embedding,简称 0LE) Automation 技术是 Microsoft 公司为 解决Windows应用程序间的通信而提出的,发展至今,OLE已演变为一种协议或规范,并 成为软件集成技术的基础。OLE Automation技术使用户能够通过程序设计,在一个程序中 控制控制另一个应用程序中的对象,从而实现不同应用程序间的信息共享。OLE Automation 包括OLE Automation服务器和OLE客户两部分应用程序。OLE Automation服务器为OLE 客户提供各种可编程的属性和方法,使客户能通过某种自动化的过程直接操作这些属性和方 法,进而实现控制自动化服务器的目的。OLE Automation使某一个应用程序可编程化,即 其它程序语言能够使用该程序提供的各种服务,也就是允许从应用程序的外部操纵该应用程 序的对象。OLE Automation的出现使系统集成在技术上得到了保证。自动化服务器以对象 的形式提供可被其它程序使用的属性和方法,并以此调用应用程序的内部函数,实现外部程 序对数据及功能的操作。
OLE Automation的工作方式是通信的被动方(OLE服务器)应用程序向通信的主动方 (OLE客户)应用程序提供一个以上的可供其调用的OLE自动化对象类型,OLE客户通过 引用这些对象实现对OLE服务器的调用,然后通过设置对象的属性和使用对象的方法操纵 OLE服务器应用程序完成二者的通信o Visual Basic是一个完全支持OLE的应用程序开发工 具,使用VB既可以编写OLE服务器的应用程序,也可以编写OLE客户机的应用程序。 Maplnfb Professional作为当前流行的桌面地理信息系统工具软件,提供了完整的地理信息系 统解决方案,功能强大。目前,在Mapinfo Professional 4.0以上版本,增加了集成地图 (Integrated Mapping)的新功能,其核心就是OLE Automation技术。其中封装了一系列对 地图操作的功能,组成Mapinfo自动化服务器,使得地理信息系统二次开发人员可以利用 提供OLE Automation的可视化程序设计语言如Visual Basic、Visual C++、Delphi、和 PowerBuilder等将Maplnfb集成到应用程序中,进而方便快速地拓展Mapinfo的功能〔心叫
4.4.2GIS集成二次开发的实施
1.实施的技术路线
利用OLE Automation技术将Mapinfo的GIS功能集成到应用系统中,主要是将OLE自 动化服务器提供的对象的属性和方法,在提供OLE Automation技术的程序设计语言中加以 利用和控制,同时利用程序设计语言定制统一的用户界面,最大限度地利用已有的工具型地 理信息系统的各种空间数据管理、分析功能,并在工作量最小的前提下,扩展其功能。在本 文中,就是利用VB制统一的应用系统界面,通过OLE Automation启动Mapinfo Professional 在后台运行,在用户操作时,将命令传送到Mapinfo Professional'取得自动化服务器的服务, 达到控制Maplnfb的目的,其实现机制如图4 - 2所示。
 
 
图4 - 2 VB调用OLE Automation服务器的内部实现机制
2.技术关键和技术难点
将Mapinfo Professional集成到应用系统中的关键主要有以下两点:一是OLE自动化服 务器的建立,即如何把Maplnfb Professional成为VB界面的一部分,并实现对它的控制; 二是Mapinfo Professional返回信息的接受,用来响应鼠标的操作。
在具体实施过程中的技术难点主要有以下4个方面:
(1)当在VB中建立了 Maplnfb自动化服务器后,如何对其进行控制,并实现Maplnfb 的具体功能。
(2)将Maplnfb集成到VB界面后,并不能自动生成Maplnfb相关的工具按钮,如何 在VB开发的应用系统中使用Mapinfo的工具按钮。
(3)在Mapinfo集成到VB界面后,当改变地图、浏览窗口的大小时,Maplnfb并不 会自动调整窗口中的内容来填满,如何实现二者的同步变化。
(4)当通过OLE Automation将用户命令发送到Maplnfb Professional自动化服务器后, Maplnfb Professional有相应的反馈信息,如何捕获反馈信息:当对集成在VB应用程序界面 中的地图实施相应操作(如放大、移动等)后,如何将Mapinfo Professional的反应传达给 VB的客户程序。
4.4.3在VB中集成Mapinfo的方法〔心勺
1.Mapinfo的启动与终止
要启动一个Maplnfb的实例,在Visual Basic中可以通过调用CreateObject ()函数来 实现,并将该函数的返回值保存在Visual Basic中的一个全局变量中,方便应用程序以后访 问该Maplnfb实例。例如,将全局对象变量命名为mapinfb,则可以使用下列命令语句来启 动 Mapinfo:
Set mapinfo= CreateObject ("Maplnfb.Application")
当系统运行结束’要终止Mapinfo运行,那么只要释放启动时创建的与Mapinfo对应 的对象变量,该Maplnfb实例自动终止。实现Maplnfb的终止,只要将该对象变量设置为 Nothing 即可,即 Set mapinfb=Nothingo
2.Mapinfo标准工具按钮的集成及自定义按钮与菜单的创建
在VB中使用Mapinfo的GIS功能,主要通过Mapinfo提供的“Do”和“Eval”方法 调用MapBasic语句实现°"Do"方法用于执行MapBasic语句;"Eval"方法用于执行MapBasic 的函数或地图对象,可得到返回值。“Do”和“Eval”是系统集成中调用GIS操作最基本的 方法。同时还可使用"RunMenuCommand"方法,调用Maplnfb定制的菜单功能。
(1) Maplnfb标准工具按钮的集成及自定义按钮的创建
Mapinfo工具栏中的按钮提供了强大的功能,例如放大地图、缩小地图、漫游地图、选 择对象、标注对象,虽然在非MapBasic中的应用程序中很容易集成Maplnfb中所有工具按 钮的功能,但是却不能对Maplnfb的工具栏进行重父化。因此,如果要在VB应用程序中实 现具有Maplnfb功能的按钮,则只能在应用程序开发环境中自己创建。要实现VB应用程序 中的工具按钮来模拟标准Maplnfb按钮,只需要调用Maplnfb的RunMenuCommand方法即 可。例如,在VB的按钮中,利用如下语句设置Mapinfo的信息(Infb)工具:
mapinfo.RunMenuCommand 1707 或 mapinfo.RunMenuCommandM_TOOLS_QUERY
其中,1707和M_TOOLS_QUERY分别代表激活工具的命令数值与命令标识符。在命 令中使用标识符号可以增强程序的可读性。在集成地图应用程序中使用标识符时,可以把包 含这些标识符的头文件MAPBASIC.BAS作为应用程序的一个标准模块添加到程序中,并将 标识符设置为全局变量,方便程序的调用。Mapinfo提供了全部标准工具按钮的名称、数值 (ID号)和标识符。
除了在VB应用程序中集成Maplnfb的标准按钮外,用户也可以创建自定义按钮并将其 像标准按钮一样集成到客户程序中。创建自定义按钮的MapBasic命令语句为:
Create ButtonPad “Custom Tools" As ToolButton ID button_idDrawMode dm_pode
Calling OLE llHandleToolButton^^ Cursor n [•••]
其中button'd:自定义按钮的编号,整型
dm_code-按下鼠标左键拖动时的虚线模式
n-鼠标形态编码。在Icon.Def中定义。
HandleToolButton:处理自定义工具按钮程序,其功能在客户程序中创建的类定义。
(2) 自定义Maplnfb快捷菜单的创建与集成
用户在Mapinfo窗口中单击右键时,会显示一个快捷菜单。在集成地图开发的应用程 序中也会出现该快捷菜单。要在VB集成地图应用程序中实现快捷菜单这一功能,可以使用 如下的MapBasic命令语句:
Create Menu "MapperShortcut" ID 17 "menuitem" ID menu_item_id Calling OLE ltHandleMenuSelection,,[, ]
menuitemt字符串,菜单名
menujtemjd-.自定义菜单编号,菜单编号不同,编号不同;整型
HandleMenuSelection:处理右键功能的菜单程序,在客户应用程序创建的类文件定义。 如果要在集成地图应用程序中查询MapBasic表达式的值,则需要构造代表该表达式的 字符串。在通过OLE自动化连接Mapinfo时,就可以使用Eval方法将该字符串发送给 Mapinfo□在Visual Basic 6.0中实现这一过程的语句为:
Dim result As String
result=mapinfo.Eval ("WindowID (0)")
当调用Eval方法时,Mapinfo将字符串解释为MapBasic的表达式,判断该表达式的 值,然后将该值作为一个字符串返回给集成地图应用程序。若表达式的返回值是一逻辑值, Mapinfo将返回一个字符的字符串“T”或“F”。
此外,打印地图也是地理信息系统必须提供的功能。在集成地图应用程序中,可以使 用MapBasic的PrintWin语句来打印Mapinfo窗口,无论该窗口是否已被重父化。若要保存 集成窗口的内容,可以使用MapBasic的Save Window语句将地图窗口输出为Windows元文 件(WMF文件)。
3.在VB中控制Mapinfo窗口
Maplnfb的窗口大致可以分为两类:一类是模态窗口,包括地图窗口(Map)、浏览窗 口(Browse)、图形窗口(Graph)、图例窗口(Legend)和布局窗口 (Layout);另一类是非 模态窗口,包括信息窗口(Info)、标尺窗口(Ruler)、消息窗口(Message)和统计窗口 (Statistics )<>
(1)重父化Mapinfo窗口
在VB环境中,若要生成一个Maplnfb窗口,可以向Mapinfo发送一条MapBasic语句 来生成一个窗口,这就使得Mapinfo的窗口成为应用程序的一个子窗口,这个过程称为窗口 的“重父化(Reparent)”。重父化Maplnfb窗口到其他应用程序中时,并不能使Maplnfb存 取其应用程序的数据。
若要在Visual Basic 6.0开发的集成地图应用程序中继承模态的Maplnfb窗口时,可以 向发送Set Next Document语句,以及创建该窗口的MapBasic语句。Set Next Document语 句是用于重父化文档窗口,也就是为该窗口重新指定一个父窗口。在Set Next Document语 句中,指定集成地图应用程序中一控件的HWND (句柄)。当下次创建Mapinfo窗口时,新 建的窗口被重父化了,这样这些窗口就将用户程序作为它们的父窗口。
对于重父化的窗口,都要使用Set Next Document Parent语句与创建窗口语句组成的语 句对。在创建窗口后,可以通过查询“WindowID (0)”的值来确定新建窗口的ID值。许多 MapBasic语句都需要使用该ID值作为参数。
若要重父化Maplnfb中的信息、标尺、消息和统计等几个非模态的特殊浮动窗口,则 要使用MapBasic的Set Window语句。
对于Mapinfo中标准的惟一图例窗口除了直接重父化外,也可以创建并重父化。若要 创建并重父化则需要使用MapBasic的Set Next Document语句,然后调用MapBasic的Create Legend语句。但与直接重父化图例窗口不同的是,所创建的图例窗口是与地图窗口或统计 图窗口绑定在一起的,而不像Mapinfo的默认图例窗口。因此,当活动窗口改变时,应用程 序中创建的图例窗口不会自动改变。
(2)地图窗口大小的改变
地图窗口大小的改变是GIS中常用的一种基本操作,地图集成程序应该能为用户提供 改变地图窗口大小的功能。但是当用户将地图窗口集成应用程序中,并改变地图窗口大小, Maplnfb并不会自动依据新窗口的大小重新设置地图内容以添满窗口。因此,要在集成地图 应用程序中实现地图窗口大小的自动改变,则必须利用Windows API函数MoveWindow编 写代码来实现此功能。在VB中可用Declare语句声明API函数MoveWindow。
Declare Function MoveWindow Lib "user32" (ByVal hWnd As Long, ByVai x As Long
ByVai y As Long , ByVal nWidth As Long , ByVal nHeight As Long, _
ByVal bRepaint As Long ,)
当用户改变窗口大小时触发Form_Resize ()子过程,因此在该子过程中调用函数 MoveWindow来改变地图窗口的大小,代码如下:
Private Sub Form Resize ()
Dim mHwnd as Long
mHwnd=Val (MapInfo.Eval ("Windowinfo (FrontWindow ( ) ,WIN_INFO_WND)")) MoveWindow mHwnd, 0,0, ScaleWidth, ScaleHeight, 0
End Sub
4.Maplnfb反馈信息的分析和处理
在将Maplnfb集成到VB中要解决的最关键的问题是VB如何响应Mapinfo的鼠标点击 (clicked)事件。地图集成到VB界面后,在地图窗口的操作为Maplnfb所控制,VB不能 响应点击地图的事件。因此,若要控制Maplnfb的运行,就需要知道Maplnfb发送给客户程 序的信息。例如,当地图窗口改变时,希望Maplnfb能够通知应用程序,并告知改变的窗口 的ID,这样就能在客户程序中编写代码对此做出适当响应。这种在Mapinfo中调用应用程 序中代码的通信机制就称为回调。
回调机制允许Mapinfo在以下几种情况向客户应用程序发送信息:
(1)当用户使用自定义工具与Maplnfb窗口进行交互。例如当用户在地图窗口中单击 并拖动鼠标绘制一条直线,这时Mapinfo就将选择的X和Y坐标发送给用户。
(2)用户选择了菜单命令。例如,假设应用程序自定义了 Maplnfb的快捷菜单,当用 户从快捷菜单中选择命令时,Mapinfo可以调用客户应用程序来通知该菜单事件。
(3)当地图窗口发生改变时。如果用户改变了地图窗口中的内容(例如增加或删除了 图层,或漫游地图),Maplnfb可以告诉客户应用程序该地图窗口的ID号。
(4)当Mapinfo状态栏中的文本发生改变时。Mapinfo的状态栏并不会自动显示在集 成地图应用程序中。如果希望在应用程序中模拟Mapinfo的状态栏,就必须编写代码,无论 状态栏文本发生何种变化,Maplnfb都能通知应用程序。
通过OLE实现回调的基本步骤如下:
(1)在能作为OLE服务器的语言开发环境中,创建类,并在该类中定义一个或多个 OLE方法。
(2)如果希望模拟Mapinfo状态栏,创建一状态设置方法,该方法主要传递字符串参 数。
(3〉如果每次在地图窗口改变时,希望Mapinfo能通知应用程序,则需创建一个窗口 状态变化方法,该方法需要传递一个4字节的长整型整数。代表Mapinfo窗口的ID的值, 指示哪个地图窗口改变了,在该方法中加入代码响应地图窗口的改变。
(4)如果希望在用户使用自定义的菜单命令或按钮时,Mapinfo通知应用程序,则需 要创建一个或多个方法,而每个方法都需要传递一个字符串参数。
(5)使用该类创建一个对象。例如Public myObject as New CMyClass»
(6)在程序启动Mapinfo后,调用Mapinfo的SetCallback方法,并指定对象的名称。
(7)如果希望当用户使用自定义工具按钮时,Maplnfb通知应用程序,则需要定义一 自定义按钮。通过“Calling OLE方法名”语句设置自定义按钮调用的方法。这些方法是在 步骤(4)中创建的。
(8)如果希望当用户使用自定义菜单命令时,Maplnfb通知应用程序,则需要定义一 自定义菜单命令。通过“Calling OLE方法名”语句设置该自定义菜单命令调用的方法。这 些方法是在步骤(4)中创建的。
(9)在自定义的方法中,编写代码和调用语句,处理由Mapinfo传递过来的参数。
如果使用方法来处理自定义按钮和命令菜单,Maplnfb向用户发送由逗号分隔的字符 串,在方法中,解析该字符串。字符串的格式很不一致,主要依赖于用户所选择的菜单命令 和工具按钮的类型。
在集成地图应用程序中,创建自定义的Maplnfb菜单命令和工具按钮后,使用回调机制 来处理Maplnfb发送给应用程序的信息。当用户选择这些命令和按钮后,Maplnfb向OLE 方法发送一个由逗号分隔的包含8个元素的字符串,并通过调用Commandinfo ()函数来 判断当前事件所产生的信息。当创建自定义命令菜单或按钮,并使用“CallingOLE方法名” 语句指定该菜单命令或按钮响应的方法后,Mapinfo就会使用上述8个Commandinfo ()函 数的返回值构造一个由逗号分隔的字符串。且该字符串始终以“Ml:”为前缀,通过该前缀, OLE服务器就可以判断是Mapinfo调用了该方法。在回调处理方法中与Commandlnfo () 函数相关的定义如表4 - 3所示。
表4-3 与Commandinfo ()函数相关的定义
菜单事件后有意义的代码 按钮事件后有意义的代码
1 CMD_INFO_X
2 CMD_INFO_Y
3 CMD_INFO_SHIFT
4 CMD_INFO_CTRL
5 CMD_INFO_X2
6 CMD_INFO_Y2
7 CMD_INFO_TOOLBTN
8 CMD INFO_MENUITEM
 
Maplnfb向方法发送的字符串是用以下方式构造的:
"MI:"+Commandinfo (1) +", "+Commandlnfb (2) +", "+ Commandinfo (3) +", "+ Commandinfo (4) +", "+Commandinfo (5) +", "+Commandlnfb (6) +", "+Commandinfo (7) Commandlnfb (8)
如果为每一个自定义的按钮指定了惟一的ID值,可以让这些按钮调用同一个方法,然 后在方法中通过检查字符串的第7个元素,判断用户选择的是哪一个按钮。一旦Mapinfo 将由逗号分隔的字符串发送给应用程序的方法,那么接下来的任务就是在方法中增加代码来 解析该字符串,并执行相应的功能。
通过上述回调机制就可以捕获Maplnfb中状态栏的改变、Mapinfo地图窗口的改变、 Mapinfo所生成的菜单事件以及自定义工具按钮的反馈信息,据此执行相应的操作。
4.5本章小结
(1)研制开发信息管理系统是农机管理部门利用信息提高决策水平的有效手段之一,本 章根据农机管理部门的工作要求,利用结构化信息系统开发和系统集成思想完成了基于GIS 的农业机械化信息管理与决策支持系统的总体框架、功能模块的设计。
(2)在分析系统开发和系统集成目标的基础上,选择Visual Basic6.0作为系统开发工具 和系统集成平台,利用VB实现应用系统中各种数学模型的设计和对数据库的各种操作,以 professional MapInfb7.0为地理信息系统平台实现GIS功能,利用Microsoft Access8.0完成 属性数据库的设计。通过这些软件工具实现了基于GIS的农业机械化信息管理与决策支持 系统的各项功能。
(3)在VB环境中如何响应Mapinfo的鼠标点击事件和控制Maplnfb运行是实现GIS 功能的关键,为了分析和处理Maplnfb发送给客户程序的信息,利用回调机制(SetCallback) 完成了处理Mapinfo返回信息的几个主要方法的设计和程序实现,从而在VB环境中完全实 现了 Mapinfo所提供的各种地图操作功能。
参考文献
[1]薛华成.管理信息系统[M].清华大学出版社,2003.
[2]黄梯云.管理信息系统[M].高等教育出版社,2000.
[3]吴信才等编著.地理信息系统设计与实现[M].北京:电子工业出版社.2002.
[4]罗云启.数字化地理信息系统Maplnfb应用大全[M].北京:希望电子出版社,2001.
[5]宜晨,童晓民,潘茜.Mapinfo4.0实用培训教程[M].北京:电子工业出版社,199&
⑹张剑平,任福继等.地理信息系统与Mapinfo应用[M].北京:科学技术出版社,1999.
[7]罗云启,曾琨,罗毅.数字化地理信息系统建设与Mapinfo高级应用[M].北京:清华大 学出版社,2003.
[8]三味丁作室.Mapinfo 6.0应用开发指南[M].北京:人民邮电出版社.2001.
⑼ 童爱红,侯太¥• Visual Basic数据库编程[M].北京:清华大学出版社,2004.
[10]蒋方flip. Visual Basic 6.0全攻略宝典[M].北京:中国水利水电出版社,2000.
[11]吴信才等编著.地理信息系统原理与方法[M].北京:电子工业出版社.2002.
[12]谢跟踪,陈文惠,郑达贤.基于Mapinfo的福建省经济数据可视化研究[J].地球信息科 学.2003,2: 51〜55.
[13]陶海冰,丁泊阳.VB+Maplnfo的GIS软件高级开发在兰江水文的应用[J].浙江工业大 学学报.2003, 31(5):562-566.
[14]高峥.基于OLE自动化技术实现Mapinfo下的电子地图[J].电信技术研究.2002,8:7-10.
[15]杨华,高克昌.用OLE自动化技术开发应用型地理信息系统[J].计算机应用研究. 2004,1:191-193.
[16]周权,肖德琴.OLE技术在应用型地理信息系统开发中的应用[J].广州大学学报(综合 版).2001, 15(8):457 &
[17]王金风,高欣,杨丽徒等.OLE回调技术在VB与Mapinfo集成地图开发中的应用[J].中 原工学院院报.2003, 14(4): 8-11.
[18]李胜乐,车时.Maplnfb地理信息系统二次开发实例[M].北京:电子工业出版社,2004.
[19]刘光.地理信息系统二次开发教程(语言篇)[M].北京:清华大学出版社,2003.
[20]Maplnfo Corporation. Mapinfo Reference, User Guide. New York, 199&
[21]Mapinfo Corporation. Maplnfb MapBasic Development Environment User Guide. New York, 2001.
[22]张成才,魏文秋.VB与Mapinfo集成开发应用软件的研究[J].武汉水利电力大学学报, 2000, 33(1): 71 〜79.
[23]黄丙湖,赵玉梅.VB与Mapinfo集成技术及实现卩].山东科技大学学报(自然科学版). 2003, 22(1): 8Q88.
[24]郝晓峰,徐明,谢晓霞.Mapinfo二次开发中回叫机制的运用[J].微计算机信息.2002,
第五章 系统应用与分析
在完成上述基于GIS的农业机械化信息管理和决策支持系统开发的基础上,本章以浙 江省农机管理部门工作为背景,将浙江省的部分农机统计数据输入应用系统中,一方面通过 调用有关模块展示应用系统的功能;另一方面,分析系统处理数据的结果,对浙江省农业机 械化的发展提出措施与政策建议。
5.1浙江省农业生产和农业机械化现状
5.1.1浙江省农业生产基本情况
浙江省是中国大陆高产农业区域之一,农业发展有比较优越的自然条件,许多农产品都 占有重要地位。浙江省属亚热带气候,四季分明,气温适中,光照充足,雨量充沛,空气湿 润,利于多种农作物的生长。此外,春末夏初的雨热同步和秋冬季节的光温互补,对农作物 生长十分有利。浙江在气候上属南北过渡地带,南、北方的许多作物都可在此种植。
全省耕地面积占国土面积的18%,主要分布于浙北和东南沿海平原,土壤肥沃,河网 密布,灌溉便利,是浙江的粮仓,同时也是蚕茧、棉麻、蔬菜、家禽、淡水鱼的主要产区。 海拔50米以下的山间盆地及河谷平原亦为宜农区,海拔350米以上的山脉是森林分布区, 其间也有草山草坡;海拔50-350米之间的中间地带则是农业过渡层。内陆水域面积占全省 总面积6.4%,海洋渔场面积比全省陆地面积大1.2倍,水产养殖条件十分优越。总之,浙 江农业自然资源丰富,发展潜力很大。
浙江省由于地貌复杂多样,地域差异较大,因而农业生产具有区域性特点。全省可分 四种农业类型区:一是沿海平原类型,自北而南有:杭嘉湖平原、杭州湾两岸滨海平原、宁 绍平原和温台平原,有的以经营粮桑为主,有的以粮畜为主,也有的以粮鱼为主,且都兼有 多种经营;二是河谷盆地类型,由河谷平原及其边缘的丘陵和山地组成,全省四十多个盆地 大多属之,其中金衢盆地最大,以产粮为主,兼有林业和畜牧业;三是丘陵山地类型,有浙 西、浙东、浙南三片,以经营林业为主,兼营茶、粮、畜等,目前还有很多资源待开发利用。 四是沿海岛屿类型,包括舟山群岛和大陈、洞头、南北鹿等二千多个岛屿,以经营海洋渔业、 海滩盐业和涂田养殖业为主。
全省主要有九个农业区:杭嘉湖平原粮桑鱼畜区、杭州湾两岸滨海平原棉麻特产区、 宁绍平原粮油鱼畜区、温台平原粮桔畜区、金衢盆地粮林茶畜区、浙东丘陵盆地茶粮果林畜 区、浙西山地丘陵林茶粮区、浙南山地丘陵林粮茶区以及海洋岛屿鱼盐区。
5.1.2浙江省农业机械化发展现状
从上世纪50年代到70年代用了近二十年的时间,浙江省基本形成了农机制造工业体 系和农机管理推广体系,为浙江省农业生产的发展起到了重要作用。目前,浙江省已建立了 以联合收割机、水泵、植保机械、茶叶加工机械、柴油机和拖拉机以及农机配件为主导产品 的农业机械制造业基地。据统计,2004年全省生产的履带式全喂入联合收割机的总产量占 全国的45%,销售量占全国的63%;水泵产量占全国的55%,其中出口水泵占全省的80%; 植保机械产品总量占全国的63%,具有一定规模的生产企业全省就有43家;茶叶釆摘和加 工机械的厂家、产值和销售都占全国的70%以上,目前全省共有规模以上的茶机企业50多 家,机械种类有100多种;在柴油机和拖拉机,小型拖拉机的出口连续15年名列全国第一, 小马力柴油机的生产总值占全国的10%。此外,全国农机市场所需柴油机的缸套、活塞、 曲轴,以及农用车、收割机的配件大部分来自浙江省。
“十五”期间,全省农机装备保持了较快的发展速度。据统计,2004年底,全省农业 机械原值为1288507万元,农机总动力1615.35万kw,大中型拖拉机3509台,农用小型拖 拉机19.93万台,农用运输车5.91万台,运输型拖拉机2.19万辆,联合收割机数量己达12643 台,全省拥有工厂化育秧设备108套,各类水稻种植机械591台,农用排灌机械48.61万台, 谷物烘干机278台,水果分级机137台,化肥深施器42252万台,秸秆还田机械拥有量281 台,田园管理机械106台,各类温室大棚面积17628.33万mi冷藏保鲜库24.31万nA 在农机装备数量增加和结构改善的同时,农机作业量增加,机械化水平大幅度提高。据 统计,2003年底,机耕作业面积为1486.34万亩,机械种植面积为21.86万亩,机械收获面 积973.95万亩,农业生产过程中的耕、种、收机械化程度分别达到了 61.60%、0.44%、19.88%, 其中水稻机械收获率接近50%,而在浙江省的水稻主产区基本上实现了机械收获,工厂化 育秧达2.06万亩,机械化肥深施面积达783.31万亩,机械秸秆还田面积462.35万亩,机械 烘干粮食2.82万t,冷藏保鲜库储藏量达29.17万t,机械水果分级作业量达25.27万t。
从总体上说,我省农业机械化的发展空间不断扩大,服务领域由粮食作物向经济作物, 由大田农业向设施农业;由种植业向养殖业、农产品加工、运输业全面发展,由产中向产前、 产后延伸,农业机械化正向广度、深度和高度进军。
虽然浙江省的农业机械化在过去的几十年中,尤其是改革开放后有了迅速发展,但目前 农业机械化发展的总体水平较低,发展过程中存在一些突出问题,严重阻碍了农业机械化的 发展,具体表现为以下几个方面:
(1)对农业机械化的地位和作用缺乏正确认识
浙江省农业机械化的发展经历了一段曲折的过程。当今社会上对农业机械化的认识存在 片面性:一是对产业结构调整和现代化进程中农业地位的重要性和农业机械化的作用认识不 足。认为我省农业人口多,农业劳动力富余,发展农业机械化不是当务之急,而没有认识到 农业机械化水平低导致了农业综合生产能力落后,无法适应农业现代化发展的要求;二是对 市场作用的片面认识,认为发展农业机械化是农民自己胞事情,処樓化水平低是市场机制自 然选择的结果,没有看到农民对农业机械化投入不足的现象,造成这种现状的原因不是农民 不需要农业机械化,而是其在某种程度上对农机化发展预期难以判断,适用农业机械供给不 足的一种表现。因此,转变观念,提高认识,是推进农业机械化发展中一项十分重要的任务。
(2)政府对农业机械化扶,持不够,投入机制不健全
改革开放后,农机化发展的投资主体发生了变化,从政府、集体转向农民(农户),国 家对农机行业的支持明显减弱。具体表现为:一是农机科研创新长期缺乏财政金融扶持、资 金缺乏、科研乏力,造成农机产品技术水平低;二是农民作为投资主体,在购买大型农业机 械时需要政府引导和扶持,但更需要政府补贴。虽然自上世纪80年代以来,安排了一些资 金对个人购买农机进行补助,同时各地也出台了一些补助政策,解决用户筹资和新机具推广, 但由于补助的决策者与实际承担工作的职能部门相脱节,导致有限的资金未能发挥应有的作 用;三是农用柴油、农用电负担过重,加上农机产品价格偏高,服务水平低,造成机械化作 业成本偏高,影响了农机作业的普遍推广;四是一些社会效益、生态效益好,但短期直接经 济效益不明显的农业机械化项目的推广普及这些项目都需要政府投入或补贴,如秸杆粉碎还 田、化肥深施等,但目前这些方面的投入远不能适应形势发展的需求。
(3)农业机械化总体水平低、发展不平衡
与发达国家和地区相比,从总体上来说,一方面,目前浙江省农业机械化发展水平较低, 滞后于社会经济发展对农业机械化的要求;另一方面,由于全省各地区的经济基础、科技基 础和环境的差异,全省各地的农业机械化发展水平不平衡。在东部沿海经济发达地区如宁波、 温州以及杭嘉湖平原地区,农民收入较高,二、三产业发展迅速,城镇化步伐较快,农村劳 动力不足,对农业机械化要求迫切,这些地区无论是农机装备、农业机械化水平和服务管理 都达到较高的水平;而西部金华地区、衢州地区以及温州的泰顺、文成等县则由于经济基础 薄弱和所处地理环境等原因,存在着农机作业的薄弱甚至空白环节。这些地区的农业机械化 水平与我省发达地区仍有很大差距。
(4)农机产品结构失衡、有效供给不足
农机品种、规格不多,质量性能不稳定,有效供给不足,无法满足农民对农业机械化新 装备、新技术的多样化和增加收入需求的矛盾凸显。主要表现为:一是关键性农机具,特别 是种植业、养殖业所急需的水稻育秧、栽植、收获机械,经济作物采摘、加工机械,种子、 饲料、温室栽培设备等跟不上农业生产发展的需要;二是农机动力多、配套机具少;小型机 具多,大中型农机具跟不上发展需要,而拖拉机主机与农机具的配套比低,据调查,目前全 省大中型拖拉机和小型拖拉机与农机具配套比分别为1.6 : 1和1 : 1,致使拖拉机综合利用 率低。造成这种现状的主要原因是由于农机科研投入不足,技术储备和研制开发力度不够, 同时农机科研存在周期长、农机作业对象特殊、环境的制约,加之科研开发、样机产品化的 环节上存在问题,致使技术成果转化率很低。
(5)农业机械化社会服务体系不健全
基层农机化服务体系是农机化系统直接面向市场的主体,是实施宏观调控的重要环节, 也是完成农机化各项服务的组织保证。虽然目前全省很多县市已基本建成了以县(市)为中 心、乡为骨干、村为基础的农机管理服务体系,但有的县(市)区管理力量薄弱,人员匮乏, 开展农机服务工作难度较大,基层农机人员经费不落实的情况也比较普遍,影响了工作的积 极性。另外,一些地区的农机化发展速度虽然较快,但农机培训、推广设施等基础设施薄弱, 人员素质低、师资缺乏,难以承担目前的各项农机培训任务和开展较高层次的农村急需人才 的培养,农机技术人员亟需知识更新、观念转变。此外,在开展社会化与专业化服务方面, 由于所能提供的服务项目只能部分满足当前农业生产需求,致使全省大部分农机服务组织的 各种功能未能得到全面的发挥,农机服务效益较差。
(6)农机化法规和管理体制不完善
近几年来,我省陆续出台了《浙江省乡(镇)农机化规模服务试点管理办法》、《浙江省 农机成人教育暂行规定实施细则》、《浙江省农业机械安全管理暂行办法》、《浙江省农机维修 点及修理工管理办法》和浙江省人民政府第8 0号省长令《浙江省农业机械管理办法》等一 系列规章,在一定程度上保障了我省农机化事业的健康发展,促使我省的农业机械化发展步 入法制化、规范化的管理轨道。但我省农机法规建设仍明显落后于全国其他省份,政策法规 体系不健全、不完善,这与社会主义市场经济是法治经济的要求极不适应。此外,农机管理 体制不顺,机构编制不当、隶属关系不明、行业职责不清的状况,造成了职能部门运作困难, 作用难以发挥。
在国民经济保持高速增长,农业对整个国民经济的支撑作用日益增强,对农业机械化的 需求更加迫切,农业机械化要为农业的发展起到支撑和保障作用的大背景下,正确认识浙江 省现阶段农业机械化的发展水平和所处的发展阶段,努力提高农业机械化水平和农业综合生 产能力,实现农业增效农民增收,已成为现阶段发展农业机械化的重要使命。
5.2应用系统的可视化功能
5.2.1空间数据对属性数据的查询
大量的农机统计数据都具有空间属性,由于本系统将GIS集成到应用系统中,因而在 传统的农业机械化信息管理或决策支持系统的基础上形成可视化系统,从而能提供丰富的地 图数据,通过地理编码(Geocode)和创建点等手段,用相同字段能够方便地将属性数据绑 定到地图上,并且一一对应。绑定后的数据不再是单纯的表格属性数据,而是带有空间特性 的地图属性数据,与某一个空间数据相联系,可通过一定的方式表达在地图上。属性数据与 地图结合可以实现可视化查询。
在传统方式下,数据的查询过程通常是从表格到表格,需要对数据表中的记录进行定位, 然后再将其数据值取出,放到另一个数据表中;而可视化系统则以地图为背景,以属性数据 后台支持,实现了地图到数据库的查询,突破了传统数据库单纯的表格查询方式,更加形象 和直观地对数据进行表现。在可视化系统查询时,只需用查询工具点击地图上所关心的图斑, 便可査询出与图斑相对应的属性数据o
以可视化查询浙江省的有关农机信息查询为例,首先打开地理信息数据库,将地图在地 图窗口显示,并以“名称”进行标注;然后再将相应的农机属性数据库打开,通过两个数据 库中的共有字段“名称”实现数据库的连接,连接的具体步骤如图5-1所示。
诊;£ 々阿0I&&QQA, •丄gjgij
 
 
 
在实现地理数据库和农机属性数据库连接后,只需在应用系统的工具栏上选择“信息查 询”按钮,点击地图上某一县(市)的名称对应的区域,就可弹出相应信息窗口,并显示该 县(市)的有关农机属性信息。如点击“余姚”这一区域,则有关“余姚”的农机信息就显
示出来了,如图5-2所示。
cs「如(1)“ 诙iT冠五
屯旦 *"0疋陌 敛0 a | w b|ei
 
 
 
 
v.r i o 浙江大学生亦ti工程与食>a科学学欣
“ irnnr i—rmnw,・ mr*y w^Tmnwitrw
图5-2通过点击地图实现属性数据查询结果示意图
5.2.2农业机械化区域分类结果可视化
农业机械化系统是一个受自然、农业、社会经济和科技文化等因素影响的复杂系统。由 于自然资源、社会经济条件等方面存在差异,在同一时间内农业机械化的项目选择、发展速 度和规模水平不可能完全相同,必然呈现出地区之间的差异性,这种差异性导致了农业机械 化发展水平的区域性与不平衡性。因而农机管理部门通常需要对各地农业机械化发展水平进 行分类研究,这对因地制宜、分类指导,促进浙江省农业机械化发展是很有意义的。过去以 往将农业机械化发展的分类结果是以文字或纸制地图的形式进行描述的,这种分类结果表达 方式的不足就在于不能动态地反映农业机械化的发展变化。因此,若将GIS功能引入农业 机械化发展的分类研究工作,则能方便地反映农业机械化发展的时空特点。文献[1]中根据 有关分类模型,将浙江省69个县(市)的农业机械化水平分为4类,利用本系统的可视化 功能可将上述分类结果清楚地表达出来,如图5-3所示。
 
图5-3浙江省农业机械化发展水平分类结果示意图
此外,若将本系统用于农业机械化区划工作,则将克服传统区划中以手工作业为主的工 作方式,大大提高工作效率和效果,从而为有关农机区划工作提供了一种新的方法与手段。 相信随着数字浙江、数字中国的发展,本系统的可视化功能将将进一步得到展示。
 
5.3浙江省农业机械化水平的总体评价与地区比较
5.3.1浙江省农业机械化水平的总体评价
1.农业机械化发展水平评价
依据第二章中所建立的浙江省农业机械化发展水平评价指标体系及各指标的计算方
法,收集整理有关资料,并1990-2003年将有关统计数据输入系统(I】,经系统处理得到同 期各年的农业机械化发展水平的综合评价指标值,利用系统的图形功能,生成农业机械化水 平综合评价值的直方图如图5-4所示。
为了观察浙江省在1990〜2003期间影响农业机械化水平综合评价值的3个一级指标的 变化情况,利用系统的图形功能,生成3个一级指标的折线图,如图5-5所示。
 
2.结果分析
由图5-4可知,浙江省的农业机械化水平综合评价值在1990年仅为26.84%,到了 2003 年综合评价值上升到49.13%,期间增加了 22.29个百分点,年均递增1.59%。从图中还可以 看出,1990〜1995年期间,浙江省的农业机械化水平提高的速度很快,5年间综合水平评价 值提高了 14.27%,并在1995年步入了农业机械化发展的中级阶段(综合评价值为 40%〜70%)。其后农业机械化水平发展就开始进入一个增长速度较慢的时期,8年间综合水 平评价值仅提高了&02%o从3个一级指标值的变化情况可以看岀,由于政府出台了一些促 进农业机械化的政策,加大了农机投入,使得农机装备水平的改善,提高农业机械化作业的 综合保障能力,进而导致机械化作业水平有了较大幅度的提高,加之农机作业量的增大,使 得农业机械作业的取得了比较好的综合效益。在1995年以后,虽然农业机械化作业的综合 保障能力和作业水平提高的速度较快,但由于燃油价格上涨引起作业成本的增加和作业面积 的卜降使得农机作业的综合效益增加缓慢,其结果导致农业机械化综合水平增长速度的下 降。 '
5.3.2浙江省农业机械化水平的地区比较
对于浙江省各个不同地区来说,由于自然资源、社会经济条件等方面存在差异,在同一 时间内农业机械化的项目选择、发展速度和规模水平不可能完全相同,必然呈现岀地区之间 的差异性,这种差异性导致了农业机械化发展水平的区域性与不平衡性。因此,对全省各地 农业机械化发展水平进行比较研究,有利于因地制宜、分类指导,促进浙江省农业机械化的 发展。
1.各县市农业机械化水平评价指标值的计算
按照上述相同步骤,以浙江省目前69个县市为研究对象卩~叫收集整理有关资料,并将 各县市2003年的有关统计数据输入系统,经系统处理得到各项指标值,然后,再利用相应 的评价方法,测算岀2003年69个县市的3个一级指标和农业机械化水平综合评价值。
2.评价结果的地图化与空间分析
分析为了分析浙江省各县市的农业机械化发展水平及影响因素的空间分布规律,本文利 用系统中的GIS (地理信息系统)功能生成2003年浙江省69个县市的农业机械化发展水平 的范围专题地图和3个影响因素直方图专题地图,并将二者叠加,结果见图5-6,可以看岀 农业机械化发展水平及其影响因素的空间分布情况。
从图5-6可以看岀,农业机械化发展水平的空间总体分布情况是,位于西南的绝大多数 县市农机化水平较低,而经济发达的北部和东部地区的县市其农机化发展水平较高。造成发 展不平衡、差异大是由于目前农机投资的主体是农户,由于经济条件差,许多农户无力承担 —次性投资很大的农机投入,致使农机装备发展速度慢、水平低;另一方面与产业结构未能 合理调整,资源开发利用不够,农业劳动力占农村劳动力的比重大,劳动生产率低,劳动力 人均耕地面积小有关系,加之农机化社会服务体系的薄弱等方面的因素使得机械化作业项目 和作业量少,进而导致机械化作业程度、综合保障能力和机械作业综合效益较低,这些县市
 
 
为了进一步分析影响农业机械化发展水平诸因素的空间分布情况,生成农业机械化作业 程度范围专题地图和耕、播、收3个主要生产环节的机械化作业程度直方图专题地图,并将 二者叠加,结果见图5-7。
0◎缪3卿勿卿皱母毘谨遂翁曹礙話削牌够廖 做将的伽給淘解》■菸世y賛柳討気末彗烛”曹*绷吨和__❻
b 文件«)««a) tfcffl 規计査诲 数姑歼莎 xiwtip I* «□ a) _ e x
3 3 土‘血龙陌did A :・|E3面
 
 
从图5-7可以看出,机械化作业程度的空间总体分布情况与农业机械化发展水平空间分 布类似,即地处西南的县市机械化作业程度较低,一些县市只有少量的机耕和机械收获,而 机械播种几乎是空白;与西南的县市相比,北部和东部地区县市的农机化发展水平较高。导 致机械化作业程度差异大的主要原因一方面和这些县市地处山区丘陵,地块小、水田多,机 械化本身难度较大有关;另一方面,目前许多县市虽然单位耕地面积拥有的农机动力水平很 高,但拖拉机与机具的配套比太低,农业机械的利用率不高,致使耕、播、收机械化作业程 度较低。而农业机械化发展水平比较高的杭州、宁波、温州及其周边一些县市,机械耕地己 达到相当高的水平,机械收获发展较快,但存在机械播种发展速度慢、水平低的问题。
在上述各种专题地图中,若要对构成专题地图的要素进行修改,可通过调用系统“地图” 菜单中“修改专题图”功能模块完成修改,修改步骤如图5-8所示。
 
由于各地区农业机械化发展水平不同,社会经济和自然条件、农作物品种、种植制度存 在差异,对农业机械化的需求也有所不同。因此,要结合各地优势农产品布局,形成各具特 色的农业机械化区域,满足农民对农业机械化新技术及机具多样化和增加收入的需求,促进 地区农业机械化与地区经济的协调发展。
(1)经济发达地区、城市郊区的农机化发展已由过去量的增长进入更注重质的提高、 领域扩大和讲求效益的新阶段。农机化的领域从种植业向畜牧、水产、贮运、加工业迅速发 展。对农机化的要求不仅强调提高土地生产率,而且强调提高资源综合利用率、劳动生产率、 农产品商品率,以及改善环境和劳动条件。
(2) 对于经济欠发达与落后地区,要进一步调整产业结构和产品结构,发展经济,改 变农业生产以人畜力为主的局面,促进农业劳动力转移和土地的相对集中,努力提高收入, 逐步推进农村二、三产业发展和小城镇建设,为农业机械化的发展创造良好的环境条件。
(3) 把农机经营与农业经营分开,也就是把对农机化的需求和供给分离开,逐步形成 符合市场经济规律和靠发展农业机械化获取最大利润的专业化、社会化的农机服务产业,为 实现农机社会化服务。
5.4浙江省农业机械化发展的对策与建议
根据上述对浙江省农业机械化发展水平的总体评价和地区比较,结合浙江省建设高效 生态农业和社会经济发展的需求,现对浙江省的农业机械化发展的有关问题进行探讨,以期 为科学决策,促进浙江省农业机械化的发展提供依据。
5.4.1农业机械化发展技术路线的选择
在农业生产中,农业机械与农业劳动力二者之间具有明显的替代关系,即在土地面积一 定的情况下,增加机械投入数量,则必然要求减少农业劳动力数量,若不如此,则无法发挥 农业机械的作用与效率;另一方面,当劳动力相对土地显得稀缺时,将农业机械引入生产领 域,可以弥补因劳动力不足而产生的影响,此时农业机械的引入是弥补农业生产能力不足或 农业劳动力转移的结果,而不是农业劳动力剩余"5】。据统计,目前浙江省人均土地面积为 0.23hn?,不到全国平均水平的30%;2003年全省耕地面积为159.21万hn?,人均约o.O35hm2, 低于粮农组织(FAO)确定的人均耕地0.053hm2的世界耕地警戒线水平,在这样一个人多 地少、自然资源相对贫乏、且农业发展受气候和环境严重制约的地区发展现代化农业,必须 依靠农业机械等现代农业装备与技术的广泛应用。同时,据估计2005年底,浙江省农业劳 动力将有2180万人,其中剩余农业劳动力为400-450万人向。目前,我省的农业生产和经 济发展已进入了一个新的发展时期,客观上要求大力发展农业机械化。由于农业机械具有替 代农业劳动力的性质,农业机械化水平的不断提高必然对我省农业劳动力的剩余与转移产生 重要的影响。因而在发展农业机械化的同时,还要面临农业劳动力转移的巨大压力。因此, 在目前这种背景下,研究通过技术进步,发展农业机械化来提高农业综合生产能力的同时, 充分发挥我省农业劳动力资源优势,走出一条适合我省的农业机械化道路,就显得尤为重要。
1.依靠科技进步与发挥劳动力资源优势并举的农业机械化技术路线
改革开放以来,尽管浙江省的农机科研和农机制造业水平有了长足发展,但技术问题一 直是困扰和制约浙江省农业机械化发展的主要因素。因此,必须依靠科技进步,突破制约我 省农业机械化发展的技术"瓶颈”,大力发展农业机械化,进而发展农业和推进农业现代化。
从发达国家实现农业机械化过程来看,不同国家和地区选择了不同的发展途径和农业机 械化的实现方式。基本上可概括为三类⑺:一类是以美国、加拿大等国为代表,其特点是地 广人稀,农业发展的主要制约因素是劳动力不足,依靠技术进步和机械化提高劳动生产率是 其主攻方向;二类是日本、荷兰等国为代表,其主要特点是人多地少,劳动力资源丰富,农 业发展的主要制约因素是耕地不足,主攻方向是提高土地生产率,因而采取先生物化学技术 措施,后机械化措施;三是德国、法国,它们是介于上述两种情况之间,既缺乏足够的劳动 力,又缺乏足够的耕地,因而采取生物化学技术与机械技术并用的技术路线。发达国家的经 验可以提供参考和借鉴,但不能全盘照搬。
在我省目前的情况下,一方面,既要充分发挥技术创新和加大农业机械投入,大力发展 农业机械化,提高农业综合生产能力,提升农产品的品质和科技含量;另一方面,还要考虑 到我省劳动力资源的优势,以及农村经济发展带来的农业剩余劳动力的问题,而农业剩余劳 动力的大量转移在短期内不可能的。因此,要正确处理劳力转移与发展机械化关系,就必须 采取依靠科技进步与发挥劳动力资源优势并举的农业机械化技术路线。
2.大力发展农机服务产业
农机服务产业化是指伴随着农业产业化的发展,从传统农业生产经营中分离岀的一个 专门从事农业机械化服务的生产技术经营体,并逐步形成一个比较完善的服务体系和运行机 制的过程和结果吟它具有:降低生产成本,获取规模效益;提高农业综合生产能力;提 高农机服务管理水平;增加农民收入;节约资源、保护生态环境以及促进农村二、三产业发 展和城市化进程等基本功能卩铁根据农机服务产业化所涉及领域,其基本框架应该包括以 下三个方面⑴1:
(1)农机服务产业组织。其主要任务是为农业生产经营者提供机械化生产技术服务。 农机服务组织是产业化的基础,也推进农机服务产业化的关键和难点。因此,需要政府部门 制定相应的产业发展政策,同时采取有效的措施,培育、发展和壮大各种形式的农机服务产 业组织,进而提高其组织化程度、管理水平、专业化服务水平。
(2)农机服务产业化的保障体系。其主要任务是为农机经营者及所有者提供系列服务, 是实现农机服务产业化的物质支撑。它由农机装备与技术的示范推广、教育培训、信息咨询、 维修保障、产品质量鉴定、市场中介,以及农机产品、配件和燃料的供应等企事业单位组成。 将这些在计划经济时期的形成的服务体系转变为符合市场经济规律的行业是实现农机服务 产业化的另一难点。这一过程包含服务方式、运行机制的转换,以及服务内容的增加、领域 的扩大及和水平的提高等,因而需要建立相应激励和约束机制促进这一过程转变。
(3)农机服务产业化的外部环境。农机服务产业化作为农业产业化的重要组成部分, 其发展必然受到各种外部环境的制约。因此,需要政府职能部门对农业机械化发展进行全面 规划、实施宏观调控和法规管理的同时,转变管理方式和管理内容,即由过去的指令性计划 转变为指导性计划和政策性引导为主,由行政管理为主转变为政策调控、法规管理为主,以 适应当今农业生产和市场经济发展对农机服务的需求。
上述三个层次相互依存,缺一不可。没有农机服务组织,就没有分工和专业化;没有 保障体系的支撑,农机服务组织就无法顺利运行;没有良好的外部环境,就不能组织创新和 机制创新,也就无法实现健康发展。为此,政府部门应加强扶持和投入,并提供宏观指导。 从农机服务产业化的现状看,目前最薄弱环节是农机服务组织。因此,整合各种形式的小农 机,培育、发展、壮大一线农机服务产业组织,是当今农机服务产业化的关键。
农机服务产业化的发展,一方面为农业产业化提供技术支撑,为农副产品生产提供产 前、产中和产后一系列机械化技术服务;另一方面,由于农机服务产业化发展是以农业产业 化为经济前提,通过对农产品的生产、质量要求和增加农民收入两方面,提高农民对农机化 服务的市场需求和支付能力。因此,在新形势下,需要通过组织创新、管理制度创新和运行 机制的创新,改变目前我省农机分散经营、低水平重复购置的现状,及时有效地将行业资源 优势转变为经济优势,进而促进农业机械化的发展。
发达国家农业发展的实践业己证明,发展农业社会化服务体系是克服家庭经营局限性的 有效途径。因而要化解机械化大生产与我省小规模的农业家庭经营体制之间的农业生产方式 基本矛盾,必须大力推进农机服务产业化,从而在家庭联产承包责任制基础上,使机械化大 生产和以农户为单位的经营方式相适应。此外,在农机服务产业化进程中还能为农村劳动力 提供许多新的就业机会。例如,20世纪80年代在美国农业生产领域的工人仅占全部就业者 的3%,但在农业社会化服务为主体的就业人数约占全部就业人数的20%,而产值约占国内 生产总值的16. 7%o因此,发展农机服务产业化,不仅能充分发挥农业机械在农业生产中的 作用,降低生产成本;还能稳定农村家庭联产承包经营体制,为促进农业和农村经济结构调 整,增加农民收入,实现农业可持续发展,加速传统农业向现代农业转变提供技术支撑。
综上所述,可以看出在农业劳动力资源极其丰富,而土地资源短缺的浙江省,完全借鉴 已实现农业机械化国家的经验是不行的。因此,要从我省实际情况出发,探索出一条适合我 省省情的农业机械化技术路线,这就是采取依靠技术进步与发挥劳动力优势资源并举的农业 机械化技术路线的同时,大力发展农机服务产业,是当今我省发展农业机械化的现实选择。
5.4.2农业机械化服务组织、管理制度和运行机制的联合创新
良好的管理体制和运行机制是实现农业机械化健康发展的保证,与农业机械装备和技术 创新相比,农业机械化发展制度创新的空间显得更为广阔【⑼。因此,加强农机服务组织、 管理制度和运行机制的创新,将会给农业机械化发展提供一个良好的外部环境。
1.农机服务组织创新
目前浙江省的农业生产已进入一个新阶段,由于农业相对于其他行业经济效益较低,加 之我省乡镇工业的发展,致使农业生产过程中劳动力缺乏,农户迫切希望从各种中介服务组 织获得帮助,以适应农业生产中各项作业的要求。因此,在新形势下,就出现了各种形式的 农业机械化服务组织,以满足农民生产对作业的需求。
目前农业机械化组织有服务组织和中介组织,农业机械化服务组织主要包括乡镇农机服 务站、各级农机推广站和农业技术服务中心等组成,而中介组织主要有农机服务协会和各级 农机信息中心等。随着农业机械化事业的发展,在农业机械化领域相继出现了 “农机服务公 司+农户”、“农机股份合作组织+农户”、“农机专业户+农户”等农机服务产业化经营组织形 式UI5],显示了农机服务组织创新的趋向。现行农业机械化组织机构特点决定了农业机械 化组织的发展,一方面,农业机械化组织的发展除受组织本身影响;另一方面,也离不开乡 镇农机服务站、各级农机推广站等原有组织体系的体制转变,以及政府管理体制的界定和规 范,其发展必然受二者影响。因此,需要农业机械化组织进行自身改革和建设以及组织创新, 以摆脱传统体制残余所带来的影响。这表明农业机械化服务组织的创新与体制变革是紧密联 系的,组织创新的滞后将影响体制转变和发展,而体制的变革将进一步促进组织的创新。
合作制在世界上已经有一百多年的历史,在发达国家和地区早已成为农民联合经营、 自我服务的成功组织方式,其自愿联合、民主经营的基本原则,与既可共享联合的优势,又 不改变产权归属的制度特征,是其生命力经久不衰的根本所在。根据目前国内己出现的农机 服务经营模式和我省当前农村的实际情况,股份制合作社、专业合作协会等,将很有可能成 为我省农机服务产业的主要组织方式t,6~,71»目前我省农机经营户规模超小,决定了农机经 营户在市场经济条件下更需要联合起来,以应对农机经营过程中出现的各种风险。近年来, 在我省农机部门组织一系列的农机跨区作业中,由于其丰厚利润的驱动,使农机所有者和经 营者要求联合起来的愿望越来越强烈,自发组建农机服务合作社和要求农机部门组织他们联 合经营的情况越来越多,尽管目前这些组织还不够规范,组织化程度和专业化水平也不高。 另外,虽然目前农机户联合的形式多样,管理经营方式也不尽相同,但各种联合组织的一个 共同点就是产权不变。由此可以推测,合作制、股份合作制将因为能够满足农机经营者的基 本要求而成为我省农机服务产业组织的现实选择。同时,虽然农机服务产业化已经自发地以 多种形式表现出其分工、专业化的强劲趋势和联合发展的生命活力,但要在传统的农机服务 体系处于改革和转型的今天,要使分散经营的农机经营户联合起来,走合作经营的道路,形 成一个机制灵活、配置合理、规模适度、作业高效的农机服务产业,则需要一个较长的发展 过程。因此在这个过程中,一方面需要农机管理部门配合有关政府部门在调直研究和分析我 省农机产业组织现状的基础上,制定农机服务产业长远总体发展规划;同时,还要出台相应 的政策,并制定和完善农机社会化服务法规,引导农机服务产业的健康稳定发展。
2.管理制度创新
农机服务产业的发展,一方面有自身的发展规律;另一方面又受到外部环境的制约。 农机服务组织的功能能否得到充分发挥,在一定程度上取决于管理体制健全与否。为此,需 要政府部门从战略高度明确发展农机服务产业化在农业生产中的重要地位。另外,与其它产 业相比,农业是一个弱势产业,其比较经济效益较低,这也必然导致农机服务产业经济效益 较低,并在市场竞争中易处于劣势。因此,农机管理部门应配合有关政府部门,并根据已颁 布的农业机械化促进法,对农机服务产业化的发展应有一个长远规划,在加强宏观调控同时, 出台各种有利于农业机械化发展的优惠政策和扶持政策,使农机经营者的合法权益得到充分 保障,实现农机服务产业化的健康发展。
3.运行机制创新
(1) 以产业化的要求培育农机服务产业。综观当今发达国家的农业发展,可以发现农 业生产产业化、企业化经营是当今农业发展的必然趋势,作为支撑农业发展的物质基础和技 术手段的农业机械化,应顺应这种发展趋势。一方面,以发展农业产业化为契机,加速农机 化服务产业化进程,并通过推进农机产业化延伸农业产业链;另一方面,要按市场经济规律 的来组织农机经营,实现农机服务经济效益的提高,进而壮大农机服务产业。
(2) 以社会化的思路完善农业机械化的投入机制。投入是决定农机服务产业发展的重 要条件,为此,政府部门应出台相应的扶持政策,努力构建一个以国家资金为导向,集体、 个人投入为主体,各级财政、金融部门齐支持,多层次、多渠道的投入机制。该机制主要特 点:一是能有效保证农业机械化投资的增长,实现投资的合理补偿与增值,并能充分调动各 投资主体增加投资的积极性;二是各投资主体的职责明确,保证有多渠道、多形式的资金投 向农业机械化。
(3) 以专业化的服务水平提升农机服务产业层次。服务专业化是农机服务产业化的一 个主要特征,服务专业化的内容应包括服务组织、服务项目、服务人员等方面的专业化。通 过专业化来提高农机化服务水平,以满足农户在农业生产中所需各项农机作业要求。
5.4.3促进农业机械化发展的政策建议
虽然近年来浙江省农业机械化有了较快的发展,但与发达地区和国家存在较大差距,尤 其是长期以来制约农业生产的一些薄弱环节并没有得到根本解决,无法适应社会经济发展和 农业现代化进程对农业的要求。因而迫切需要政府部门一方面要积极营造良好的政策环境, 同时加大对农业机械化发展的扶持力度。从国外已经实现农业现代化国家的发展过程看,在 基本实现农业机械化和加快工业化发展时期,是政府加大农业机械化投入的关键时期。因此, 依照WTO农业协议给予农业机械化发展的政策空间,结合浙江省农业机械化的实际,并借 鉴国外发展农业机械化的经验,对促进浙江省农业机械化发展提出如下政策建议【皿20):
1.加快和完善农业机械化政策法规建设
WTO主要成员国在基本实现农业机械化前后,都普遍采取了加强法律法规建设,实行 经济调控等通行做法,推进农业机械化的发展。为此,要借鉴发达国家农业机械化管理的经 验,依据市场经济原则,按照《中华人民共和国农业机械化促进法》,结合浙江省的农业机 械化发展实际,完善配套措施和保障手段,建立健全浙江省地方性的农业机械化行业宏观管 理的政策法规体系,将农业机械化的发展纳入依法管理的轨道。因此,在完善现行《浙江省 农业机械管理办法》的基础上,争取早日出台《浙江省农业机械管理条例》、《浙江省农业机 械安全监督管理办法》、《浙江省机耕路管理办法》和《浙江省农机事故管理办法》等地方性 法规,为农业生产营造良好的安全生产环境。此外,还应加强农业机械化标准体系建设、农 业机械质量监督体系建设,提高政府对农业机械产品标准、作业质量标准的管理水平,提高 农业机械化标准实施单位的执行能力。
2.加大对农业机械化科技的投入力度
科技进步和技术创新是加速农业机械化发展的决定性因素。因此,一方面要增大农机科 技发展的投入;另一方面,通过农业科技体制的改革、政策扶持和科技创新平台的建设,逐 步建立起以龙头企业为主体,产、学、研相结合的农业机械化科技创新体系。以科技创新平 台为依托,对当前浙江省农业生产中急需的粮食和经济作物机械化生产、收获装备,农产品 检测和产地商品化处理装备,种子加工与处理装备,高效、低毒、低残留果园植保机械化技 术与设备,以及畜牧养殖等废弃物处理装备与技术等关键技术与装备进行攻关、示范和推广, 从而解决制约浙江省农业发展的农业机械新装备和新技术科研开发总体滞后,不能满足农业 结构调整需求等问题。
3.实施农业机械购置专项补贴政策
鉴于我省农民在农机方面投资能力有限的现实,从当前浙江省建设高效生态农业利结构 调整的需要出发,在充分发挥农户主体和各类农业机械服务组织作用的基础上,一方面鼓励 和调动农民购置和使用农业机械的积极性,对促进农业结构调整、农业资源保护、节本增效 的新型、高效的农机产品,以及属于推广的农机新技术,通过农机管理部门应给予一定的资 金补贴;另一方面,积极推进机械化田间作业的标准化、规模化和专业化,对农业机械作业 继续执行免税政策,对标准化、规模化机械作业实行一定的补贴政策,充分发挥农业机械在 农业生产中的作用,进而增强和扩大农机组织的服务功能和服务领域。
4.实施农用燃油补贴政策,降低农机作业成本
由于燃油在农机作业过程中占有很大比重,为了降低农业机械作业和农业生产成本,减 轻农民负担,需要对农用燃油实行减免税和价格补贴,这也是WTO成员国政府通过生产资 料补贴给农民提供的间接性收入支持。因此,在费改税的过程中,应充分考虑对农用燃油征 收燃油的问题,按照WTO主要成员国对农业燃油实行减税、补贴的惯例,我省应尽早实施 农用燃料补贴政策,采取部门转移支付的方式,由农业机械管理部门实施田间作业燃油补贴, 补贴对象以农业机械经营者为主。通过燃油补贴的形式来降低生产成本,调动农民使用农业 机械的积极性,进而促进农业机械化的健康发展。
5.引导建立各种形式的农机服务组织,加强农机人员素质培训
一方面,利用政府补贴、部分出资和提供优惠贷款等优惠政策,积极引导不同经济成份、 多种经营形式的农业机械化服务中介组织,并以股份、合作等形式将农机户组织起来,形成 利益共享、风险共担的经营组织,实现农机服务模式和运行机制的创新,增强农机服务组织 的功能,扩大服务领域和规模;另一方面,农机管理部门要充分利用现有的农业机械化培训 体系,通过加强培训教学基础设施的投入,完善培训手段和设施,增强培训能力,提高办学 效益;同时,做好基层农业机械管理人员岗位培训和继续教育,提高农机管理人员素质,建 立有效的竞争机制,逐步推广专业人员岗位考核和持证上岗制度;釆取多种措施,分期分批 对机手和农机经营户进行职业教育和技术培训,为农业机械化的技术推广创造条件。
6.开展国际交流与合作,促进农业机械化发展的对外开放
在我国已加入WTO的今天,发展农业机械化必须加强与外国政府和企业间的农业机械 化合作与交流。一方面加强农业机械标准化、质量监督等领域的交流,借鉴国外经验,逐步 建立完善的农业机械化标准体系和质量监督体系;另一方面扩大有竞争优势的农业机械化装 备与技术在国际农机产品市场上的份额,积极引导有条件的省内农机企业在境外投资办企 业,进一步开拓农机产品的国际市场。此外,进一步扩大利用外资规模,对进入浙江省的国 内外先进农机企业,依照国际惯例,政府应在土地租赁、劳动用工和税收政策等方面予以支 持。同时鼓励科技型农机龙头企业利用国内外资金、技术,建立合作企业,促进农业机械产 品质量的提高和农业机械化技术的应用范围,加速我省农业机械化的发展进程。
5.5本章小结
(1) 根据1990-2003年的统计数据,应用系统中的评价模型对浙江省农业机械化发展 水平进行了评估,并对历年的评价结果以直方图的形式进行了显示,通过图表能清楚了解近 年来浙江省农业机械化水平的发展变化。另外,利用2003年统计数据,对浙江省69个县市 的农业机械化发展水平进行了综合评价,并结合应用系统中GIS空间可视化功能,生成了 相应的专题地图,据此分析了浙江省农业机械化发展水平及其影响因素的空间分布规律。
(2) 根据浙江省农业机械化发展水平的评价结果,结合新阶段浙江省农业发展的需求, 应采取依靠技术进步与发挥劳动力资源优势相结合以及大力发展农机服务产业化的农业机 械化技术路线,并加强农业机械化服务组织、管理体制和运作机制联合创新的发展思路。
(3) 在促进浙江省农业机械化发展的政策建议上,应从加快和完善农业机械化政策法 规建设,加大对农业机械化科技的投入力度,实施农业机械购置专项补贴政策,实施农用燃 油补贴政策,降低农机用油成本,引导建立各种形式的农机服务组织、加强农机人员素质培 训以及开展国际交流与合作和促进农业机械化发展的对外开放等几个方面着手。
参考文献
[1] 何勇,谈黎虹,葛晓锋.基于GIS的农机化发展水平区域划分系统的研究[J].农业工程 学报,2003 ,5.19(3): 129-131.
[2] 浙江农业机械管理局.浙江省农机管理统计报表[Z]. 19弘2004.
[3] 浙江省统计局.浙江统计年鉴北京:中国统计出版社,2003.
[4] 万鹤群.农村经济结构调整与农业机械化优化[M].北京:北京科学技术出版社,1992.
[5] 张冬平,史国栋,陈俊国.农业机械化对农业剩余劳动力的影响[J].农业机械学报,1996,
27 (4) :1~6.
[6] 杨大海.浙江省农村劳动力转移和就业问题研究[D].中共中央党校在职研究生毕业论
文.2004,5.
[7] 戴有忠.农业机械化工程[M].哈尔滨:东北农业大学岀版社.1996.
[8] 许锦英.发展农机服务产业,加速农业现代化进程[J].中国农机化,1999 (5) :10~15.
[9] 陈乐萍.推进农机服务产业化是实现农业机械化的加速器[J].农业机械学报.1999, 30
(6) :139-140.
[10] 古茂华.农机服务产业化是实现农机化的保证.现代农业装备[J].现代农业装备.2003 (3) :62~65.
[11] 杨敏丽.中国农业机械化与农业国际竞争力[M].北京:中国农业科学技术岀版社. 2003.
[12] 许锦英,卢进.农机服务产业化与我国农业生产方式的变革[J].农业技术经济,2000(2) 60-64.
[13] 白丽,李行,马成林.农业机械化主要制约因素的制度创新研究[J].农机化研究.2005,
(1): 34-37.
[14] 王智才.建设现代农业,加速推进农业机械化[J].农业机械学报.2004, 35(1): 154-15&
[15] 李志杰,李明.发展农机经济合作组织,推进农机服务产业化卩].科技推广.2004 (9): 32 〜33.
[16] 许锦英.股份合作制与加速我国农业现代化进程[J]•农业现代化研究,1999,20 (3):144-147.
[17] 许锦英.关于我国农业机械化发展制度与发展观的思考[J].山东农机,2003 (3) :3~5,
[18] 田志宏.加入WTO后我国农机化发展所面临的机遇、挑战及对策[Z].农业机械化软科 学研究成果汇编,2001.
[19] 杨敏丽,涂志强,沈广树.国外农业机械化法规及支持政策[J].中国农机化:2005, 2:3-6.
[20] 郑文钟,应霞芳,何勇.浙江省农业机械化发展的系统分析[几浙江大学学报(农业与 生命科学版)2003, 29 ( 2) :147~151,
【本文地址:https://www.xueshulunwenwang.com//jiaoyulei/xiaoxueyuwen/8184.html

上一篇:农业机械土槽测控系统的设计研究

下一篇:农业机械化在兵团农业生产中的贡献率研究 及程序开发

相关标签: