基于主成分分析法的扬州城市生态系统评价(9篇)
1.基于主成分分析法的扬州城市生态系统评价 篇一
基于主成分分析的原水水质模糊综合评价
摘要:以西安市某地表水厂原水水质监测资料为研究对象,采用主成分分析法筛选出化学需氧量、高锰酸盐指数、氨氮、总氮和总磷为主要评价因子,通过模糊评价法对原水水质状况进行了评价.结果表明:该地表水厂原水水质为Ⅰ类,水质状况良好,但总氮略有超标,可能成为未来影响水厂处理工艺的主要因素;污染物浓度超标加权法过度强调了某一水质因子的作用,忽视了其他水质指标信息,不适用于考虑总体因素的`水质评价;折减系数法充分考虑了水质状况与水厂工艺的净水能力,使得评价结果更为客观,在地表水厂原水水质评价中具有较好的应用效果.作 者:韩晓刚 黄廷林 陈秀珍 作者单位:西安建筑科技大学,环境与市政工程学院,陕西,西安,710055期 刊:人民黄河 PKU Journal:YELLOW RIVER年,卷(期):,32(9)分类号:X824关键词:原水 水质评价 主成分分析 模糊评价 权重
2.基于主成分分析法的扬州城市生态系统评价 篇二
生态安全是区域内生态系统能够维持自身结构稳定, 发挥正常功能, 并满足人类生存与社会经济可持续发展的状态[2,3,4]。生态安全主要指生态系统两个方面的稳定:一方面是生物种类的组成和数量比例相对稳定;另一方面是土地系统, 即非生物环境保持相对稳定。土地生态安全是指陆地表层由各种有机物和无机物构成的土地生态系统的结构不受破坏, 同时土地生态系统为人类提供服务的质量和数量能够持续满足人类生存和发展的需要。
随着工业化和城市化的飞速发展, 人地矛盾日益突出, 土地利用强度不断增加, 导致土地生态问题日益突出, 给我国的土地生态系统带来了巨大压力, 土地生态问题和土地生态安全也引起了人们的关注个和重视[5]。本文利用SPSS软件中的主成分分析方法, 构建了两当县土地生态安全评价指标体系, 对两当县土地生态安全进行评价, 以期为两当县土地资源的可持续利用提供理论基础。
1 研究区概况
两当县位于甘肃省东南部, 陇南市东北部, 属长江上游嘉陵江水系。地处东经106°12′-106°34′, 北纬33°30′-34°15′之间, 北靠天水, 西邻徽县, 东面与陕西宝鸡凤县相连, 南面与汉中留坝县相连。为陕、甘、川三省交通要道, 素有“秦陇门户”、“巴蜀噤喉”之称, 是甘肃省打通四川、陕西经济通道的重要战略节点。两当县属半旱落叶阔叶林褐色土地带, 主要土类有褐色土、山地棕壤、淀土、新积土、暗色草甸土、潮土、红粘土7大类, 地势南北高, 中部低, 呈马蹄形, 平均海拔约1400m, 最高海拔2738m, 最低海拔773m。
两当县辖3镇9乡 (城关镇、站儿巷镇、西坡镇、杨店乡、左家乡、显龙乡、鱼池乡、兴化乡、张家乡、云屏乡、泰山乡、金洞乡) , 118个行政村, 4个社区。2013年总人口49587人 (其中农村人口36817人) , 有汉、回、蒙、藏、苗、彝、壮、满、侗、朝鲜、维吾尔族等11个民族。旅游景点主要有“两当兵变纪念馆”、“云屏三峡自然风景区”、“灵官峡张果老登真洞”等。
2 评价方法
2.1 主成分分析法的定义[6,7]
主成分分析法 (简称PCA法) , 是霍特林于1933年首先提出来的, 是利用降维的思想, 以损失最少信息为前提, 把原来众多具有一定相关性的指标, 重新组合成为一组新的互不相关的综合指标 (称为主成分, 是每个原始变量的线性组合) , 来代替原来指标的一种多元统计方法。主成分分析法的优势在于研究复杂问题时只需考虑少数几个主成分而不至于损失太多的信息, 且更容易抓住问题的主要矛盾, 揭示事物内部变量间规律, 使问题简单化, 提高分析问题的效率。
2.2 主成分分析法的数学模型[8,9]
其中, 为X的协方差阵Σ的特征值多对应的特征向量, ZX1, ZX2, ……, ZXP是原始变量经过标准化处理的值。
2.3 主成分分析法步骤[10,11,12,13,14,15,16,17,18,19]
1) 选取指标与数据。
2) 进行指标数据标准化, 进行指标无量纲化处理。
3) 判断指标之间的相关性, 确定原始变量是否适合进行因子分析。
4) 依据以下原则:第一, 特征根△>1;第二, 累积百分比达到80%-85%以上的△值对应的主成分;第三, 根据特征根变化的突变点决定主成分的数量, 确定主成分数量。
5) 对主成分Fi进行命名。
6) 计算综合主成分分值。
综合主成分分指计算公式见公式 (1) 。
式中:X表示特征值的特征向量;a、b等是原始指标标准化数据。
3 两当县土地生态安全评价
3.1 选取指标与数据
根据生态安全评价指标选取原则:科学性、可操作性、可比性、简洁性等[20], 选择了人口密度、人口自然增长率、城镇化率、人均GDP、人均耕地面积、森林覆盖率、工业三废综合处理率、农民人均纯收入、经济密度、有效灌溉面积、人均粮食产量、工业废水COD排放量、生活污水COD排放量这十三项指标进行两当县土地生态安全评价。
3.2 指标标准化处理
本文数据主要来源于《2013年两当县统计年鉴》, 因各个指标的单位不同, 所以对其进行标准化处理, 也称无量纲化。
在主成分分析时, SPSS19.0软件会对原始数据进行标准化处理, 所以得到的变量都是经过标准化处理后的变量。但SPSS19.0并不直接给出标准化后的数据, 如需要得到标准化数据, 则需要调用SPSS19.0软件的“描述统计”工具进行计算。两当县土地生态安全评价指标标准化值见表1。
3.3 相关系数矩阵计算
计算原始指标之间的相关性, 确定原始变量是否适合进行因子分析。计算结果见表2。
表2表示的是各指标之间的相关性, 两指标之间联系系数的绝对值越大, 则这两指标之间的联系越紧密[21]。
3.4 确定指标特征值与贡献率
确定指标特征值与贡献率, 确定主成分因子, 并对主成分Fi进行命名。利用SPSS19.0软件, 对已经标准化的指标数据进行主成分分析, 通过分析指标之间的关系, 去除那些没有明显分异作用的或互相间存在明显线性关系的指标, 得到主成分因子, 见表3。
由表3可以看出, 前四项的累计值为90.865%, 超过了80%, 所以将前四项作为两当县基于主成分分析的土地生态安全评价的主成分因子。由SPSS软件直接计算得到这四个因子对于原始指标的载荷状况, 结果见表4。
由表4可以看出, 生活污水COD排放量、人口密度、经济密度、有效灌溉面积、农民人均纯收入、人口自然增长率、工业废水COD排放量、工业三废综合处理率在主成分1中的作用明显, 而人均粮食产量、人均耕地面积、人均GDP、森林覆盖率、城镇化率等影响相对较弱, 这说明人口的变化和工业的发展对土地资源的威胁是比较突出的;生活污水COD排放量、人均耕地面积、人口自然增长率、森林覆盖率、工业废水COD排放量、工业三废综合处理率、城镇化率对主成分2的影响较大, 而人口密度、经济密度、有效灌溉面积、农民人均纯收入、人均粮食产量、人均GDP对主成分2的影响较小, 说明城市化水平的提高对两当县的环境压力比较大;生活污水COD排放量、人口密度、经济密度、有效灌溉面积、人均粮食产量、人均耕地面积、人均GDP、工业废水COD排放量、工业三废综合处理率对主成分的影响大, 农民人均纯收入、森林覆盖率、城镇化率对主成分3的影响较小, 说明减少生活污水COD排放量对提高土地生态安全有作用;人均GDP、人口自然增长率、森林覆盖率、工业废水COD排放量对主成分4的影响较大。得到主成分对原始指标的载荷状况, 见表5。
3.4 计算综合主成分分值
根据计算得到的标准化数据和表4-5, 结合公式 (1) , 计算得到两当县土地生态安全评价四个主成分对应的分值, 见表6。
根据四个主成分分别对应的分值, 以每个主成分所占四个主成分综合的比重作为权重, 计算得到两当县土地生态安全评价主成分分析综合得分值及排名, 见表7。
4 结果分析
如果综合得分为正, 表明该主成分在平均发展水平之上, 且得分较高, 说明生态安全越好;反之, 综合得分为负, 表明该主成分在平均发展水平之下, 得分越低, 说明生态安全越差[22]。
由表7可以看出, 两当县土地生态安全得分由大到小的顺序是:城关镇、鱼池乡、显龙乡、兴化乡、站儿巷镇、杨店乡、金洞乡、西坡镇、泰山乡、云屏乡、左家乡、张家乡。其中, 城关镇、显龙乡、鱼池乡和兴化乡的土地生态安全评价得分为正值, 说明这四个乡镇的土地生态安全评价在两当县平均发展水平之上, 且城关镇的得分最高, 分值为1.9259, 相比其他乡镇其土地生态安全状况较好;杨店乡、左家乡、站儿巷镇、西坡镇、张家乡、云屏乡、泰山乡和金洞乡的土地生态安全评价得分为负值, 表明这八个乡镇的土地生态安全评价得分在平均发展水平之下, 且张家乡的得分最低, 分值为-0.5781, 其土地生态安全状况较差。
摘要:文章选择了人口密度、人口自然增长率、城镇化率、人均GDP、人均耕地面积、森林覆盖率、工业三废综合处理率、农民人均纯收入、经济密度、有效灌溉面积、人均粮食产量、工业废水COD排放量、生活污水COD排放量这十三个指标, 利用SPSS软件中的主成分分析方法, 对两当县的土地生态安全进行评价。结果表明:两当县土地生态安全得分由大到小的顺序是:城关镇、鱼池乡、显龙乡、兴化乡、站儿巷镇、杨店乡、金洞乡、西坡镇、泰山乡、云屏乡、左家乡、张家乡。
3.基于主成分分析法的扬州城市生态系统评价 篇三
关键词 橡胶树 ;适宜性 ;种植 ;主成分分析
分类号 S794.1
Abstract This paper selects the soil and climate resources, according to the previous research results and the expertise to determine the evaluation factor. Use the fuzzy mathematical method to quantify the evaluation factors, and then evaluated the planting suitability of rubber in Danzhou City by the method of principal component analysis. The results showed that the most suitable area for rubber planting is 43 029.58 ha, accounting for 14.99 % of the total agricultural land in Danzhou City; the suitable area for planting is 57 770.90 ha, accounting for 20.12 %; the less suitable area for planting is 40 934.9 ha, accounting for 14.26 %. The evaluation results not only bring the maximum benefit of the rubber at the macro, but also provide a reference for the zoning of the rubber plantations in Danzhou City.
Keywords rubber tree ; suitability ; planting ; principal component analysis
橡胶是关乎国计民生和国防安全的重要战略物资,是四大工业原料中唯一可再生的资源[1]。海南省是我国最大的天然橡胶生产基地,橡胶产业不仅是海南农民的重要经济来源,也是海南省的基础产业、支柱产业和优势产业[2]。随着我国人民的生活水平日益提高以及经济全球化和区域经济一体化,人们对天然橡胶的需求随之增加。面临国际市场的竞争,如何在有限的土地上将橡胶的效益最大化,且最大限度地保护土壤资源、挖掘农业资源的潜力,已成为橡胶生产管理部门迫切需要解决的问题[3]。虽然近年来海南橡胶种植的发展势头良好,但是在橡胶种植生产中还存在着一些问题:有些农户仍然过着靠天吃饭的日子或者凭着经验从事橡胶生产,有些农户由于文化素质较低而大量的施肥以片面地追求产量。这些生产模式并非是最好的,还忽略了生态效益;再有儋州市的橡胶实际种植面积及产量位居海南省(农垦除外)第一,但是平均产量却位居全省第六[4]。为了实现橡胶产量的提高,且在不增加种植面积的情况下,增加橡胶的总产量,这就要求逐步提高橡胶的单产。因此,因地制宜地种植橡胶已成为海南橡胶种植管理的热点。
鉴于上述原因,本研究针对海南省儋州市的橡胶种植进行了适宜性分析评价,以提高橡胶的单产,实现橡胶生产的经济效益最大化,增加农民的收入。通过橡胶种植的适宜性评价为橡胶种植区划作出理论依据,为农业管理者提供科学准确的区划参考。
1 材料与方法
1.1 材料
儋州市位于海南岛的西北部,是海南省土地面积最大、人口最多的市(县级市),它濒临北部湾,地处东经108°56′~109°46′,北纬19°11′~19°52′,是海南西部的经济、交通、通信和文化中心。儋州市陆地面积3 265 km2,人口106.86万(2010年底)[4]。由于地处东亚大陆季风气候的南缘,属热带季风气候。年平均气温23.3℃,年平均日照时数在2 000 h以上,西部沿海日照达2 500 h左右;降雨量充沛:全市各地降雨量为900~2 500 mm/a,平均降雨量为1 800 mm/a;全市全年雨量分布不均,冬春季节雨量稀少,夏秋季节雨量充沛。全市地表年径流量达到189亿m3。全市全年水热资源丰富,适宜多种农作物生长繁殖。2010年全市热带作物面积46 646 hm2,其中橡胶种植面积45 605.07 hm2[4]。
空间数据:1∶50 000儋州市行政区界图、土壤类型图、土地利用现状图、数字高程模型等;
文本数据:儋州市气象统计数据、儋州市“测土配方施肥”项目的采样调查分析结果,包括采样点坐标、基本情况、土壤农化分析数据,以及儋州市其他相关资料与数据。
1.2 数据处理方法
数据处理软件:SPSS 统计分析软件、GIS 地理信息系统软件。
2 结果与分析
2.1 基于主成分方法的橡胶种植适宜性评价
2.1.1 评价单元的划分
评价单元是橡胶种植适宜性评价的最基本单元,本研究的评价单元划分采用土壤图、土地利用现状图、行政区划图叠置构成。相同的土壤类型、土地利用现状及行政区划组成一个评价单元,以便于评价结果的应用。其中土壤类型划分到土属,土地利用现状提取农用地,行政区划划分到行政村。通过叠加分析处理后得到儋州市的11 761个评价单元。
nlc202309011624
2.1.2 评价指标的选取及量化
参评的指标主要分为两类:一类是连续型指标(即定量化的指标),包括土壤养分值、土层厚度、容重、风速、降雨量等;一类是离散型指标(即定性、概念型指标),包括质地,成土母质、剖面构型等。由于参评指标不能够简洁地表明该因素对橡胶适宜性影响的大小,所以本研究采用“隶属度”来界定[5]。
2.1.2.1 隶属函数
由于参评的指标是渐变的,固本文采用模糊数学的方法来建立隶属函数。根据前人的研究经验和数学原理来建立函数,为了避免计算时零值过多,隶属函数定为0.1~1.0,最大值1.0表示该指标完全适合作物生长,最低值0.1表示该指标不利于作物生长。建立相应的函数模型[6-8]:
2.1.2.2 指标的选择以及指标临界值的确定
根据橡胶正常生长对环境条件的相关研究,结合专家经验法和理论分析,确定各评价因子的隶属函数的临界值和阈值及散点型函数的隶属度[9-13]。如表1。
2.1.3 评价因子属性数据库建立
利用儋州市各气象站点的空间位置(纬度、经度)及其观测的数据,建立风速、年降水量数据库。采用反距离权重插值模型对气候要素数据进行模拟空间处理,建立风速、年降水量等栅格空间数据库。利用儋州市DEM模型,借助GIS 相关模块自动生成坡度、坡向、海拔高度等地形因子栅格空间及其属性数据库。利用土壤普查、测土配方施肥调查样点的资料和DEM模型,建立调查样点及其相关属性数据库。采用克里格插值法生成儋州市土壤耕层有机质、有效磷、速效钾等栅格数据库;利用ArcGIS进行区域统计,作为评价单元相关因子的属性数据。
2.1.4 主成分分析的计算步骤
(1)各量化指标数据标准化
将采集p维随机向量x=(x1,x2,...,xp)T)n个样品
xi=(xi1,xi2,...,xipT ,i=1,2,…,n,n>p,构造成样本阵,接着对样本阵元进行标准化转换;如下:zij=,i=1,2,…,n;j=1,2,…,p;其中=≥, 得到标准化阵Z。
(2)按照公式R=|Tij|pxp=;其中,rij=,i,j=1,2,…,p;求标准化阵Z的相关系数,并构造相关系数矩阵R。
(3)计算出样本的相关系数矩阵R的特征方程|R-λIp|=0得m个特征根,确定主成分的个数。按≥0.85确定所需的m值,使信息的利用率达85%以上,对每个λj,j=1,2,...,m,解方程组Rb=λjb得单位特征向量b0j。
(4)根据Uij=ZTiB0j,j=1,2,...,m;其中:U1为第一主成分;U2为第二主成分;…,Up为第p主成分。计算各个主成分的得分。
(5)对求得的m个主成分分别进行评价,得到m个主成分的评价分值。再将每个主成分的评价分值与每个主成分的方差贡献率(即权重)相乘累加,计算评价的综合得分。
2.1.5 评价结果
根据指标的临界值和阈值及散点型函数的隶属度,将指标全部通过隶属函数量化于同一水平上。然后利用数据分析软件SPSS16.0和Excel完成主成分分析的相关计算。得到橡胶主成分分析对应的特征根、贡献率及其累计方差贡献率(表2)。
从表2可以看出,当m=8时,累计方差贡献率85.207%>85%,因此可以利用前8个主成分代替原变量进行分析[14]。从表2可知,橡胶的8个主成分与全部的14个指标的线性关系公式为:
根据评价函数模型,将评价单元数据代入上述公式中,计算每个评价单元的综合F值。将所有评价单元的综合得分F作累积频率曲线,并把频率曲线的拐点作为相邻等级的临界值[15]。以最适宜、适宜、次适宜和不适宜对橡胶适宜性综合指数进行归类,从而对适宜性进行定性评价。橡胶的适宜性划分标准见表3。
在橡胶种植适宜性综合指数划分基础上,遵循种植区集中连片且顾及行政区划界线等原则,结合海南限制橡胶生长的自然环境条件:高程高于300 m,风速高于3 m/s[10]等。将评价单元进行适宜性定性评价,并在GIS中,将评价单元图与定性评价结果相衔接,最后得到儋州市橡胶适宜性面积统计表(表4)及适应性评价结果图(图1、2)。
2.1.6 结果分析
从图1可以看出,儋州市中部区域橡胶种植适宜性较高,从中间往东南、西北两边呈适宜递减趋势。橡胶种植适宜区域主要集中在那大镇附近,不适宜区主要集中在沿海及松涛水库附近。
结合表4和图1,可以清楚的看到儋州市橡胶种植的适宜区域:
(1)最适宜区域。橡胶种植最适宜区域的面积为43 029.58 hm2,占农用地面积的14.99%。此类区域分布较为集中,主要分布在大成、和庆、那大、南丰四镇以及八一、兰洋、西联、西流、西培、西庆等农场。此区域农用地的主要特点是地势平坦、土层较厚、风速较小、降雨量充足、土壤酸碱度适宜且养分充足。对于此类农用地,应当切实加强保护,尽量避免建设用地等占用此类耕地,同时注意做好养地,合理调整化肥施用量和投入比,防止土壤酸化和盐渍化。
(2)适宜区域。橡胶种植适宜区域的面积为57 770.9 hm2,占农用地面积的20.13%。此类耕地主要分布在大成、和庆、那大、雅星等乡镇以及西华、西联、西流、西培、西庆、新盈等农场。此类农用地环境与最适宜区域农用地相差不大,影响橡胶种植的不利因素主要是水和养分,尤其是有机质和全氮等养分的含量不高,处于中等或中等偏下水平。由于适宜种植面积较最适宜面积广,因此加强此类耕地的管理和保护是儋州市实现橡胶高产、稳产的保证。针对适宜耕地养分特别是有效磷含量低的特点,可因时适量增加磷肥用量,合理调配复合肥比例,以提高土壤有效磷含量,改善土壤养分结构,达到以磷增氮的效果,消除农业生产中的不利因素。
nlc202309011624
(3)次适宜区域。次适宜种植橡胶的面积为40 934.9 hm2,占14.26%;该类农用地集中分布在雅星、王五、东城、光村、峨蔓、木棠等乡镇以及红岭、西华、西联、新盈等农场。其影响橡胶种植的不利因素主要是降水量较小、风速较大、土壤养分含量不高,虽然其地势较低,但最重要的是此类土壤有机质和全氮等养分含量低,难以维持橡胶正常生长的生理需要。对于此类区域可以选择抗风性较强的橡胶品种种植,并且加强农田水利设施的建设,调节水分状况,增施有机肥等,使之满足橡胶生长需要。
(4)不适宜区域。不适宜种植橡胶的面积为145 317.6 hm2,占农用地面积的50.62%。该类农用地面积较大,主要分布在沿海以及松涛水库一带。沿海地区由于降雨量较小、风速较大等气候条件以及养分含量低等条件限制而无法种植;在松涛水库虽然土壤养分充足,但由于其地势较高、坡度较大等条件限制橡胶的种植,且缺少管理,这些都使得松涛水库附近的大片区域不适宜种植橡胶。
(5)由于八一农场在儋州市橡胶生产中占有较大比重,且农场在规划、管理上较为精细,因此以八一农场来检验橡胶适宜性评价结果。根据资料数据[4]计算得到儋州市的橡胶单产为2.5 kg/年·株。结合八一农场的实际情况,将八一农场的橡胶产量进行分等定级,将干胶大于3.0 kg/年·株的地块确定为最适宜种植,适宜种植为2.5~3.0 kg/年·株,次宜种植为2.0~2.5 kg/年·株,小于2.0 kg/年·株的为不适宜种植。将确定好的橡胶产量水平和评价结果进行对应性比较,得到图2。
(6)从图2中不难看出,对应“相同”的区域(17 855.8 hm2)明显多于“不相同”区域(2 454.9 hm2),“相同”区域占验证区域的87.9%。对应性结果表明:图1的评价结果对于八一农场橡胶的种植具有较高的适用性。
3 讨论与结论
(1)种植适宜性评价涉及土地众多性状,即使所选的因子相同,采用不同的评价方法,其评价结果也有所不同。本研究从儋州市出发,以村一级为研究尺度,采用模糊数学的方法,根据橡胶树正常生长对环境条件的相关研究来确定各评价因子的隶属函数的临界值和阈值及散点型函数的隶属度。并运用主成分分析法,对橡胶种植适宜性进行综合评价,并制作了适宜性种植图。通过适宜性评价,因地制宜的发展橡胶树种植产业,从而提高橡胶的产出率,进而创造出最大的经济、生态和社会效益。
此方法在实际应用中仍有一些问题需要注意。首先,数据资料的获取是本方法应用的制约因素,一些重要的评价因子数据将在很大程度上影响评价结果的科学性;其次,评价因子的确定具有一定的局限性,因为评价因子及隶属函数是根据数据资料以及专家意见加以平衡得出的,受影响较大。另外, 在评价过程中获得的基础数据越多、真实性越高, 所得出的评价单元将越零碎。出于评价目的的考虑, 为了更好地为农业管理部门提供决策参考,对于种植适宜性评价结果, 在评价单元(地块)上,还有待进一步的研究。
(2)在今后的研究中,建立、完善一套科学、可行的适宜性评价方法仍有很多工作需要去做。同时,还应加强人员的管理以及肥料的合理使用,以确保橡胶稳产、高产。
参考文献
[1] 许海平,傅国华. 我国天然橡胶产业发展趋势[J]. 中国热带农业,2007,(2):15-16.
[2] 许道顺,许升锋. 经济一体化背景下海南省橡胶产业的发展战略[J]. 海南金融,2006,(9):25-28.
[3] 黄昌勇. 土壤学[M]. 北京:中国农业出版社,2000.
[4] 海南省统计局. 海南统计年鉴2011[M]. 中国统计出版社,2011.
[5] 朱国宇,黄川友,华国春. 层次分析法在水环境规划中的应用[J]. 东北水利水电,2003,21(4):1-7.
[6] 曹志洪,周建民. 中国土壤质量[M]. 北京:科学出版社,2008.
[7] 刘绍贵,张桃林,王兴祥,等. 江西省余江县土壤肥力变化和驱动因素与对策研究[J]. 土壤通报,2006,(10):869-874.
[8] 张 静. 作物-地域多种组合中作物生态适宜性评价与权重配置方法的研究[D]. 南京:南京农业大学,2005.
[9] 华南亚热带作物研究所. 中国橡胶栽培学[M]. 北京:中国科学出版社,1961.
[10] 何 康,黄宗道. 热带北缘橡胶所栽培[M]. 广州:广东科技出版社,1987.
[11] 王秉忠. 橡胶栽培学(第三版)[M]. 华南热带农业大学出版社,2000.
[12] 韦娉婷. 耕地地力评价方法在橡胶园中的应用研究——以海南农垦八一片区为例[D]. 海口:海南大学,2009.
[13] 欧 滨,罗 微,马 利,等. 基于GIS的橡胶园地分等研究[J]. 热带农业科学,2009,29(6):9-14.
[14] 付 强. 数据处理方法及其农业应用[M]. 北京:科学出版社,2006.
[15] 韩永学. 特尔斐法与“拿来主义”[J]. 哈尔滨师专学报,2000(2):67-68.
4.基于主成分分析法的扬州城市生态系统评价 篇四
关键词:时序全局主成分,区域生态环境,安徽省淮河流域
1 引言
在人类社会经济快速发展的今天, 自然环境所遭受的破坏也是日益严重, 如何在谋求区域经济发展的同时, 做到保护自然环境以及合理的使用自然资源就成为一个重要的研究课题, 而研究这个课题的一个前提条件就是充分掌握该区域生态环境的质量状况并做出合理、科学的区域环境综合评价。只有这样, 才能为实现区域经济与环境的协调发展提供现实依据。
本文以时序全局主成分分析法作为环境综合评价的一种途径, 它的优点在于其综合评价的结果更具有代表性和稳定性, 能够更好的体现区域生态环境质量的动态过程。本文以安徽省淮河流域为例, 探讨时序全局主成分分析方法在生态环境质量综合评价方面的应用。
2 时序全局主成分法的基本思想
时序全局主成分法的基本思想是, 采用时序立体数据表, 对n个点求出一条 (最佳) 拟合直线, 使得这n个点到该直线的垂直距离的平方和最小, 并称这条直线维第一主成分, 然后再求与第一主成分相互独立的, 且与n个点的垂直距离平方和最小的第二主成分。由此类推可得其他主成分。
3 时序全局主成分方法的具体步骤
3.1 建立时序立体数据表及标准化处理
选取对环境产生影响的指标数据建立时序立体数据表, 对指标数据进行标准化处理, 消除由于量纲的不同造成的影响, 从而得到标准化决策矩阵。
3.2 对决策化矩阵进行因子分析
对决策化矩阵进行因子分析, 求出其协方差矩阵, 再求出相关矩阵。求出相关矩阵的特征根及其所对应的特征向量。
3.3 提取主成分
一般来说, 协方差矩阵的特征根个数与主成分的数量是相等的, 因此, 需要衡量每个主成分对原来所选变量的变化程度的反映情况。主成分的贡献率越大, 说明主成分的综合能力越强。选取累计贡献率达到80%以上的前n个主成分, 由这n个主成分就可以较好的反映我所选取的各项评价指标。
3.4 构造区域经济增长评价模型
将提取的前n个主成分的特征向量与标准化后的数据相乘, 就可以得到各个主成分得分F1、F2….Fn。再以每个主成分的方差贡献率为权重, 就得到综合评价函数:Z=L1*F1+L2*F2+…..+Ln*Fn (L为各主成分方差贡献率)
3.5 时序分析
绘制时间序列动态趋势图, 由趋势图可以直观的看到随年份变化该区域生态坏境变化的具体状况, 并由此可进一步进行分析和研究。
4 应用举例
为了更详细的说明时序全局主成分分析法在区域生态环境变化中的应用, 以下将以安徽省淮河流域为例, 给出具体的分析步骤和方法。
4.1 指标体系构建及数据标准化处理
本文选取安徽淮河流域2000-2007年的工业废水排放达标率 (x1) (%) 、水资源总量 (X2) (亿立方米) 、耕地面积 (X3) (公顷) 、工业废气排放量 (x4) (立方米/人) 、工业废水排放量 (X5) (吨/人) 、工业固体废物产生量 (X6) (吨/人) 、绿地面积 (x7) (公顷) 、工业二氧化硫去除量 (X8) (吨) 、 (三废) 综合利用产品产值 (X9) (万元) 、污染治理项目本年完成投资额 (X10) (万元) 、全年降水量 (X11) (亿立方米) 等11项指标共8年的数据, 来作为该区域生态环境的样本点。利用spass软件进行无量纲化处理后得到新的标准化数据。
4.2 区域环境变化的动态描述和评价
利用spass软件对数据进行因子分析并得到累计贡献率、特征值、方差贡献率, 提取累计贡献率已经达到了82.787%的3个主成分, 这3个主成分基本上保留了原来指标的信息。对载荷矩阵中的数据经过处理得到的三个主成分的特征向量, 然后得到3个主成分的值, 以F1, F2, F3的方差贡献率为权重, 带入综合评价函数, 可得每个年份的综合评价值, Z=-1.421, -0.686, -0.94, -0.832, -0.15, 1.432, 1.463, 1.128
4.3 时序分析
以纵坐标代表综合主成分得分, 横坐标坐标代表时间绘制时间序列动态趋势图, 如图1所示。
图1反映的是2000-2007年8年时间淮河流域生态环境的变化趋势, 从图中可以看到综合主成分的评价值基本上处于逐年增大的状况, 从02年至05年增长率较高, 说明由于区域经济的快速发展给该区域的环境承受能力带来了空前的挑战, 增长方式的不合理性逐渐体现。到2007年综合评价值开始递减, 说明淮河流域生态环境的恶化趋势得到了一定的遏制, 一系列节能减排政策和淮河污染防治措施的实施有力提高了工业“三废”的排放量达标率, 对区域生态环境的优化产生重要影响。以上的描绘结果与安徽淮河流域区域生态环境变化的实际情况是相吻合的, 证实了时序全局主成分分析方法对生态环境质量综合评价的可行性和可靠性。
5 结论
通过以安徽省淮河流域生态环境变化为例的实证分析可以看出, 基于时序全局主成分分析法建立的区域生态环境变化趋势评价方法是切实可行的, 同时也是准确和客观的。
通过主成分的综合评价值, 可以清楚的看到区域生态环境的变化趋势。其次, 由主成分贡献率可以了解到, 在生态环境变化的过程中, 是哪些因素起到了重要的作用, 有利于我们了解其中的相关机理, 并对此作出相应的政策与建议。
参考文献
[1]吴开亚, 陈晓剑.安徽省经济增长与环境污染水平关系研究[J].重庆环境科学, 2003, (6) :9-12.
[2]鄢寒, 吴群英.基于时序主成分分析的广西经济发展动态描绘[J].广西科学院学报, 2008, (3) :168-170.
[3]李英, 张伟, 李爱贞.济南市生态环境质量现状评价[J].山东师范大学学报 (自然科学版) , 2002, (2) :55-581.
5.基于主成分分析法的扬州城市生态系统评价 篇五
关键词:农业信息化;评价;主成分分析法
中图分类号: S126 文献标志码: A
文章编号:1002-1302(2015)03-0398-04
党的十八大、十八届三中全会以及2014年中央农村工作会议对我国“三农”问题给予了高度关注,明确提出坚持走中国特色新型工业化、信息化、城镇化、农业现代化道路,为我国农业信息化发展提出了更高的要求。推进农业信息化是发展现代农业的现实选择,是促进农民增收的有效途径,是促进城乡一体化发展的客观要求。目前,我国农业信息化建设正在由以信息服务为主向农业生产、经营、管理、服务各领域并重转变,由以政府推动为主向政府引导、需求拉动并重转变,由以单项技术应用为主向综合技术集成应用转变[1-3]。但是,农业信息化行业发展的真实进度难以衡量,研究建立农业信息化发展水平的指标体系和评价方法,科学客观地测算我国农业信息化发展水平,有助于把握现代农业发展规律,梳理跨越式发展思路,制定切实可行的发展战略[4-5]。
美国经济学家Machlup等在知识产业理论基础上提出了信息经济的测算方法,这是最早对信息化水平测度进行的研究[6-7]。我国最早关于农业信息化评价可见于原国家信息产业部于2001年推出的国家信息化指标框架,近年来,国内学者运用多种方法对农业信息化水平的测度及影响因素等进行了研究[8-17]。主成分分析法是以统计数据为基础,筛选、简化指标体系典型的客观赋权方法,对变量较多、指标间有相互相关性的问题特别适用,具有权重确定客观、评价时不受各个评价指标间的相关性影响等特点[18]。本研究选择基于主成分分析法对农业信息化水平进行评价,以解决指标的相关性问题。
本研究以国家统计局数据为依据,建立了包括3个一级指标、9个二级指标的评价指标体系,采用主成分分析法对我国农业信息化水平进行研究,以期为我国政府部门准确判断和把握农业信息化的实现进程,制定相关农业信息化发展战略提供科学依据。
1 农业信息化评价指标体系构建
1.1 评价指标选取原则
农业信息化工作是一个复杂的系统工程,内容涵盖广,在指标选择过程中不能仅对各种指标进行拼凑和堆砌,要充分考虑到农业信息化的各方面。基于此农业信息化水平评价指标体系设计应该遵循以下原则[19]:(1)全面性原则。指标体系涵盖广,既能反映农业信息化基础支撑水平和农业信息化应用水平,又能反映农业信息化的效益水平。(2)可操作性原则。立足我国当前农业信息化发展实际,强调评价指标数据的可获得性。(3)导向性原则。指标体系必须结合国家对农业信息化的重大需求,以及农业信息化发展的自身规律和趋势,引导农业信息化发展方向。(4)科学性原则。指标体系的建立要有科学依据,指标选取应客观和真实地反映农业信息化的水平,要充分体现客观性、公正性和科学性。(5)实用性原则。指标选择能够具体指导各级政府部门开展农业信息化工作,便于执行。
1.2 评价指标体系建立
评价指标体系建立关键在于指标的选取,只有指标选取得当,才能得到充分发挥评价的作用,否则评价不仅徒劳无益,甚至还会给农业信息化建设造成负面影响。本研究借鉴相关学者的研究结果,通过规范化程序收集有关专家意见,从中提取一致信息,在遵循评价指标体系原则的基础上,构建了由农业信息化基础、农业信息化应用、农业信息化效益3个一級指标、9个二级指标构成的农业信息化水平评价指标体系(表1)。
2 基于主成分分析法的农业信息化评价
2.1 主成分法基本原理
利用主成分分析法可以把1组相关变量通过线性变换转成另1组不相关的变量,并且能够最大化的反映原来变量的信息[20]。数学模型为:
2.3 适用性检验
在得到农业信息化水平评价指标标准化数据之后,要进行适用性检验。常见的适用性检验方法有KMO 检验(Kaiser-Meyer-Olkin)和巴特莱特球形检验(Bartlett test of sphericity)。采用SPSS 17.0对数据进行处理,处理结果见表5。由表5可知,KMO值为0.789,大于0.5,说明该组指标数据可以作主成分分析。Bartlett的球形度检验结果相伴概率为0,小于显著性水平0.05,拒绝Bartlett球形度检验的零假设,因此认为本研究数据适合用主成分法来进行分析。
我国31个省(市、区)的农业信息化发展水平见表8。评价结果表明,北京、上海由于其本身政治、经济、文化的优势,在农业信息化发展领域位列前茅;东部省份中除海南排名靠后之外,其他省农业信息化发展水平均排在前列;中部各省份的水平虽然距东部有一定差距,但是发展也初具规模;西部省份除重庆、陕西、宁夏之外,农业信息化发展水平均相对落后,与东部、中部地区有一定差距。
3 结论
在前人研究的基础上,结合我国农业信息化发展实际,以全面性、可操作性、导向性、科学性、实用性为原则,构建了衡量我国农业信息化发展水平的评价指标体系,包括了农业信主成分分析法以统计数据为基础,具有权重确定客观、评价时不受各个评价指标间的相关性影响等特点,本研究选择主成分分析法作为构建农业信息化水平评价模型的方法,评价结果与中国农业信息化实际发展情况基本符合,说明该评价方法客观有效。
利用主成分分析法对中国31个省(市、区)的农业信息化法发展情况进行评价研究,评价结果表明,从全国范围来看,东部省份农业信息化发展水平普遍较好,西部省份则发展相对落后,但重庆、陕西、宁夏等西部省份的农业信息化也已经初具规模。
nlc202309031502
参考文献:
[1]陈晓华. 农业信息化概论[M]. 北京:中国农业出版社,2012.
[2]陈晓华. 抓住机遇 迎接挑战 扎实推进信息化与农业现代化全面融合[R]. 2013.
[3]李昌健. 我国农业信息化建设重点、难点及路径选择[J]. 农业科技管理,2014,33(4):1-4.
[4]李昌健. 加强全国农业信息中心体系建设的思考[J]. 农业科技管理,2014,33(3):1-4.
[5]李道亮. 我国农业信息化面临的新机遇与发展建议[J]. 山东农业科学,2013,45(10):125-128.
[6]Machlup F. The production and distribution of knowledge in the United States[M]. Princeton:Princeton University Press,1962:33.
[7]Porat M U. The information economy:definition and measurement[R]. Washington D C:US Department of Commerce,Office of Telecommunications,1977:47.
[8]Hu J,Yan Y,Lu J P,et al. A study on the informatization evaluation index system of manufacturing enterprises and evaluation standard[J]. Modular Machine Tool & Automatic Manufacturing Technique,2005,12:97-99.
[9]Rezaei-Moghaddam J K,Karami E. A multiple criteria evaluation of sustainable agricultural development models using AHP[J]. Environ Dev Sustain,2008,10:407-426.
[10]Tsitsika E V,Maravelias C D. Fishing capacity and capacity utilization of purse seiners using data envelopment analysis[J]. Fishing Science,2008,74:730-735.
[11]Chen G H,Chen Y T. The research progress & development trend of comprehensive evaluation methods[C]. Proceedings of 2002 International Conference on Management Science & Engineering. Harbin,2002:462-470.
[12]劉 玮,李燕凌,胡扬名. 县域农业信息化发展水平评价[J]. 江苏农业科学,2014,42(5):399-403.
[13]刘世洪,许世卫. 中国农村信息化测评方法研究[J]. 中国农业科学,2008,41(4):1012-1022.
[14]黄婷婷,[HJ1.9mm]李德华. 我国农业信息化水平的测度及影响因素分析[J]. 情报科学,2008,26(4):565-571.
[15]高 雅,甘国辉. 农业信息化评价指标体系初步研究[J]. 农业网络信息,2009(8):9-13,17.
[16]李 思. 基于DEA及超效率DEA模型的农业信息化评价研究[J]. 湖北农业科学,2011,50(6):1292-1294.
[17]张喜才,秦向阳,张兴校. 北京市农村信息化评价指标体系研究[J]. 北京农业职业学院学报,2008,22(1):42-46.
[18]袁志发,周静芋. 多元统计分析[M]. 北京:科学出版社,2002.
[19]袁晓庆. 农业信息化评价决策支持系统研究[D]. 北京:中国农业大学,2011.
[20]张 榕. 基于主成分法的兵团农业信息化发展测评分析[J]. 西昌学院学报:自然科学版,2011,25(1):64-67.
6.基于主成分分析法的扬州城市生态系统评价 篇六
關键词:民办本科高校 主成分分析 评价指标
1.引言
山东是民办本科高校较多的省份,2014年山东省普通本科高校55所,其中民办本科学校11所,独立学院11所。然而山东省民办本科高等教育大而不强,其教育改革创新的力度还不大,优质的师资、设备等教学资源没有真正汇集到民办本科高校,民办高校人才培养仍在低水平运作。依据主成分分析法,明确民办高校人才培养质量的影响因子,构建山东省民办本科高校的评价指标体系,系统评价山东省民办本科高校发展的现状,识别山东省民办本科高校发展的瓶颈,形成以人才培养质量为导向激励机制,是大力发展山东省民办本科高等教育的落地之举,为促进山东省民办本科高校的可持续发展提供理论支撑和决策依据[1]。
2.研究方法
2.1 山东省民办本科高校评价体系的构建
本研究所建立的山东省民办本科高校发展评价指标体系主要包括三个方面:
一是学校硬件设施,反映民办本科高校的办学条件,体现物的因素:X1—生均占地面积/(平方米·人-1),X2—生均教学仪器设备值/(元·人-1),X3—生均纸质图书/(册·人-1),X4—生均教学日常支出/(元·人-1);
二是师资队伍建设和学生数量指标,反映民办本科高校的办学规模,体现人的因素:X5—生师比,X6—副高及以上职称比例/%,X7—硕士及以上学位比例/%,X8—统招本科在校生人数(人);
三是毕业生评价指标,反映民办本科教育质量效益,体现结果效益:X9—2012年学生满意度(%),X10—2012年考研率/%,X11—2012年就业率/%,X12—2012年用人单位满意率/%[2]。
2.2 主成分分析法
主成分分析是一种应用十分广泛的多元统计分析方法。其考虑各指标间的相互关系,采用降维的方法将原有的多维变量由少数彼此独立的综合指标来替代进行分析,并从中挑选出几个重要的指标进行评价,以便于更加深刻地揭示事物的内在规律[3]。
计算步骤如下:
设民办高校质量评价体系的原始数据矩阵为:
X=(xij)(i=1,2,…,n;j=1,2,…,p)
(1)原始数据的标准化处理:zij=xij-jSj (1)
其中:j=1n∑ni=1xij;S2j=1n-1∑ni=1(xij-j)2
(2)样本相关矩阵R=(rij)p×p
rij=SijSii·Sjj(2)
(2) 其中:Sij=1n-1∑nk=1(zki-i)(zkj-j);i=1n∑nk=1zki;j=1n∑nk=1zkj;
(3) 计算相关矩阵的特征值、方差贡献率、累计贡献率
特征值:令|λI-R|=0,采用雅可比法(Jacobi)计算特征值λi(i=1,2,…,p),由大到小的顺序排列,即λ1n≥λ2≥…,≥λp≥0
方差贡献率:αi=λi∑pk=1λk(i=1,2,…,p) (3)
累计贡献率:G=∑ik=1λk∑pk=1λk(i=1,2,…,p) (4)
(4)确定主成分
一般累积贡献率达85%以上的特征值λ1,λ2,…,λm所对应的就是第1,第2,…,第m(m≤p)个主成分。
(5)主成分得分:Fi=a1iX1+a2iX2+…+apiXp(i=1,2,…,p) (5)
其中:api为第i个主成分第p个因子得分系数。
(6)综合评价值:Fj=∑kp=1αpFpj (6)
其中:αp为第p个主成分的方差贡献率;Fpj为第j列的第p个主成分。
3.结果及分析
3.1 数据来源
本研究数据来源于山东省教育厅公布的2012年山东省20所民办本科高校本科教学质量报告[4]。
3.2 数据处理与计算
依据上述主成分分析法的计算步骤,应用SPSS 17.0软件对2012年山东省民办本科高校发展指标体系指据进行计算和分析。
(1)对原始数据标准化处理,建立相关系数矩阵R,对R进行相关性判定,结果表明变量间具有较强的相关性,说明他们在信息上有
重叠。
(2)计算R的特征值、方差贡献率和累计贡献率(表1)。由于前4个特征值大于1,且累计贡献率达到90.972%,表明这4个因子包含了原有12个变量的信息总量的大部分,可以作为主成分。
(3)将初始因子载荷矩阵表中每一列值分别除以特征值的开方,得出每一个特征值对应的特征向量,即因子得分系数。表1因子特征值、贡献率、累计贡献率
因子特征值方差贡献率/%累计贡献率/%F14.10634.21834.218F23.70630.88265.099F32.02016.83381.932F41.0859.04090.972表2因子得分系数表
指标F1F2F3F4指标F1F2F3F4X1-0.329-0.326-0.2640.070X70.374-0.293-0.2000.012X2-0.1320.260-0.545-0.070X80.3210.233-0.157-0.491X30.222-0.3950.1720.209X9-0.4090.1030.3170.001X4-0.0910.2870.2160.509X10-0.3290.0510.408-0.349X50.3300.2420.344-0.217X110.1040.389-0.1560.493X60.308-0.2980.2630.179X120.2890.3690.1150.067(4) 根据因子得分系数表(表2),列出前4个主成分F1,F2,F3,F4的计算模型:
nlc202309011909
F1=-0.329X1-0.132X2+0.222X3-0.091X4+0.330X5+0.308X6+0.374X7+0.321X8-0.409X9-0.329X10+0.104X11+0.289X12 (7)
F2=-0.326X1+0.260X2-0.395X3+0.287X4+0.242X5-0.298X6-0.293X7+0.233X8+0.103X9+0.051X10+0.389X11+0.369X12(8)
F3=-0.264X1-0.545X2+0.172X3+0.216X4+0.344X5+0.263X6-0.200X7-0.157X8+0.317X9+0.408X10-0.156X11+0.115X12 (9)
F4=0.070X1-0.070X2+0.209X3+0.509X4-0.217X5+0.179X6+0.012X7-0.491X8+0.001X9-0.349X10+0.493X11+0.067X12 (10)
(5) 根据(表2)中各主成分的方差贡献率,构造综合评价模型:
F=34.218%F1+30.882%F2+16.883%F3+9.040%F4 (11)
(6)由式(11),得2012年山东省20所民办本科院校发展综合评价结果(表3)。
表3山东省民办本科高校发展综合评价结果
编号F排序编号F排序编号F排序学校A10.2949学校A8-0.93419学校A15-0.00512学校A20.8631学校A9-0.81917学校A16-0.30416学校A30.5354学校A100.7382學校A170.5015学校A40.12810学校A110.3597学校A180.4006学校A5-0.07814学校A120.11111学校A19-1.73620学校A6-0.22015学校A13-0.83818学校A200.7103学校A7-0.01613学校A140.31183.3计算结果分析
对数据进行标准化处理后,变量全部变为正向作用指标,因此山东省本科民办高等院校的综合得分越高,表明该学院的发展越好。
应用该方法对山东省民办本科高等院校发展水平进行评价,评价结果与实际情况基本符合,说明该评价方法具有一定的科学性和可信度。
4.建议与展望
(1) 为提高人才培养质量,各民办本科高校要切实加强教师队伍建设,引进名师,培养名师,以名师吸引学生,建立一支数量充足、结构合理、素质优良、业务精湛的师资队伍是人才培养质量保证的先决条件。
(2) 民办高校的主要任务是人才培养,人才培养质量评价主要看高质量的就业率、考研率和用人单位对毕业生工作的满意度。建议各民办本科高校要从提高人才培养质量的视角下抓好毕业生的就业、升学工作。
(3) 加大对人才培养经费的投入,保证学生人均教学经费、生均教学科研仪器设备值逐年增长,继续加大教学仪器设备和图书资料等教学设施建设,改善办学条件。
参考文献:
[1]刘升阳, 李伟.基于主成分分析的民办高校发展评价研究[J].统计与管理.2013.3:46-48.
[2]韩俊龙, 韩珂, 梁保送.基于主成分分析的河南省农业循环经济发展评价研究.河南农业大学学报[J].2013.12(6): 757-761.
[3]于秀林, 任雪松, 多元统计分析[M].北京: 中国统计出版社, 1999.
[4]本科教学质量报告,山东省教育厅网http://www.sdedu.gov.cn/jyt/ztzl/jxzl/A090809index_1.htm.
项目信息:基于主成分分析法的山东省优质特色民办高校评价体系的构建及实证研究(2013GG087)
7.基于主成分分析法的扬州城市生态系统评价 篇七
水质评价是水环境质量评价的主要内容, 它为水资源的综合利用及水域污染预防提供依据.目前, 进行水质综合评价的方法主要有简单指数法、分级加权评分法、普通概率统计法及主成分析分法[1], 主成分分析方法在综合评价应用各指标提供的信息相互交织重叠, 指标彼此之间存在着一定程度的相关性, 影响了对总体信息的认识与评价, 也使问题分析变得更加困难, 极大限制了它在水质综合评价方面的进一步应用.本文针对这些局限性, 对文中采用的传统主成分分析方法进行改进, 建立了一种新的评价模型, 并对广西宁明县明江河丰水期水质进行了量化评价, 具有一定的理论及实践价值。
二、传统主成分分析方法
已知有p维评价样本, 对n个样本点的同方向规格化变量记作:x1, x2, …, xp.主成分分析经过线性变换, 以少数新的综合变量 (即主成分) 取代原来的变量, R= (Rij) p´p为相关系数矩阵.λ1、λ2、…、λp为R的特征根, e1, e2, …ep是对应的单位化正交特征向量, 则第i个主成分为:
以方差贡献率i为权, 得最终评价指标F, 即:
m的一般取法是累积方差贡献率达到一定比率.将规格化数据分别代入各主成分的表达式中, 计算得样本的各主成分得分, 以方差贡献率为权数求和得综合得分, 从而对样本点进行定量化评价.以上即为传统主成分方法的方差贡献率评价模型.
传统主成分分析方法在水质综合评价应用中的缺陷主要在于信息量权的缺陷.主成分用于多指标评价的传统方法是利用原始指标数据所包含的方差大小来对主成分施行客观赋权, 没有考虑到评价指标的重复影响, 如果一个指标与其它指标的信息重复量越大, 这个指标在整个指标集中的作用越小.在做综合分析时要考虑到各指标间的相关性大小对综合评价的影响, 为此本文对文[1]中的水质评价主成分分析方法进行了改进。
三、改进主成分分析算法及步骤
(1) 数据xj的均值化.即对同一变量减去其均值再除以标准差.
(2) 通过SPSS软件计算X*的相关系数矩阵, 及特征值, 特征向量, 方差贡献率.
(3) 根据方差累计贡献率确定主成分个数及主成分的表达式.
(4) 构造综合评价函数
针对传统主成分分析法的缺陷, 将全部指标的相关系数矩阵, 除对角线上元素外, 按列求和得到一个行向量, 它反映的是各指标与其它指标的信息重复量.将其求倒数并作归一化处理.设指标xi与其它指标的相关系数分别为ri1, ri2, …rip, 则信息重复量为, 对其求倒数得, 标准化得, i反映ji了第i个指标对其它指标ji的重要性, 从而对 (2) 式进行第二次加权处理, 得综合评价函数 (28) p ij jijr1
四、实例
本文仍选取文[1]提供的数据 (见表1) .研究区域为宁明县明江河花山景区附近水域.
表1 2007年7月明江河水质监测指标标准数据 (丰水期) 其中X1代表p H值、X2代表溶解氧、X3代表高锰酸盐指数、X4代表化学需氧量、X5代表总大肠菌群.
利用SPSS18.0实行主成分分析过程, 得各指标相关系数矩阵 (见表2) 、特征根及主成分方差贡献率 (见表3) , 第一、二、三主成分的特征值分别为4.263、0.439、0.297, 其中只有第一主成分的特征值大于1.其方差贡献率为85.268%.说明第一个主成分包含了以上5个指标的全部信息.其对水质变化的影响最大, 进而对第一主成分进行载荷值计算.得第一主成分在X1、X2、X3、X4、X5上的因子载荷分别为-0.922、-0.933、0.815、0.963、0.975, 第一主成分对于X1、X2、X3、X4、X5的特征向量分别为-0.4466、-0.4519、0.3947、0.4664、0.4722.
表2 2007年7月水质监测指标各项相关系数矩阵表3主成分方差解释表
从表3可以看出第一个主成分包含了全部的指标所具有的信息且累计方差贡献率达85.268%, 所以选取一个主成分.根据主成分特征向量, 得出各指标与主成分1y的线性关系为:
从各指标相关系数矩阵表来看, 第一个指标与其余指标具有较强的相关性, 高锰酸盐的影响相对较小, 溶解氧与PH值、高锰酸盐、化学需要量、总大肠菌群呈负相关, 说明受到工业污染物的影响程度比生活污水的程度低.由表2计算出1 (28) .00 67392, 2 (28) .0065833, 3 (28) -.071141, 4 (28) .0392502, 5=185682.1, 由 (3) 式得综合评价函数为
将均值化数据代入 (4) 式计算出明江河各观测点水质综合得分 (见表4) .
表4综合得分及排名
四、结束语
从表4可以看出明江河监测断面1在丰水期污染最重, 其次监测断面2在丰水期污染重, 监测断面3、4在丰水期污染较轻, 有关部门要加强监测断面1、2的治理, 加强该段区域的污水排放管理, 逐步改善水质状况.本文使用的改进主成分分析方法主要优点是考虑了各指标间的相关性, 并利用指标的相关系数对综合评价函数进行了改进, 消除了指标间相关性对评价的影响.通过实例表明本文的方法是可行的。
摘要:为解决传统主成分分析在水质综合评价应用中的局限性, 本文对传统主成分方法作了改进, 建立一种新的评价模型, 利用此模型对明江河4个监测断面水质进行评价.结果表明此方法切实有效且有较强的实践价值。
关键词:主成分分析,河流水质,评价
参考文献
[1]吴浩东, 胡衡生:《基于主成分分析法的明江河水质评价》, 《湖北农业科学》, 2010, (10) 。
[2]孙红卫、徐天和、王玖:《主成分分析用于综合评价合理性的探讨》, 《中国卫生统计》, 2008, (4) 。
8.基于主成分分析法的扬州城市生态系统评价 篇八
一、相关文献
党的十六大报告指出, 对国家事业的发展具有决定性的因素, 事实上就建立在不断改善和提高人民的生活水平之上 (3) 。美国学者最早在此方面进行研究, 之后其余发达国家在这方面的研究也日趋丰富。人民生活评价指标从最开始的只有收入、支出, 逐渐发展到利用家庭、人口、科教文化、收益的活动、无收益的活动、社会保障、公共秩序、安全、时间利用、社会阶层及流动情况、人民幸福程度、舒适感等指标进行评价 (4) 。
我国经济学者从2000 年以后才开始对人民生活水平评价进行研究。主要是采用加权综合法、神经网络法、层次分析法、灰色聚类法等方法对居民生活水平进行综合评价比较分析。覃成林 (5) 等人从消费与收入两个方面四个指标对中部地区人民生活进行评价;刘干 (6) 利用人均居住面积、人均可支配收入、生活用电量、城镇居民拥有家庭电脑数、恩格尔系数这几个方面的7 个指标, 采用动态权数综合评价方法对31 个省市人民生活水平进行评分并排行。刘毅 (7) 在购买力评价理论的基础上, 利用可量化的消费支出指标, 因子分析方法来评价中国36 个大中城市的居民生活水平。
在中国经济水平提高, 与世界接轨的基础上, 人民的生活方式、消费观念、思维方式等方面都发生了可喜的变化, 人们对于生活水平的要求也发生了改变。国外大量研究都已将各种不同类型指标运用到人民生活水平的评价上, 国内的郑治提出 (8) , 对人民的生活水平的评价不应只包括物质生活这一个方面, 廖文强 (9) 等人利用回归分析发现教育水平与人民生活水平之间有明显的线性关系, 而国内大部分研究所使用的评价指标都集中于对人民收入与支出的评价与判断, 忽略了其他社会指标的重要性。大量学者对西部12 省自治区城市竞争力进行了研究, 并没有太多研究针对西部省市人民生活水平的评价。基于此, 本文将通过消费水平、社会保障、城市环境、科技文化四个方面对西部12省人民生活水平进行评价对比。
二、评价体系的构建
根据前人的研究结果与党的十八大全面小康路线中目标设定的内容 (10) , 人民生活水平的评价体系应该从社会、经济、文化等多个角度, 多个方面进行指标的选取, 因此, 本文从消费水平、社会保障、城市环境、科技文化四个方面, 建立24 项指标对西部人民生活水平进行评价与分类, 见表1。由于人民舒适度和幸福感等这类主观评价指标难以采集数据, 因此并没有被加入到评价体系当中。研究初期, 文章利用了更多可量化的指标进行研究, 因为以下原因最后只剩下24 项最适合进行研究的指标:第一, 部分指标与重要指标之间的关系不够紧密, 影响主成分分析的效果;第二, 部分指标在省份与省份之间区别很小;第三, 部分指标数据难以在互联网上获取。
三、研究方法
1.主成分分析法
主成分分析是对大量数据进行降维, 利用数学变换, 将多个数学指标减少成几个综合指标, 且保证原始信息损失最少 (11) 。在进行数学变换时, 原始变量的各个线性组合形成多个互不相关的综合指标, 并得出每个综合指标对原始变量的方差贡献率。这些综合指标即主成分。根据方差累积贡献率选择若干个能比较完整的反映原始数据的主成分进行原始数据的信息提取。对于实际问题, 研究指标的减少能提高分析和研究的效率 (12) 。由于本文选取了24个指标进行研究, 既需要可以将指标压缩简化而不损失原始数据的信息, 又需要克服传统主观方法确定权重的片面性, 主成分分析法则是比较不错的选择 (13) 。
2.聚类分析
聚类分析为当下非常常用的数据挖掘方法, 在总体内将不同的群体区分开来, 往往作为数据挖掘或数据分析的第一步骤。而本文在利用主成分分析得到各省评价指标的得分之后, 可以通过聚类分析将相似的省或自治区分为一类, 便于我们进一步分析。本文采用系统聚类。
四、西部人民生活水平评价分析过程
24 个指标的数据选取自中国国家统计局官网2013 年数据和西部各省, 自治区, 直辖市的2013 年统计公报。数据统计与分析的过程都采用SPSS 21.0 软件进行。先分别对每一类评价指标进行主成分分析, 计算每省每一个评价大类的单项得分, 再根据各类得分的权重, 计算每省的综合得分。最后对每省的综合得分进行聚类分析。
1.主成分分析过程
每一个指标数据首先进行标准化处理, 标准化公式为
其中, n为西部地区省份数量, m为指标的数量。 Pij为第i个地区第j个指标标准化值, Xij为第i个省份对应第j个指标值, 为所有省份的第j个指标平均值, Dj为所有省份第j个指标的标准差 (n=31) 。
每一类评价体系主成分分析方法一致, 由于论文篇幅有限, 所以本文只选取第一类消费水平的计算过程进行详细介绍。
第一类消费水平大类中有9 个指标 (见表1) , 通过软件进行主成分分析之后, 获得消费水平大类所有指标的特征值、方差贡献率和累计贡献率 (见表2) , 也获得不同指标在不同主成分下的初始载荷系数 (见表3) 。同时, 发现指标KMO统计量检验值为0.718>0.7, Bartlett球形检验统计sig. 约为0.00007<0.1, 所以适合进行主成分分析。
从表2 中可以看到, 前三个主因子指标的累积方差贡献率已经达到了89.009%, 大于百分之八十五, 说明这3 个主成分已经涵盖了原始样本矩阵中89.009%的信息, 可以用来做消费水平的评价。
主成分的因子得分公式:
其中, amj为第m个主成分中第j个指标的因子回归系数, pj为第j个指标的数值标准化后的数值, Fm是指在第m个主成分下的因子得分。因子回归系数等于为每一个指标初始荷载值除以其对应特征值的开平方根。
因此我们可以计算得到每个省在消费水平大类中每一个主成分对应的因子得分, 每省得分需要分别计算见表4。
而消费水平大类的综合得分公式为:
其中, Fm为每一个主成分的因子得分, Wm为每一个主成分所占的权重, 其等于此主成分的方差贡献率除以三个主成分的总的方差贡献率。计算得到消费水平大类的综合得分模型为:
其中, F1, F2, F3 为三个主成分因子得分的标准化值。
进而可以计算每个省消费大类水平得分。同理计算得出社会保障、城市环境、科技文化三大类的综合得分模型, 生成各省对于四类评价模型的综合得分结果矩阵见表5。
在求出四类评价指标的分别得分之后, 再以四类所有省市得分进行主成分分析, 其中, KMO统计量检验值为0.787>0.7, Bartlett球形检验统计sig. 约为0.00004<0.1。最后得到人民生活水平评价综合计量模型:
其中, PFy1, PFy2, PFy3, PFy4为四大类因子得分的标准化值。
最后得出每省人民生活水平综合得分, 每省得分需要分别计算见表6。
2.聚类分析类型划分
之后对各省综合得分进行系统聚类。聚类结果将西部地区人民生活水平分为四类:第一类:四川;第二类:重庆, 内蒙古, 陕西;第三类:广西, 云南, 贵州, 甘肃, 新疆, 青海, 宁夏;第四类:西藏。
五、结果分析
从表5 上分析, 甘肃、青海、西藏3 个省份在消费水平方面表现最弱。内蒙古、四川、重庆、陕西因子得分分别位列前3名, 这三省经济水平较其他省明显要高, 人民消费水平强劲。其余省份分别位列第5到第9, 得分都为负, 负数是指低于平均水平, 正数是指高于平均水平。
从社会保障得分来看, 四川、重庆、陕西、广西分别位列前4 名, 而只有四川和重庆的因子得分超过了1, 甚至都超过了2, 说明这几个省份重视社会保障, 使众多的人参加了社会保险。宁夏、青海和西藏得分最低, 拥有社会保障人数太少。
从城市环境上看, 甘肃、云南、青海、西藏是最弱的, 并且是所有省份中唯一为负数的几个省份。表明这四个省在城市环境上远远不如其他省份。陕西、新疆、四川、重庆为前四名, 明显高于平均水平, 基础设施较为完善。
最后一大类科技文化当中, 四川、陕西、内蒙古、重庆、新疆名列前茅, 居民能够享受到最新科技带来的便利, 教育水平较高也间接促进了科技发展。宁夏、甘肃、青海、西藏的科教水平位列倒数, 科教水平低下。其他省份科技文化方面得分也低于西部省份平均水平。
从表6 中可以看到所有评价指标综合得分的排名。四川作为第一分数遥遥领先, 云南、宁夏、贵州、甘肃、青海、西藏得分为负, 低于12 省的平均水平, 西藏的综合得分远低于倒数第二名, 是人民生活水平最为低下的省份。
从四大类评价指标的分别得分看出, 四川省人民的消费水平并不是最高的, 城市环境方面也只排了第三, 但是在社会保障和科技文化方面, 四川以绝对的优势取得第一, 所以最后的综合得分四川也以绝对优势得到了冠军, 并且比第二名重庆的得分高出不少, 所以被单独分为一类。
重庆、内蒙古、陕西也以较高的得分位列综合得分的2、3、4 名。四大类评价指标的分别得分中, 这三省也一直名列前茅, 人民生活水平较高。新疆、广西、云南、贵州、甘肃、青海、宁夏归为一类。虽然新疆与广西的综合得分为正, 即高于平均水平, 但是分数并不高, 人民生活水平还需继续提高。西藏作为全国经济最落后的省份, 其人民生活水平综合得分也是最低的, 并且远远低于倒数第二名宁夏。
六、结论与建议
1.分类分省份结论与建议
四川作为西部发展环境最好, 资源最丰富的省份, 已凭借努力成为西部的经济支柱。但是, 由于四川人口众多, 本省不同地区自然条件差距较大, 最近几年又由于地震频发和金融风暴等的影响, 经济指标增速回落较大, 一些落后地区经济水平、基础设施和公共服务体系的建设相比发达地区差距依然很大, 整个四川省发展水平与东部发达地区发展水平也还有不小差距, 因此四川省应该坚持作为西部第一大省的地位, 借助资源优势, 大力发展经济并努力减少贫富差距, 让人民生活水平稳步提高, 进而带动西部其他省份的整体发展。
重庆、内蒙古、陕西作为西部地区发展非常快的地区, 在西部也处于上等。但是, 这三个省份依然属于欠发达地区。从研究结果上看, 重庆在四个方面都有待提高, 特别是城市环境、科技文化两个方面与其他省市有较大差距。重庆作为山区, 经济增长内生动力不足, 科技创新与教育能力不强, 城乡区域发展差距较大, 贫困人口依然较多。内蒙古作为农业, 畜牧业大省, 虽然经济实力不断攀升, 消费水平名列前茅, 但是其他方面都较为薄弱。内蒙古生态条件本身较差, 能源通道建设相对滞后, 资源综合利用水平不高, 服务业和中小企业发展滞后, 科技文化水平较低, 基础设施建设落后且不平衡, 总体来说大部分人民生活水平不高。陕西省也为农业大省, 经济发展快, 城市建设较好, 文化科技水平较高, 但是同样总体生态环境较差, 资源利用水平不高, 城乡差距较大。重庆、内蒙古、陕西三省都应该在经济增长推动的同时努力提高社会、生活和环境水平, 相互促进, 进而切实提高人民生活水平。
新疆、广西、云南、贵州、甘肃、青海、宁夏属于全国经济落后省份, 虽然旅游资源丰富, 但是不适宜城市发展的环境条件一直在很大程度上制约了其发展。新疆、广西的经济实力在西部中等, 但是人均消费水平和科技文化水平还是较弱。新疆近年来面对严峻复杂的反恐维稳形势, 社会稳定基础不稳固, 发展受到一定的影响, 并且经济结构本身不合理, 民生改善速度较慢。广西一直以来经济增长慢, 环境安全问题没能妥善解决, 经济结构亦不合理, 一些群众的切身利益并没有得到解决。云南省主要是旅游带动经济, 其他方面的问题却颇为严重。工业企业经营困难, 民营经济发展不足, 资源环境紧张, 人才匮乏, 政府性债务较重, 城乡居民生活水平都偏于低下。贵州经济水平的增长速度从2000 年开始一直是西部地区最高的, 但是, 从分析结果来看, 其四个方面的得分都排在第8 名之后, 人民生活水平依然处于非常落后的水平, 这跟贵州山区开发太过困难, 山区贫困人口太多, 经济增长内生动力不足, 旅游业发展力度不等有关。甘肃、青海、宁夏环境差、资源少, 地震活动近年来也频繁, 所以大大制约了其发展。本身发展基础薄弱, 产业化水平低, 科技创新能力弱, 很多人民可能无法得到最基本的生活保障, 更不用说获得可能的社会保障。这几个省的发展除了要大力度进行产业结构调整, 加强内部经济吸引力, 加大招商引资的力度以外, 还应该重点关注基础设施建设, 努力节能减排和关注生态建设工程, 保护好当地优秀的旅游资源, 发挥资源、地理位置、人口等优势, 致力于在各个方面提高人民的生活水平。
西藏单独被分为一类, 说明其人民生活水平相比其他省份十分落后。西藏地理位置特殊、环境恶劣、人口居住分散、反分裂斗争形势严峻, 稳定发展的能力很弱。到2013 年, 西藏大部分地区还是交通不便、能源短缺、水利设施薄弱, 偏远地区通信不畅。少数民族人民思想无法跟上时代, 科技文化建设困难。其他各省市与其开放合作的力度不够, 无法推动其经济发展。政府能力弱, 三农工作的问题都没能解决, 第二第三产业根本无法跟上。西藏必须坚持积极调整产业结构, 支持和鼓励中小企业和非公有制经济的发展, 促进农牧人民转型就业, 统筹城乡发展, 在经济增长的同时提高人民的生活水平。
2.综合结论与建议
本文先利用主成分分析法计算了西部地区人民生活水平得分, 后利用聚类分析将12省分类, 结果表明: (1) 西部地区的人民生活水平因省份不同差异较大, 特别是四川与西藏相较平均水平距离较大; (2) 每省消费水平、社会保障、城市环境、科技文化四个方面并不能得到平均的发展, 导致人民生活水平都有一定程度的落后; (3) 西部每省城乡人民生活水平差异依然巨大。
今后, 四川必须坚持带动西部其他省份共同发展, 不断加强与东部地区之间的联系。西藏地区应加强与外界的合作, 积极调整产业结构, 稳定内部局势, 努力将人民生活水平提高。而其他西部各省应该紧跟步伐, 积极做好城乡统筹, 减少环境问题带来的发展阻碍, 完善基础设施, 利用资源优势加强各方面的稳步发展, 提高城乡所有人民的生活水平。沪昆高铁开通, 将贵州云南与东部发达地区直接连接起来, 这将直接带动贵州和云南的商务、金融、教育文化、旅游业的发展, 也为西部各省带来了新的战略机遇, 希望不要浪费这次绝好的机会, 使西部人民生活水平都能得到极大的提高。
9.基于主成分分析法的扬州城市生态系统评价 篇九
1 通风系统评价指标确定
其通风评价的数据精确度受到选择的评价指标的影响, 所以应该将能具体反映矿井通风系统的特点和状态的指标作为评价指标, 并在检验效度过程中消除重叠类型数据, 以减小指标相关性。
“人-机-环”是当前通风评价系统构建评价指标方面运用的主要思想, 其构建都是利用经济性能、管理性能和可靠性技术三个指标作为主要指标体系。本文量化分析了煤矿通风指标评价系统, 然后根据当地实际情况选择了三大类别共计10项来自三大方面的通风系统评价指标。
1.1 通风设计及通风能力指标
通风设计及通风能力指标主要涉及到通风系统的设计、局部通风情况和通风设施三个方面。
1.2 技术指标
瓦斯爆炸和火灾是煤矿多发事故, 对此, 煤矿企业必须要有具体的、有针对性的解决和预防措施, 从而保证矿井安全通风系统的正常运行。所以煤矿企业所选择的指标主要为综合防尘、自然发火预防和抽采瓦斯。
1.3 管理指标
一般而言, 在煤矿安全指标当中, 管理是非常重要的指标之一。在煤矿生产中, 需要管理井下的爆破、瓦斯、制度和监控通风安全系统。
2 基于主成分分析的通风系统评价方法
可以将函数映射运用到安全评价当中, 设定指标评价变量为n, 维向量为X, 评价数据信息为Y, 函数映射从变量X到结果信息Y就是整个安全评价的过程。所谓“主成分析法”, 就是提取特征或者压缩数据的一种统计多变量的分析技术, 其能够集中众多变量, 进而形成较小数量的综合变量, 将主成分变成原变量的线性组合。通风系统所运用的主成分分析法的大致过程如下: (1) 收集样本数据。先将安全打分表编制好, 然后实际评价其煤矿的安全状况, 最后再收集样本数据。 (2) 标准化原始数据信息, 即排除一些数据的数量级差异或数量量纲, 然后利用SPSS软件进行自动标准化。 (3) 计算其系数矩阵, 即根据SPSS软件对其数据相关系数矩阵进行标准化构建。 (4) 利用F=u, X, +utz Xz+u X3+…+u这一公式提取主成分与其他成分的线性关系。 (5) 优化函数。利用主成分累计共享率a和主成分个数等因素, 从而对其函数进行构造, 即F=a, F, +az Fz+a3F3+…+ap. (6) 分析其最后所得评价数据。排序F、主成分和F综合主成分如果有一致性较高的排序结果, 即表示其有着非常合理的主成分提取, 从而能更好地将指标的重点内容体现出来。
3 基于主成分分析的通风系统评价方法
根据计算情况可得, 前四个特征值有着高达92.6%的贡献率累计, 即表示这几个主成分将所有指标信息几乎全部覆盖, 因此需要提取前四个特征值。
通过计算第一主成分“X4”、第二主成分“X5”、第三主成分“X1”和第四主成分“X10”, 综合评价函数构建方面主要运用前四个主成分数据指标, 为X=47.7X4+20.09X5+16.46X1+8.35X10.在第一个主成分表达式当中, 较大系数的指标为第二个、第四个和第七个, 即这三个指标是主要指标, 所以第一主成分就是能够反映矿井综合安全性质的指标, 利用瓦斯粉尘防治、监控通风情况来保证生产安全;第二主成分影响最大的指标为第一个和第五个, 即防治瓦斯事故和提升运输安全性等方面的综合数据指标;第三主成分影响较大的指标为第九项和第十项, 是关于矿井灭火防御和电气灭火预防方面的;第四主成分系数较大的为第八项指标, 其主要是防治矿井当中水的指标。
4 结束语
结合综合评价函数X评价煤矿的安全性, 从而构建量化评价煤矿安全的目标模型。矿井安全程度与函数X呈正相关, 比较各项评价安全指标内X值的大小, 然后明确组成煤矿安全评价的相关因素, 评估其风险项目安全决策需要通过评价综合指标项目安全来实现。如果有关系较为复杂的多个影响因素时, 就不能很好地聚类或划分层次, 此时, 可以单独考虑各个因素, 然后再分析其主成分, 这样会有更好的效果。
摘要:通过分析煤矿安全评价打分数据, 利用多元统计分析方法制定了能够综合评价煤矿安全的数学函数模型, 明确了生产矿井各项指标的风险值, 最后达到了评价煤矿安全程度定量化的目标。如此一来, 减少了重叠的指标信息, 使评价指标变量与煤矿安全之间的线性关系得以建立, 简化了划分安全风险层次方面所用的层次分析法, 降低了处理煤矿安全评价数据的工作量, 从而为安全生产提供了更好的决策意见和管理方案。
关键词:安全评价,主成分分析,优化函数,通风设计
参考文献
【基于主成分分析法的扬州城市生态系统评价】推荐阅读:
金属化学成分分析06-24
独立成分分析方法综述09-22
基于matlab电力系统故障分析与仿真06-09
基于系统的设计与实现09-12
成分输血的护理10-30
基于信息传播系统的人员疏散模型探讨09-10
基于DEA方法的海洋科技效率评价研究06-28