因子分析和聚类分析在长江水污染综合评价中的应用(7篇)
1.因子分析和聚类分析在长江水污染综合评价中的应用 篇一
Q型主因子分析与聚类分析在柴达木盆地花土沟油田新近系砂岩储层评价中的应用
利用244口井的小层数据,尝试用Q型主因子分析与聚类分析相结合的方法对柴达木盆地花土沟油田新近系砂岩储层进行评价.为使评价结果定量化,以便利用评价结果深入分析储层储集性能及与沉积相的关系,提出如下处理方法:首先对由Q型主因子分析得到的各主因子得分进行归一化处理;然后用归一化得分与对应主因子的`方差贡献率相乘后相加,得到样本总得分.根据样本总得分,运用聚类分析,进行储层分级.对储层评价结果进行统计分析后认为,就储层储集性能而言,花土沟油田新近系下油砂山组明显好于上干柴沟组;辫状河三角洲前缘是最好的沉积亚相;河口坝是最好的沉积微相,其次为浊积砂与水下河道.研究表明,本文提出的储层评价方法具有定量化、地质意义明确等优点,有一定应用价值.
作 者:吕红华 任明达 柳金诚 李有利 L(U) Honghua REN Mingda LIU Jincheng LI Youli 作者单位:吕红华,任明达,李有利,L(U) Honghua,REN Mingda,LI Youli(北京大学环境学院,北京,100871)柳金诚,LIU Jincheng(青海油田分公司勘探开发研究院,敦煌,736202)
刊 名:北京大学学报(自然科学版) ISTIC PKU英文刊名:ACTA SCIENTIARUM NATURALIUM UNIVERSITATIS PEKINENSIS 年,卷(期): 42(6) 分类号:P61 关键词:储层评价 Q型主因子分析 聚类分析 新近系 柴达木盆地2.因子分析和聚类分析在长江水污染综合评价中的应用 篇二
《中华人民共和国国家标准城市规划术语》中认为城市化是“人类生产与生活方式由农村型向城市型转化的历史过程,主要表现为农村人口转化为城市人口及城市不断发展完善的过程”。城市化是一个系统的动态过程,包含了人口、经济、人文教育建设等各方面变化的影响。它是经济发展和社会进步的必然结果,反过来也推动了经济的发展和社会的进步。作为社会进步的重要标志之一的城市化,正成为中国区域经济不断增长的动力和源泉。然而不同城市的情况迥异,若仅从城市的人口生产总值来衡量,其结论肯定是片面的、狭隘的。正确评价我国城市现有的发展水平,多层次横向和纵向比较,对此具有重大的意义。
本文是通过主成分模型选取14个指标,对32个省会和直辖市做城市化水平的综合评价排名,再以主成分为依据对32个城市进行聚类分析,同时给出研究结论和政策建议。
1模型设计
1.1因子分析过程
(1)对搜集的数据进行标准化处理;
(2)确认分析的原变量是否适合作因子分析;
(3)构造因子变量;
(4)构造因子载荷矩阵。因子分析的基本模型如下:
其中Xi为原始变量,Fi为公因子。
1.2指标选取
14个指标为:x1客运量、x2货运量、x3固定资产、x4城乡居民储蓄、x5平均工资、x6固定资产、x7年末邮政局、x8消费品零售额、x9货物进出口、x10公共电车、x11剧场、x12普通高等学校、x13医院、x14执业。
2实证分析
2.1数据预处理
为消除量纲的影响,需对数据进行标准化处理。利用SPSS 19.0对各指标的原始数据进行标准化。
2.2因子分析
利用KMO测度值检验指标是否适合做因子分析。由结果知:KMO=0.856,说明适合做因子分析;Sig=0.000小于显著性水平0.05,则拒绝原假设认为变量间有相关性,可进行因子分析。在对标准化后的数据进行降维时,计算相关系数矩阵的特征根和特征根的方差贡献率及其累计方差贡献率。2.3因子得分的计算
由三个公共因子所对应的特征值和特征向量,得出因子得分函数的系数,在因子得分表达式的基础上,可获得综合得分表达式:
由计算知:上海、北京综合得分比较高,海口最低。且发现经济发展F1因子和综合因子得分走势类似,说明城市的综合水平中经济发展起了最大的作用,推动城市化需加大经济投资,促进经济增长。
3结论
通过对32个城市经济发展的因子分析,北京和上海应注意改善在第二、三主成分上的得分。对广州、武汉等,可通过打造有特色的核心竞争力,从而达到全方位的发展,而对中西部城市,三个因子得分均排名靠后,可贯彻落实西部大开发战略和中部崛起战略,缩小区域结构性发展不平衡,提高整体城市人才培养等方面加大投入。
参考文献
[1]国家统计局.中国统计年鉴.中国统计出版社,2014.
[2]李雪梅.主成分分析在区域经济分析中的应用[J].计算机工程与应用,2009,2,04-206.
[3]都沁军,于开宁.城市化水平评价的指标体系研究[J].统计与决策,2001(3).
3.因子分析和聚类分析在长江水污染综合评价中的应用 篇三
基于傅里叶变换红外光谱和聚类分析的真菌鉴别
摘要:傅里叶变换衰减全反射红外光谱法(FTIR-ATR)应用于微生物的快速鉴定及分类是近几年发展起来的一门新型技术.该文应用FTIR-ATR光谱法与聚类分析方法相结合对重要的植物病原真菌进行鉴别.在PDA玻璃纸平板上培养了来自14个属的17株真菌,用FTIR-ATR光谱法测其红外光谱,获得了分辨率高、重现性好的真菌红外谱图,分析主要吸收峰的.归属,确定了1800~1485,1485~1185与1185~900cm1三个分析灵敏区,并在此基础上进行了系统聚类分析,使所有测试菌株都得到正确归类.结果表明,傅里叶变换红外光谱技术具有快速、准确、易操作等优点,将成为微生物研究领域的一个重要工具. 作者: 柴阿丽 李金萍 石延霞 谢学文 李宝聚 Author: CHAI A-li LI Jin-ping SHI Yan-xia XIE Xue-wen LI Bao-ju 作者单位: 中国农业科学院蔬菜花卉研究所,北京,100081 期 刊: 光谱学与光谱分析 ISTICEISCIPKU Journal: SPECTROSCOPY AND SPECTRAL ANALYSIS 年,卷(期): , 30(11) 分类号: S642.2 关键词: 傅里叶变换红外光谱 真菌 衰减全反射 聚类分析 鉴别 机标分类号: O56 R37 机标关键词: 傅里叶变换红外光谱 系统聚类分析 真菌鉴别 Cluster Analysis Infrared Spectroscopy FTIR-ATR 衰减全反射红外光谱法 植物病原真菌 微生物 聚类分析方法 红外光谱技术 研究领域 快速鉴定 红外谱图 测试菌株 重现性 纸平板 吸收峰 分辨率 培养 基金项目: 国家(863计划)项目,国家自然科学基金项目,农业部园艺作物遗传改良重点开放实验室项目 基于傅里叶变换红外光谱和聚类分析的真菌鉴别[期刊论文] 光谱学与光谱分析 --2010, 30(11)柴阿丽 李金萍 石延霞 谢学文 李宝聚傅里叶变换衰减全反射红外光谱法(FTIR-ATR)应用于微生物的快速鉴定及分类是近几年发展起来的一门新型技术.该文应用FTIR-ATR光谱法与聚类分析方法相结合对重要的植物病原真菌进行鉴别.在PDA玻璃纸平板上培养了来自14个...4.因子分析和聚类分析在长江水污染综合评价中的应用 篇四
影响西部中心城市经济发展的因素繁多且复杂, 根据数据的准确性、可比性、易获取性、非重叠性、定量分析等原则, 从《中国统计年鉴 (2007) 》中选取8个具体指标构建西部中心城市经济发展评价指标体系, 并运用该指标体系对11个中心城市经济发展水平进行实证分析。这8个指标, 分别是:人均地区生产总值 (万元) —X1、工业增加值 (万元) —X2、地方财政预算内收入 (万元) —X3、固定资产投资总额 (万元) —X4、城乡居民储蓄年末余额 (万元) —X5、在岗职工平均工资 (元) —X6、社会商品零售总额 (万元) —X7、货物进出口总额 (万美元) —X8[2] (数据来源于《中国统计年鉴 (2007) 》, 原始数据中没有西藏的相关数据) 。
西部中心城市经济发展评价的基本步骤:
1. 因子分析过程。
本文使用SPSS (16.0) 软件作为统计分析工具, 先对8个指标的原始数据进行标准化处理 (消除量纲差异和数量级影响, ZX1表示的是原始指标X1经过标准化处理后对应的变量, 表1中其余各指标的含义如此类推, 变量值为负数, 表示低于该类指标的平均值, 正数则含义相反) , 并得到各指标之间的相关系数矩阵R (见表1) 。由相关系数矩阵可以看出, 指标之间既存在正负相关也存在强弱相关, 部分指标彼此之间存在很强的相关性, 说明指标之间反映的经济信息有很大重叠, 如果直接用于分析, 可能会带来严重的多重共线性。由表1可知, 指标间存在较强的相关性, 可用因子分析进行降维。其中统计为0.806, Bartlett球形检验显著性水平小于0.0001, 表明样本数量充足, 相关系数矩阵非单位阵, 故可以实施因子分析。矩阵特征值与累计贡献率如表2所示, 提取前3个因子即提取了样本93.784%的数据信息 (前3个特征值的累计贡献率为93.784%) 。提取的三个主成分的载荷矩阵见表3 (其中F1、F2、F3分别表示第1、2、3个公共因子, 星号 (*) 标注在较高的荷载值) 。
由表3可知, 第一个公共因子F1在ZX2 (工业增加值) 、ZX3 (地方财政预算内收入) 、ZX5 (城乡居民储蓄年末余额) 、ZX7 (社会商品零售总额) 、ZX8 (货物进出口总额) 5个变量上的荷载值都很大。城乡居民储蓄存款年末余额反映了居民的收入水平, 工业增加值反映了工业企业在一定时期内工业生产活动创造的价值, 是国内生产总值的组成部分。这些指标都是绝对指标, 反映了西部中心城市经济发展的规模大小, 属于宏观层面指标, 可定义为经济规模因子;第二个公共因子F2在ZX1 (人均地区生产总值) 、ZX6 (在岗职工平均工资) 2个指标上有较高的载荷, 人均地区生产总值反映的就是人民的富裕程度和生活水平, 是目前国际通行的经济发展的核心指标, 也是衡量全面小康社会最核心的一个指标, 在岗职工平均工资表明一定时期职工工资收入的高低程度, 是反映职工工资水平的主要指标。这两个指标都是相对指标, 反映了西部中心城市居民的富裕程度, 属于微观层面指标, 可定义为城市富裕因子。第三个公共因子F3在ZX4 (固定资产投资总额) 上的荷载较高, 该指标反映的是固定资产投资能力。因此可以定义为资产投资因子。由表3可知, 前三个主成分的因子得分表达式分别为:
由因子协方差矩阵表4可知, F1、F2、F3三个因子两两之间的协方差均为0, 表明任意两个因子之间没有线性相关, 实现了因子分析的设计目标。通过因子分析, 将8个指标变量降维成三个公共因子F1、F2、F3, 如表5所示。采用回归方法估计出因子得分, 以各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总, 得出各中心城市经济发展的综合得分F, 即
将各个中心城市的数据代入上述等式 (1) 、 (2) 、 (3) 后得到三大公共因子得分F1、F2、F3, 然后把F1、F2、F3代入等式 (4) 可得出各中心城市经济发展的综合得分F, 以这个综合得分F的大小进行排序, 就得到西部各中心城市经济发展的综合排名, 排名结果见表6。
2. 聚类分析过程。
聚类分析是以各种距离来度量个体间的“亲疏”程度的, 传统的聚类分析是在所选变量的基础上对样本数据进行分类, 分类的结果是各个变量综合计量的结果。系统聚类又称层次聚类, 是目前国内外使用最多的一种聚类方法, 其基本思想是先将所有样品看成一个类, 然后选择性质最接近 (距离最小) 的两类合并为一个新类, 接着计算新类与其他类的距离, 再将距离最近的两类合并, 这样直至所有的样品合并为一类。聚类过程中如果所选变量之间存在较高的线性关系, 能够相互替代, 则计算距离时同类变量将重复“贡献”, 将在距离中有较高的权重, 因而使最终的聚类结果偏向该类变量, 极大地影响了聚类分析的精度。集成后的因子聚类分析法, 不仅消除了聚类分析的数据输入中各变量之间的数量级和量纲影响, 同时还能剔除变量之间较强的线性关系[3]。
二、内涵分析
首先考虑分别按3、4、5类进行划分, 发现聚为4类较为合理, 最后得到各城市的具体类别 (见表6) 。结合各城市的三大因子得分和其具体类别, 分析其特征及内涵[4]:
1. 第一类中心城市的特点是宏观经济规模大, 工业生产对城市经济的贡献率高。
该类别包括成都和重庆2个城市, 它们的综合得分排名分别为1、2, 比较接近且很靠前, 它们在经济规模因子F1上的得分分别排在1、2, 在城市富裕因子F2上的得分分别排在3、10, 在资产投资因子F3上的得分分别排在2、3, 由此看出, 除重庆在城市富裕因子F2上的排名很靠后外, 第一类中的两个城市在三大综合因子的得分上都非常高, 而且很接近, 这说明第一类城市在经济规模、城市富裕、固定资产投资三个方面发展都较为均衡, 属于经济发展相对全面的城市。
2. 第二类中心城市的特点是宏观经济规模小, 工业生产对城市经济的贡献率低, 发展不平衡。
该类别包括西安、银川、南宁、兰州、贵阳、西宁6个城市。虽然西安的综合得分排在第3位, 按理说应该排在第一类中心城市, 但分析西安的三大因子得分可知:经济规模因子F1为0.50969, 与第一类中心城市成都F1得分1.65049、重庆F1得分2.09303相差太大, 不在一个级别上, 而且西安的富裕因子F2为-0.2258、资产投资因子F3为-0.16312, 均低于相应因子的平均水平, 因此无法进入第一类。其余5个城市三个公共因子F1、F2、F3的得分均为负数, 低于相应因子的平均水平, 其中, 西宁的规模经济因子F1得分、贵阳的城市富裕因子F2得分、南宁的资产投资因子F3得分均排在11个城市的末位。这些分析表明, 第二类中心城市从总体上看, 经济规模因子、城市富裕因子、固定资产投资因子三个方面发展都相对滞后, 经济发展不均衡。
3. 第三类中心城市的特点是城市富裕程度较高, 人口总量小。
该类包括了乌鲁木齐、呼和浩特、银川3个城市, 其综合得分排名分别为四、五、六位, 其富裕因子得分F3分别为1.40642、1.64892、0.64187, 排名分别为二、一、四位, 表明这三个城市的富裕程度较高, 而规模经济因子F1、资产投资因子F3得分相对较低。随着国家西部大开发战略的深入实施和政府出台的相关政策优势, 乌鲁木齐2006年人均GDP已突破4 000美元大关, 位居中国西部12个省会城市前列。呼和浩特作为中国著名的“乳都”, 在2007年发布的全球城市竞争力报告中, 位列2001—2005年五年中GDP增长世界前二十名。这些都表明该类中心城市的富裕程度较高。同时应该看到, 该类城市的人口总量较小, 也是导致城市富裕因子得分较高的原因之一。
4. 第四类中心城市的特点是固定资产投资额度大。
该类别只有昆明1个城市, 其综合得分排名为第六位, 其固定资产投资因子F3得分为2.960556, 排在第一位, 远高于其他10个城市的F3得分, 使得其他10个城市的固定资产投资因子F3的得分均为负数, 低于公共因子F3的平均值, 昆明的其他两个公共因子得分F1、F2得分都很低, 其综合得分排在第六位, 是综合因子得分F正负的分水岭。这也是昆明在聚类图中单列一类的原因。实际上, 昆明的固定资产投资总规模自2003年、2004年、2005年、2006年分别突破300亿元、400亿元、500亿元和600亿元的投资规模, 连年实现百亿“四级跳”。这些都表明, 固定资产投资的稳步增长是昆明城市经济增长的重要驱动力。
把三大公共因子得分作为聚类分析的输入, 剔除了传统聚类分析中指标之间的信息重叠, 提高了聚类分析的精度, 同时为聚类分析的结果提供了直观、精确的经济内涵分析范式, 有助于各城市从宏观规模因子、城市富裕因子、资产投资因子三个方面分析各自的优势和不足, 进而制定与自身适宜的经济战略方针, 为整体提升西部中心城市经济发展的综合实力提供决策参考[5]。
摘要:构建西部中心城市经济发展评价指标体系, 利用因子分析剔除多指标间信息重叠的特点, 在保留原始数据大部分信息的基础上, 通过有效降维, 提炼出三个具有代表性的公共因子, 并以此作为聚类分析的输入, 提高了分析精度, 所得结论与实际基本相符。
关键词:因子分析,聚类分析,城市经济,综合评价
参考文献
[1]林乐义, 印凡成.基于聚类分析和因子分析消除多重共线性的方法[J].统计与决策, 2008, (8) :153-155.
[2]中华人民共和国国家统计局.中国统计年鉴 (2007) [K].北京:中国统计出版社, 2007:258-336.
[3]薛薇.SPSS统计分析方法及应用[M].北京:电子工业出版社, 2007:153-200.
[4]李雪, 王莉华.基于聚类和因子分析的农村居民消费结构实证研究[J].辽宁石油化工大学学报:自然科学版, 2008, (6) :93-96.
5.因子分析和聚类分析在长江水污染综合评价中的应用 篇五
计量地理模型广泛的被运用在区域土地面积变化、地类的转换、土地利用强度及土地空间分布特征等方面,在土地数量结构分析上具有较好的效果。国内学者主要是基于不同的目的、尺度、侧重点和方法对土地利用分区研究,以建立评价指标体系为主要模式,并利用主要因素法、综合分析法、聚类分析法、叠置法、主成分分析法等对土地利用进行分区,其中以聚类分析法较为常见。因此,本文采用计量地理模型与聚类分析相结合,以西南地区地形地貌复杂、喀斯特地貌发育明显的贵阳市为研究区域。基于计量地理模型的静态分析法,结合多样化指数、洛伦兹曲线、集中化指数、土地利用程度综合指数、区域组合类型、区位意义等,对研究地区土地利用相关的数量结构进行数据分析,并以此为基础指标,采用系统聚类分析的方法对贵阳市的土地利用进行分区,对于本区域未来的开发建设具有重要意义。
1 区域概况
本次研究区贵阳市,在地理上它处于黔中山原丘陵中部,长江与珠江分水岭地带,总体地势西南高、东北低。而下属的10个区县即南明区、云岩区、花溪区、乌当区、白云区、观山湖区、开阳县、息烽县、修文县、清镇市等,面积总计8043.36km2,占整个贵州省面积的4.56%。贵阳市耕地和林地面积占其总面积的70%以上,但其中85.02%的地区为喀斯特地貌所覆盖,生态脆弱。2013年,贵阳市实现GDP2085.42亿元,全年固定资产投资1958.14亿元,总人口达到445.17万人。地形复杂、喀斯特地貌区脆弱的生态环境和水土流失是影响该区域可持续发展的重要问题。因此,如何对该研究区域土地利用空间结构进行合理分区具有显著的研究价值和研究意义。
以贵阳市2013年土地利用变更调查数据为基础数据,以土地利用现状分类(8大类)作为分类标准,结合贵阳市土地利用现状特点,划分土地利用类型。以此为基础,分析贵阳各市(州)的土地利用结构。其他社会经济数据均来自于2013年《贵阳市统计年鉴》、《贵阳市国民经济和社会发展统计公报》。
2 研究方法
2.1 计量模型分析方法
当前较常用的土地计量地理分析方法主要有两种,一种是采用包括土地利用多样化指数、土地利用组合类型、土地利用集中化指数、土地利用区位指数等静态分析的方法;另一种是采用土地利用动态度、土地利用信息熵、土地利用程度指标等动态分析方法。
结合当前学者的一些研究,综合考虑分析的需要,选取土地利用多样化指数、集中化指数、组合类型、区位指数等数量结构分析方法以及土地利用程度、土地利用集约度指标,将土地利用现状分类(8大类)数据作为基础数据,分析贵阳市土地利用数量特征。
2.1.1 多样性指数分析。
土地数量结构多样化指数分析是对区域内各种土地的齐全程度、多样化状况以及人们对土地利用的干预程度进行定量的评估。吉布斯-马丁(Gibbs-Martin)多样化指数作为较为常用方法来度量土地利用多样性的程度,其模型为:
其中,GM为多样化指数,fi为第i种土地利用类型的面积。当某区域只存在一种土地利用类型,其多样化指数为0;当某区域均匀的分布土地利用的各种类型,其多样化指数则为1。为了能够简明的反映贵阳市区土地利用结构的区域差异,本文在以往研究的基础上将多样化指数划分为高中低3个等级:高>0.7;中0.6-0.7;低<0.6。
2.1.2 土地利用结构集中度分析。
(1)土地利用洛伦兹曲线。首先根据将各地区各地类面积百分比由大到小按顺序排列,然后计算累计面积百分比并绘出洛伦兹曲线(图1)。(2)集中化指数。用于分析各区域内土地利用的集中程度,用集中度表示,公式为:
式中,Ii为第i区域土地利用结构的集中度;Ai为第i区域各种土地利用类型累计百分比之和;M表示土地利用类型完全集中为一种类型时的累计百分比之和,此处为M=1000;R为贵阳市各种土地利用类型累计百分比之和,此处R=894.96。根据表1计算得出贵阳市土地利用结构的集中度(见表2)。
2.1.3 土地利用结构集约程度和综合效益分析。
从人口密度、地均固定资产投资、地均GDP指标来分析贵阳市2013年各区县的人口空间分布、土地集约利用程度以及土地利用的综合效益。
2.1.4 组合类型分析。
本文采用威弗-托马斯(Weaver-Tomas)组合系数法,计算区域土地的假设分布类型,将土地的实际分布与假设分布作对比分析,再通过逼近实际分布,得到一个最接近实际分布的土地分布类型,该组合即被看作是该区域土地组合类型。土地利用组合类型的多少可以反映区域土地整体功能的强弱。公式为:
式中:N为土地利用类型组合系数;Tij为假设分布土地利用类型的百分比;tij为实际分布土地利用类型的百分比。
2.1.5 区位意义。
采用区位指数可反映某一地区各种土地相对于高层次区域空间的相对聚集程度,区位指数是综合性指标,计算公式为:
式中,Qi为i区域的区位指数,fij为第i区域内第j类土地利用类型面积,Fi为贵阳市内第i类土地的面积。若Qi大于1,则该种土地具有区位意义,若Qi小于1,则区位意义不大或不具有区位意义。
2.2 土地利用计量模型计算
根据上述各指标公式和土地利用分类数据计算贵阳市10个区县的土地利用数量结构,得出贵阳市土地利用的多样化指数、集中度、综合指数以及组合类型(表2),贵阳市各区县土地利用区位指数(表3),土地利用的洛伦兹曲线(图1)。
2.3 土地利用计量模型分析
2.3.1 土地利用结构的多样化指数分析。
如表2所示,贵阳理论上能达到的多样化指数为0.857,而实际是0.70,差距不大,这表明了贵阳土地利用多样化程度总体较好。各地的多样化指数则是在0.65~0.76之间,其中最高的是南明区,最低的为开阳县,两者之差为0.11,表明多样化程度在区域上差别不大。从分级标准来看,达到了高水平的地区有:南明区、花溪区、白云区、观山湖区、清镇市,其余各区县为中等水平。
2.3.2 土地利用结构集中度分析。
土地利用类型的洛伦兹曲线越接近均匀分布线(对角线)说明其分布越均匀,即各土地利用类型面积越接近。如图1所示,云岩区土地利用类型的洛伦兹曲线离均匀分布线最远,表明其土地利用类型分布集中性最强;南明区土地利用类型的洛伦兹曲线离均匀分布线最近,表明南明区土地利用类型分布最均匀。各区(县)土地利用结构集中化指数由大到小为:云岩区>开阳县>乌当区>息烽县>贵阳市>花溪区>清镇市>白云区>观山湖区>南明区。通过比较,可以看出花溪区、清镇市、白云区、观山湖区、南明区的土地利用集中化程度低于贵阳市的平均水平。
2.3.3 土地利用综合指数分析。
如表2所示,贵阳市人口密度为562.19,地均固定资产投资为2423.48,地均GDP为2592.72。从这三项指标来看,各项指标均高于贵阳市平均水平的区县分别包括南明区、云岩区、花溪区、白云区、观山湖区。可见这些地区是贵阳市人口集中、经济发达的地区。
2.3.4 土地利用组合类型分析。
如表2所示,贵阳市各区(县)土地利用组合类型为2~3类不等。多数地区为两种组合类型,其中,除云岩区为林地+城镇村及工矿用地的组合类型以外,其他为耕地+林地的组合类型,比较单一;南明区、白云区、观山湖区为三种土地组合类型,且均为耕地+林地+城镇村及工矿用地。综合看来,符合贵阳市以耕地+林地为主的组合类型。
2.3.5 土地利用类型区位意义分析。
如表3所示,从耕地、草地和其他土地区位指数上看,除了云岩区显示出的较低值以外,其他地区分值差不大于1,因此全市各地区耕地、草地、其他土地资源分布较为均匀,但是整体数值均不高,这表明耕地和草地在贵阳市土地利用类型中的区位意义不显著,后备资源较充足,开发潜力大;从园地区位指数上来看,一半以上地区分值大于1,这表明,贵阳市的园地资源分布广,且分布均匀,聚集程度高,该资源在全省具有明显的区位意义;各地区在林地和水域及水利设施用地的分值呈现总的分布较为均衡;城镇村及工矿用地、交通运输用地区位指数大于1的地区包括南明区、云岩区、花溪区、白云区、观山湖区,其中,云岩区的城镇村及工矿用地分值为6.19,远远超出其他地区,可见其聚集程度高,具有显著的区位意义。
3 基于指标测度的土地利用聚类分区
层次聚类方法(hierachical clustering methods),其基本思想是:先将n个样品各自作为一类,然后规定各类之间的距离,再进行逐级合并,直至所有的样品都成一类。本文主要借助SPSS软件,采用平方欧氏距离测算,得出指标变量关系的近似矩阵,通过近似矩阵分析各个区县之间存在的相似性。这里不需要规定分类的标准和类别数,只是比较客观地从数据自身出发进行分类。
3.1 贵阳市土地利用分区
综合土地利用类型的测度结果,并参考贵阳土地资源利用的具体情况,参照以下三个原则,进行分区。一是,根据分区在同一区域内的自然条件、社会经济条件、土地利用结构特征上的相似性原则;二是,集中连片的区域共轭性原则;三是,科学实用性原则。
本文选取多样化指数、集中化指数、地均GDP、区位指数等指标作为贵阳市土地利用分区聚类分析的基础数据(见表2、表3)。通过聚类分析,对贵阳下辖10个政区单元之间的相似性进行计算,得出结果见图2。
3.2 分区结果分析
根据聚类分析的结果发现,在类间距离为10时,研究区域可以被分为如图3所示的3类情况:
(1)中心城优化发展区:云岩区。该区域作为贵阳市的政治经济中心,与贵阳市相比,人口密度占全市的51%;地均GDP是贵阳市的13倍,占41%;固定资产投资是贵阳市的21倍,占60%,综合指数明显高于其他区域,经济发达。土地多样化程度低,集中度高,土地组合类型过于单一,城镇村及工矿用地所占的比重和区位意义分值远超其他地区。同时由于本区人口密度大,人均耕地、草地、其他土地面积较少,土地后备资源较为不足。因此,在未来发展过程中,提高土地利用效率和优化土地利用结构就成为重中之重。改造旧城和低效用地,充分挖掘城市的可利用空间,从而实现土地的高效集约利用以及合理布局;在发展过程中应科学规划,进行三大产业的合理迁移,分散人口、交通压力。另外,鉴于此区域发展程度相对较高这一情况,在未来发展过程中还应注意城市的人口生态承载力是否超出,以便于实现城市生态环境、人口、资源的可持续发展。
(2)工业重点发展区:南明区、花溪区、白云区、观山湖区、清镇市。与贵阳市相比,区域总面积占贵阳市面积不到40%,但是建设用地比例占55%以上,人口密度占41%,地均GDP占36%,固定资产投资占51%。经济较为发达,人口也较为集中,不仅有较好的建设用地基础和较好的交通条件,且具有一定的后备土地资源,该区域开发潜力十分巨大。综合以上分析发现,本区域具备一定的社会经济发展基础,可以作为中心城优化发展区的扩展区,不仅可以分散部分人口交通压力,还能带动区域经济进一步的发展,在未来发展过程中,应作为工业的重点发展区域。
(3)生态农业、旅游发展区:乌当区、息烽县、开阳县,修文县。从综合指标来看,本区域与贵阳市相比,人口密度占全区的8%、地均GDP占9%、固定资产投资占4%,均呈现较低值,说明土地利用的经济产出水平呈现较低的趋势。而该区域所表现出的土地利用多样化高、集中化低的特点,又说明土地利用较为分散。本区域耕地、园地、林地均占贵阳市各地类面积的60%以上,尤其其他土地占70以上。因此,在今后的发展中各县市应根据各自的经济情况和农业、产业结构和区位特点,发展特色农业,利用区域的生态自然资源,大力发展生态旅游业。
4 结论
本文采用了计量地理模型,对贵阳下属10个区县的土地利用情况进行了分析,结合贵阳实际情况,将得出的土地利用的多样化指数、集中化指数,以及地均GDP、区位指数等指标,作为聚类分析的基础数据。采用系统聚类的方法,将贵阳土地进行分区。最终分为三类:中心城优化发展区、工业重点发展区和生态农业、旅游发展区。
研究发现,贵阳市经济发展水平较高地区存在较严重的人地矛盾,而经济水平较低地区存在较大用地空间,综合来看地区发展极不均衡,当前发展模式对贵阳土地可持续利用是极为不利的。考虑各区域的发展情况,中心城优化发展区应提高效率、挖掘用地潜力、分散人口和交通压力、注重生态环保;工业重点发展区具备一定的资金和用地条件,应作为将来的重点发展区域;生态农业、旅游发展区则应根据当地农业、产业、区位等特色,有重点地发展生态农业和旅游产业。
摘要:在土地利用的规划工作中土地利用分区扮演着重要的角色,同时也是其中的重要组成部分。为了使贵阳市的土地利用更加科学合理化,基于贵阳市2013年变更调查数据,运用计量地理模型和现代地理信息空间分析技术相结合方法,对贵阳市及其周遭的10个区县的土地利用结构实行指标测度。基于计算结果并借助SPSS软件进行空间聚类,得出贵阳市土地利用分区情况。把聚类分区结果与各区县的具体情况相结合,该区域可被分为3类:1云岩区属于中心城优化发展区;2南明区、白云区、观山湖区、花溪区及清镇市属于工业重点发展区;3乌当区、开阳县、修文县及息烽县属于生态农业和旅游发展区。研究发现贵阳市经济发达地区呈现土地多样化程度低、集中化水平高、土地组合类型比较单一和人地矛盾突出等状态,而其余经济水平较低的地区则存在很大的用地空间。
6.因子分析和聚类分析在长江水污染综合评价中的应用 篇六
1 人力资源状况指标体系的构建
按照科学性、系统性、可操作性等原则,结合人力资源状况的自身要求,本文从人力资源数量、质量、潜力和分布4个层面,选取了16个具体指标来衡量和描述各地区的人力资源状况。
(1)人力资源数量指标:X1:人口数量,X2:人口自然增长率,X3:人口自然死亡率;
(2)人力资源质量指标:X4:城镇人口比重,X5:成年人口比重,X6:社会抚养系数,X7:高等学历人口比例,X8:文盲率;X9:高等院校数量,X10:每10十万人口高校在校人数;
(3)人力资源潜力指标:X11:教育经费支出额,X12:教育支出占财政支出比例;X13:每10万人口小学在校人数,X14:每百人图书藏书量;
(4)人力资源分布指标:X15:第二产业从业人员比例,X16:第三产业从业人员比例。
2 相关数据分析
选取我国31个省(自治区、直辖市)2008年相关指标的数据(不包括我国的香港、澳门场区和台湾省)作为样本[7],首先运用SPSS17.0统计软件对数据进行了归一化和无量纲化处理,然后采用因子分析法对人力资源状况指标进行描述,再采用综合评价的方法得到各个省区人力资源状况的综合得分并进行聚类分析。
2.1 因子分析
2.1.1 数据的归一化和标准化处理
首先搜集全国31个省区所分别对应的16个指标的数据,形成原始的数据矩阵(限于篇幅、原始的数据矩阵从略)。然后将人口自然死亡率、社会抚养系数和文盲率3个逆指标进行正向化处理(本文采用取逆指标倒数的方式),再运用SPSS17.0软件对样本数据进行标准化处理。
2.1.2 KMO和Bartlett’s球形检验
运用SPSS17.0软件对样本数据进行KMO以及Bartlett’s球体检验,得出KMO检验值为0.787>0.7;卡方统计值的显著性水平为0.000<0.000 1,说明样本数据满足因子分析条件。
2.1.3 提取公因子
采用主成分法提取公因子,从原始数据中提取的前4个公因子的特征值累积总方差贡献率达到85.697%,可以用这4个主成分(分别用F1、F2、F3和F4表示)来替代原来16个指标对各地区人力资源状况进行衡量,如表1所示。
2.1.4 因子旋转和公因子的命名
原始变量的信息在4个主成分中比较分散,难以进行公因子的分析,因此采用方差最大旋转法对因子进行旋转。经过7次旋转之后的因子结构得到了有效简化,公因子的荷载量出现了明显的分化趋势,如表2所示。
主成分F1在社会抚养系数、成年人口比重、人口自然增长率、每10万人口小学在校人数和文盲率等指标上具有较高的荷载量。这5个指标主要反映的是人口持续性和负担能力的情况,因此将F1定义为“人口持续性和负担能力因子”。
主成分F2在高等学历人口比例、每百人图书藏书量、城镇人口比重、第三产业从业人员比例和每10万人口高校在校人数等指标上具有较高的荷载量。这5个指标主要反映的是文化性因素对人力资源质量的影响,因此将F2定义为“文化支持条件因子”。
主成分F3在教育支出占财政支出的比例、教育经费支出额、高等院校数量、人口数量、第二产业从业人员比例等指标上具有较高的荷载量。这6个指标主要反映的人口基础性因素和社会物质条件对人力资源质量的影响,因此将F3定义为“人口基础和财政支持因子”。
主成分F4在人口自然死亡率指标上具有较高的荷载量。将F4定义为“人口持续能力”因子。
2.2 人力资源状况数值的计算
根据表3所示的因子得分系数矩阵,可以得到人力资源状况的原始因子得分系数,进而计算出这4个公共因子的具体得分。
每个主成份的权重以各自的因子方差贡献率占总体累积贡献率的比重来确定。可以得到各省市人力资源状况的综合得分公式为
将4个主因子的具体得分代入公式(1),再将各因子标准化数值代入,即可以得到我国31个省市区人力资源状况的总体评价值(用Si表示,i=1,2,3,…,31),如表4所示。
2.3 我国人力资源总体水平的地域聚类分析
为了便于分析各地区人力资源状况的相同点和不同点,更加确切地描述我国的人力资源状况,在综合评价的基础上,利用4个主因子做进一步的聚类分析。聚类方法采用Ward法,以欧氏距离平方法(squared euclidean distance)作为度量区间标准,如图1所示。
通过反映聚类结果的树形图,可以看到我国各省区人力资源状况的聚类状况。以15为界,将31个省区的人力资源状况分为四大类。
第一类为上海、北京和天津3个直辖市。在人力资源文化支持因子上的绝对优势地位,表明这3个市的人力资源潜能已得到较好的利用,并转化为人力资本投入到经济社会发展之中。
第二类有4个省区:吉林、黑龙江、内蒙古和辽宁。东三省和内蒙古自治区在人力资源的文化支持因子上的得分处于全国中等偏下水平,但是在人口持续性和负担能力因子上的得分处于全国最高水平,展现了人力资源发展的巨大潜力。
第三类涵盖了东中西三大区域的16个省区,分别是河北、山东、河南、湖北、湖南、陕西、四川、江苏、浙江、山西、广西、福建、江西、安徽、重庆、广东。其中山东、河南、四川等人口大省在人口总量上的优势较大;浙江、广东和福建在文化支持因子和财政支持因子上的得分很高;安徽、江西、山西和重庆四省市在人力资源各因子上的得分较为均衡,但人力资源总体水平处于中等偏后的位置;广西在总得分和各因子的得分上都处于落后地位。
第四类有海南、宁夏、新疆、云南、贵州、甘肃、青海、西藏8个省区。除了个别省区在某个因子上的得分较高以外,该类所有省区在各个因子中的得分和人力资源状况总体得分都处于全国落后地位,人力资源开发的任务最为艰巨。
3 结论与建议
将我国31省区人力资源状况因子分析的综合得分和聚类分析分类结果相结合,可得出如下5点结论。
3.1 人力资源总体状况受多种因素的综合影响
人力资源总体状况受到人口数量、文化支持条件、人口持续性和人口负担负担能力等多种因素的综合影响。其中,人口数量是人力资源水平的基础性影响因素;文化支持和财政支持是人力资源开发的重要手段;人口持续性和人口负担能力则是人力资源发展潜力的重要体现。
3.2 区域之间人力资源发展水平存在巨大差异
第一类地区的京津沪三市平均人力资源总体得分为1.220 4,远远高于其他3个地区的得分。虽然第二类中四省区的第一主成分得分在全国所有省区中处于领先地位,但其平均综合得分尚不及第一类地区的一半。与第一、第二类地区相比较,第三类地区的人力资源总体平均得分更小(-0.068 55),其中不乏山东、四川、河南等人口大省。第四类地区在人力资源的各项指标上基本全处于落后地位,与其他省份相比各方面的差距最为悬殊。
3.3 区域内部省区之间人力资源状况也存在较大差异
第一类地区中,上海市在文化支持因子上的得分几乎是北京和天津两市水平的两倍,北京的人口持续能力得分则远远高于津沪两市。第二类地区中内蒙古在财政支持因子上的得分低于其他三省的相关分数。第三类地区中处于领先地位的湖北与处于落后地位的广西在人力资源状况总体得分上的差距达到1.009 5;山东、四川、湖北等省份在人口基础因子上处于优势地位,而广东、福建、浙江等省份则在财政支持因子上的得分较高。第四类省区中海南和宁夏在文化支持条件和人口自然死亡率指标上的得分较高,而新疆和西藏则在人口自然死亡率上处于较高水平。
3.4 人力资源向人力资本的转化不足
当前我国人力资源数量较大,但是多数省区的人力资源数量优势尚未转化为人力资本优势。在人力资源总体水平得分较高的东三省和内蒙古自治区,人力资源基础较好,但是与第一类的京津沪相比,在人力资源的文化支持、财政投入和人口结构合理性水平上明显落后,人力资源开发和利用水平有待提升。山东、河南、湖北、湖南、四川等其他人力资源大省的人力资源总体得分仅处于第三类,它们在人力资源开发利用上的任务十分严峻。
3.5 人力资源状况与经济发展水平存在较强的相关性
按照地区经济发展程度的分类,我国经济发达地区包括北京、上海、天津3个市,这与本文分析得出的人力资源总体聚类状况完全吻合;经济较发达和经济欠发达地区包括广东、福建、江苏、四川等18个省区,总体与人力资源总体状况的二类和三类地区的划分较为吻合;经济落后地区包括西藏、青海、新疆等9个省区,与本文人力资源总体发展状况四类的划分基本吻合。以上现象表明区域人力资源总体状况与当地的经济发展水平有较强的正相关性。
京津沪等地区具有相对充足的人力资源储备和丰富的人力资本开发经验。一方面要保持人力资源数量的持续性,进一步优化人口年龄结构;另一方面应继续推进人力资本的开发,增加高精尖人才的储备,打造具有国际竞争力的人才队伍;同时还应注重战略性人力资源管理[8],以获取和维持可持续竞争优势。
第二类地区和第三类地区部分省区虽然已有一定的人力资源储备,但人力资源开发利用状况尚处于较低水平。故应利用这类地区已有的人力资源基础,在教育和财政方面加大人才的培养和开发,创新用人机制,尽快将人力资源优势转化为人力资本优势。
第三类地区中的四川、重庆、广西等省区和第四类全部省区同属于西部地区,要改善这些省区的人力资源状况,一方面要继续加大对西部地区的财政扶持和政策倾斜,鼓励和号召东中部人才到西部去;另一方面应重视对西部地区当地人力资源的开发,提高当地的人力资源储备,建立人才利用的长效机制。
参考文献
[1]徐莉,王芬.我国31个省(自治区、直辖市)区域人力资本的样本聚类实证分析[J].科技进步与对策,2006(1):19-72.
[2]许晓红.关于西部地区人力资源开发的研究[D].天津:天津工业大学,2006:24-33.
[3]赵军平.东北地区人力资源开发与区域经济增长的关系研究[D].长春:东北师范大学,2008:17-22.
[4]刘文,罗润东,房光婷.人力资本在环渤海区域经济增长中的作用[J].商业研究,2009(10):48-50.
[5]刘新荣.泛珠三角区域人力资源合作开发研究[J].暨南学报:哲学社会科学版,2009(4):69-73.
[6]宋美丽,孙健.区域人力资本投资水平研究:基于山东17地市的数据分析[J].经济问题,2010(2):125-128.
[7]国家统计局.中国统计年鉴2009[M].北京:中国统计出版社,2009:39-111.
7.因子分析和聚类分析在长江水污染综合评价中的应用 篇七
1文献综述
近年来,国内学者对我国地区工业强省战略和综合发展水平进行了个案研究和对比研究,具有以下几个研究特点和不足: ( 1) 侧重于对工业强省战略的必要性、可行性和实现途径等方面的个案研究,但定量研究不足。如阮正福[1]( 2001) 、 张瑾[2]( 2004 ) 、 林凌[3]( 2006 ) 、 林琳[4]( 2010) 、徐一平[5]( 2012) 、毛光烈[6]( 2013) 等分别对江西、甘肃、四川、贵州、江苏、浙江等省的工业强省战略进行了初步探讨。 ( 2) 基于经典工业化理论的工业化水平研究。主要依据Chenery的人均收入6阶段、Kuznets的产值和就业结构5阶段、W. G. Hoffmann工业结构4阶段等理论,单独或综合利用人均GDP、城镇化率、非农产值占比、三次产业就业结构、劳动生产率等指标进行测算评价。代表性的学者有郭克莎[7]、 崔向阳[8]( 2003) 和陈佳贵、黄群慧、钟宏武[9]( 2006) 等。但由于所运用的理论不一样,在判断同一地区的工业化程度时,往往得出相差甚远的结论,使理论对实践的指导作用大打折扣[10]。 ( 3) 基于新型工业化特征的工业竞争力比较研究。南振兴[11]( 2004 ) 、 林秀梅[12]( 2007 ) 、 唐浩[13]( 2014) 等,从工业化评价指标和体现新型工业化 “新”的指标这两个角度来进行,但在体现新型工业化 “新” 的指标方 面却存在 较大的差 异[14]。( 4) 部分研究方法不够客观和准确。如魏后凯、吴利学[15]( 2002) 采用主观赋权法进行综合得分计算,具有较大的主观随意性。陈璐璇[17]( 2007) 在进行SPSS分析时将因子分析错误地当做主成分分析。特别是,大多数指标体系缺失竞争主体 ( 大企业) 、竞争新业态 ( 产业集聚) 、品牌、“两化”融合指数等衡量工业制造竞争力的重要指标,难以较全面、科学地体现各省工业发展的 “强”度水平。
2工业强省综合评价指标体系的构建
当前,我国仍处于工业化进程中,经济发展进入新常态,正从规模速度型粗放增长向质量效率型集约增长转变,加快工业转型升级是新型工业化的内在要求和实现工业大国向工业强国转变的必由之路。工业强省指标体系的构建不仅要体现科技含量高、经济效益好、资源消耗低、环境污染少、人力资源优势得到充分的新型工业化的基本内涵,而且要体现 “创新驱动、质量为先、绿色发展、结构优化、人才为本”的制造强国的基本方针。为此,以 《中国制造2025》、《中国的工业大国国情与工业强国战略》[18]提出的工业强国关键指标为参考,结合经典工业化理论和已有研究成果,按照科学性、系统性、可行性、可比性和简洁性原则,建立包括规模质量、结构优化、技术进步、工业化程度和资源环境5个一级指标13个二级指标的工业强省评价指标体系 ( 见表1) 。与已有研究相比,本指标体系具有3个特征: ( 1) 突出了企业、品牌、产业集聚和科技创新在现代工业发展和竞争中的重要作用。 ( 2) 全部采用结果导向指标,防止不同层面指标的并列。 ( 3) 既能反映地区工业化进程,又能体现规模竞争力和技术进步水平,能比较全面地衡量地区工业发展的综合水平。
3基于因子分析法的工业强省指数的计算
3.1数据来源及说明
本文的数据主要来源于2014年 《中国统计年鉴》和各省统计年鉴,部分数据来自有关部门及权威机构的研究。其中: 高新技术产业主营业务收入采用2014年 《中国高技术产业统计年鉴》。中国制造业500强根据中国企业联合会、中国企业家协会颁布的 《2014年中国制造业500强名单》整理; 中国品牌500强根据 《品牌观察》杂志揭晓的 《2014年中国最有价值品牌500强榜单》整理,剔除了房地产、金融、教育、珠宝等服务品牌之后,共426强。“两化”融合指数采用中国电子信息产业发展研究院发布的 《2014年中国两化融合发展水平评估报告》。工业能源产出率根据2012年各省规模以上工业能源量除以工业增加值计算,其余均为2013年数据。装备制造业包括通用设备、专用设备、交通运输设备、汽车制造、电气机械及器材、通信设备、 计算机及其他电子制造等7个行业。
3.2因子分析
因子分析是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,并使因子具有一定的命名解释性的多元统计分析方法[19]。本文13个指标之间存在较强的依赖性和相关性,为此选择利用SPSS22. 0因子分析法进行降维分析 ( 限于篇幅,部分图表略) 。
3.2.1因子分析适宜性检验
对标准化后的数据进行KMO检验和巴特利球型检验,Bartlett球形度检验的统计量为417. 306,相伴概率P接近0,远小于显著性水平0. 05,应拒绝各变量独立的假设。同时,KMO值为0. 846 >0. 8,比较适合做因子分析。
3.2.2因子提取
采用主成分法提取公因子和选取大于1的特征根,并以正交旋转法进行因子旋转。表2总方差解释显示,前3个公因子的特征根分别为7. 727、 1. 673和1. 426,特征根均大于1; 旋转后的方差贡献率分 别为29. 57% 、28. 465% 和25. 247% , 方差累积贡献率达到83. 282% ,故选取前3个公因子基本可以描述全部变量。
提取方法: 主成份分析。 旋转方法: Kaiser 标准化最大方差法。
3.2.3根据因子载荷矩阵进行因子命名
表3旋转后的成分矩阵表明,主因子F1在X7、X4、X8、X13和X5等变量上具有较高的载荷,这些变量均与工业技术进步紧密相关,命名为 “技术进步因子”。主因子F2在X10、X11、 X1和X12等变量上具有较高载荷,这些变量除X1外均是经典工业化理论衡量工业化程度的常用指标,命名为 “工业化进程因子”。主因子F3在X2、X6、X3和X9等变量上具有较高的载荷,主要反映工业规模和竞争力,命名为 “规模竞争力因子”。
3.2.4计算因子得分和综合得分
采用回归分析法计算各省在工业 “技术进步因子”、 “工业化进程因子” 和 “规模竞争力因子”上的得分。3个公因子的得分系数函数如下 ( 限于篇幅,因子得分系数矩阵略; 这里的ZXi是Xi的标准化数据) :
因子得分有正、有负。正值表示高于平均水平,负值表示低于平均水平。单一因子,无法反映总体水平。为此,以各公因子的方差贡献率为权重计算综合得分,记为F,结果报告在表4中。计算公式为:
3.3工业强省指数的计算
为了便于观察和理解,将F1、F2和F33个因子得分进行标准化处理,转化为0 ~ 100的指数, 并根据各因子涵义,将其称之为工业技术进步指数、工业化程度和规模质量指数。标准化公式为:
其中: FZ1、FZ2和FZ3分别为工业技术进步指数、 工业化水平指数和工业规模质量指数。同样,对综合得分F进行标准化处理,得到工业强省的综合指数FZ,并按照综合指数大小进行排序 ( 详见表4) 。
从综合指数来看,我国地区工业强省的综合指数平均为37,地区结构总体呈典型的 “金字塔” 型。工业强省 ( 综合指数≥60) 7个,依次为广东、 上海、北京、江苏、浙江、天津、山东,均属于东部沿海地区; 中等水平省11个 ( 60 > 综合指数≥ 36) ; 欠发达省13个 ( 综合指数 < 36) ,其中最不发达省8个 ( 综合指数 <10) ,依次为甘肃、西藏、云南、新疆、青海、海南、宁夏和贵州,除海南外均为西部省份。
从空间布局特征来看,我国工业发展具有明显的 “东强西弱”梯度发展趋势 ( 见图1) 。东部综合指数平均为65,分别比东北、全国、中部和西部, 平均水平高出31、33、33和48。西部规模质量指数、工业化指数、技术指数、综合强省指数平均为18、25、29和24,分别比全国平均低26、31、17和25。中部综合指数和技术进步指数与全国基本持平,工业规模质量指数比全国平均水平高5,工业化指数比全国平均低9。东北作为我国的老工业基地,工业化水平高出全国平均水平7,但技术进步指数比全国低11,其余与全国基本持平。
从三大指数来看,我国工业技术、规模和工业化进程具有不同步性和非均衡性特征 ( 见图2) 。从总体来看,全国工业技术进步、工业化进程和规模质量指数均值分别为29、31和37,离散系数分别为0. 72、0. 724和0. 645,这表明我国工业技术进步整体滞后于工业化进程和产业规模扩张,工业化的地区差异相对较大,产业规模的地区差异性相对较小。从规模质量指数来看, 山东、浙江、江苏、河北、广东为我国工业前五强,西藏、海南、青海、北京、宁夏为最后5位。 从技术进步指数来看,广东、北京、重庆、上海、 西藏为全国前五强,内蒙古、宁夏、河北、青海、 新疆为全国后5位。从工业化进程指数看,天津、 上海、北京水平最高,已进入后工业化阶段,西藏、云南、海南、贵州工业化水平最低。
从工业强省特征来看,七大工业强省具有规模大、企业强、品牌强、技术强、产业集群强、 软实力强等基本特征。七大工业强省拥有34% 的国家新型工业化示范基地、40% 的规模以上工业增加值、59% 的中国制造500强、63% 的中国制造品牌500强和70% 的高新技 术产值,人均GDP、人均工业增加值、每万人拥有有效发明专利数和能源产出率等主要指标均居全国前列或全国平均水平之上。
4分类及对策建议
为将我国工业划分成适宜的几种类型,首先以 “规模质量指数”、“工业化进程指数”、“技术进步指数”和 “综合指数”为自变量,运用类平均法,选择欧氏平方距离进行系统聚类分析,将其分为4类 ( 如表4) 。考虑到第四类24个省份在工业规模、技术、工业化程度和综合实力上具有较大差异。为此,利用同样的方法和变量对这24个省再次进行系统聚类分析,经比较分析将第4类再细分为工业中等水平、欠发达、不适宜工业化3个类别比较合适。经过两次聚类分析,最终将我国各地区工业分为两大类6小类 ( 如表5) ,分别标记为类Ⅰ、类Ⅱ、类Ⅲ、类Ⅳ、类Ⅴ 和类Ⅵ,依次命名为综合强省、工业化强省、规模强省、中等水平省、欠发达省和非工业化省 ( 注: 非工业化省本质上也属于欠发达省,但因其特殊单独归类) 。其中,前3类为工业强省, 后3类为工业弱省。
第一类: 综合强省。广东规模、技术和综合实力在全国竞争优势突出,但工业化程度滞后。 值得注意的是,广东工业化进程指数低于全国平均水平,这可能与广东的城镇化水平低估 ( 部分流动人口尚未纳入城镇人口) 和区域差距大 ( 东西两翼与粤北地区远远落后于珠三角) 有关。为此,广东要抓住新一轮技术和产业革命契机,盘活存量和扩张增量相结合,全面启动新一轮制造业升级和提速发展,探索发展二、三产业 “无缝式链接” 的新型制造业形态,继续实施 “双转移”战略,加速两翼和粤北地区工业化和城镇化协调发展,强化制造强省地位。
第二类: 工业化强省。上海、天津、北京3个直辖市已进入后工业化阶段,工业技术和综合实力较强,但规模较小。对于这些工业化高级地区,工业比重下降和服务业比重上升是必然趋势, 为此要突出人力资源和技术优势,突出制造业和服务双轮驱动战略,强化创新驱动战略,瞄准高端化、智能化、网络化和服务化发展方向,努力建设创新型工业强省,加速实现工业现代化。
第三类: 规模强省。江苏、浙江、山东是我国的三大工业重镇,工业化程度相对较高,规模和整体实力强,部分技术水平全国领先。当前, 要把创新驱动摆在更加突出的位置,大力推进信息化与工业化深度融合,改造提升传统优势产业, 大力发展先进制造业和生产性服务业,加快推动工业转型升级,实现工业大省和局部强省向全局型工业强省的跨越。
第四类: 中等水平省。包括重庆、福建、辽宁、湖南、四川、湖北、安徽、陕西、吉林、河南、河北11个省,这些地区工业规模、技术和综合实力居全国中游水平,正处于工业化加速发展阶段,面临做大工业总量和加快转型升级的双重任务。要坚持新型工业化主导战略不动摇,继续实施工业强省战略,着力做大做强特色和优势产业,把传统产业优势转化为先进制造业优势,培育一批具有全国影响力的龙头企业、支柱产业和产业集群,努力建设局部型工业强省。
第五类: 欠发达省。包括江西、内蒙古、广西、黑龙江、山西、贵州、宁夏、青海、新疆、 云南、甘肃11个省,这些地区整体工业规模、技术和综合实力居全国平均水平之下,工业化水平较低 ( 除内蒙古外) ,大多处于工业化初期和向中期过渡阶段。对欠发达地区来说,工业化是现代化不可逾越的阶段。为了加快这些地区的工业化进程,国家要继续实施一批优惠政策引导东部发达地区部分产能和产业向中西部梯度转移,促进资源精深加工,提高产业集聚、集约发展水平。
【因子分析和聚类分析在长江水污染综合评价中的应用】推荐阅读:
补充资料因子分析07-09
体育文化产业发展的限制因子分析论文08-27
全面预算管理体系在企业中的应用分析06-15
计算机网络资源在教育教学中的应用分析06-11
信息化在企业人力资源管理中的应用分析论文10-03