【摘要】当涉及事物之间的界限模糊,又要对事物进行分类时,可采用模糊聚类分析方法。本文运用模糊聚类对能源区域进行划分。能源问题是关系我国国民经济增长和可持续发展的关键问题,有效地找出能源区域带对制定地区发展策略至关重要。
【关键词】聚类分析;模糊聚类;能源
一、引言
事物之间的界限,有些明确,有些模糊。例如人的面貌相似程度之间的界限是模糊的,天气阴、晴之间的界限也是模糊的。当涉及事物之间的界限模糊时,又要对事物进行分类时,可采用模糊聚类分析方法。聚类分析的目标就是在相似的基础上收集数据来分类,从统计学的观点看,聚类分析是通过数据建模简化数据的方法。
能源问题是关系我国国民经济增长和可持续发展的关键问题。我国经济在过去的三十年间保持了较高的增长速度,由此也导致对能源需求量的快速上升。未来要想继续维持这种较快的经济增速,能源保障尤为关键,这是我国增长所面临的客观需求。有效地找出能源区域带对制定地区发展策略至关重要。
本文运用模糊聚类分析方法研究我国各省区能源消费情况,对地区能源消费结构进行聚类。从中去了解能源消耗在国民经济中的价值因素,推测对各地区合理的能源消费结构,以及现实可行的能源策略。
二、模糊聚类分析
根据能源消费对GDP增长的影响角度,即从国民经济生产总值,能源储量,能源使用量、能源消耗与经济之间关系几个方面选取指标。选取了12个能源经济类型指标进行聚类分析,包括:单位地区生产总值能耗,单位地区工业增加值能耗,单位地区生产总值电耗,地区发电量,地区石油储量,地区煤炭储量,地区天然气储量,地区原煤使用,地区石油使用量,地区天然气使用量,地区职工平均工资年度统计,地区国民经济生产总值。
模糊聚类分析算法流程:
1、数据标准化,计算标准化度量值用相关系数法。
2、建立模糊相似矩阵。根据确定的聚类数,用随机数初始化隶属矩阵。
3、算法迭代。直到目标函数收敛到极小值。
4、根据迭代结果,由最后的隶属矩阵确定数据的所属的类。
以不同的标记显示最后的聚类结果。
选取在每列隶属度矩阵中最大的那个数所在的列,就是该省市所在类,结果如下:第一类区域:安徽,四川,贵州,云南,第二类区域:河北,辽宁,吉林,黑龙江,山东,新疆,第三类区域:山西,内蒙古,河南,陕西,剩下省市为一类。
第一类区域:我国西南和中部地区,从石油分布上,这四个省份避开了石油分布的主区域,也没有较大的煤矿分布,经济发展程度相似,经济类型略有不同。是非主要能源产供地而倾向于农副业型的经济区域。适合就地使用本地资源,发展水力电能,或者引进其他地区的能源。
第二类区域:包含了六个省区,六省既是我国石油气主要产地,又兼具老工业基地,现有重工业大省,又有支持全国能源使用与工业建设的新疆地区,这一类区域是我国能源开采使用的主要区域,里面既有能源储备大省,还有新兴的工业区能耗大户。
第三类区域:山西,内蒙古,河南,陕西,是一片相连的区域,陕西也属矿藏丰富的地区,但储量偏向于综合性的丰富,而河南则在石油气上储量丰富。这一分类将我国主要的能源区域连接带划出,在地理位置上显示区域连接。
第四类区域为剩下的绝大部分省市,各种能源储量为一般或无。
传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。模糊聚类的分类结果偏向于均化,软划分的结果特征显著。不会出现数量极少的样本成为一类,而这正是聚类分析中所普遍期望得到的结果,其特征:软划分以及拟人工的聚类过程,在实际应用愈发具有优势。
三、结语
在商业上,聚类分析被用来发现不同的客户群,通过购买模式刻画不同的客户群的特征。在因特网应用上,聚类分析被用来在网上进行文档归类来修复信息。在图像处理上,聚类分析中的模糊聚类不只能从原始数据中直接提取特征,还能对已经得到的特征进行优选和降维操作,模糊聚类能够模拟人眼的主观识别,训练样本图像的匮乏并有无监督的分析,是图像处理中一个强大的分析工具。
此处,我们通过模糊聚类分析给出了不同的能源经济区划,可以帮助我们全面认识能源资源分布及其开发条件的地域差异,明确各地区能源供应与国民经济结构的关系,为进一步改善能源生产在全国范围内的布局,搞好能源的地区产销平衡与合理流向,为制订不同地区的能源政策与工业发展方向提供科学依据。
参考文献:
[1]高新波.模糊聚类分析及其应用.西安:西安电子科技大学出版社.2004.
[2]戈国华,肖海波,张敏.基于FCM的数据聚类分析及Matlab实现.福建电脑.2007,04
[3]周志军,潘三军,杨培慧.SPSS模糊聚类分析在水质监测断面聚类分析中的应用.2007,04
文/李亚杰王媛
……