【摘要】: 随着对科学发展观认识的深入,耦合协调度模型成为研究区域整体均衡发展程度的有效评价与研究工具。本文分析了100篇论文,发现在该模型使用中,绝大部分都是错的。这已经显著影响到学术研究的科学性。通过研究发现,所有错误都来源于综合值的计算过程。综合起啦,错误分成两类,第一类,归一化的处理错误;第二类,子系统的权值获取方法错误。这两类的问题的根源还在于作者偷懒,怕麻烦。
社会是一个复杂系统,资源、生态、经济、社会等不同系统之间存在多元内在耦合关系。随着对科学发展观认识的深入,对一个地区或社会发展程度的评判已经从单纯的发展水平转向基于协调水平与发展水平的整体均衡发展评价。因此,耦合效应与耦合协调发展度已经成为有效的评价研究工具。对于耦合效应研究,国内目前普通使用的有环境库兹涅茨曲线、双指数模型、非线性动力学模型、耦合度模型、灰色关联度 分析、动态耦合模型、向量自回归模型、空间回归模型、ArcGIS重心曲线优化分级等。
其中耦合协调度模型使用耦合度阐释若干子系统之间的相互关系,并进一步使用协调发展度对整个系统进行综合评价与研究。因为该模型简便易算且结果直观,因此被广泛应用于不同尺度、不同区域的环境、经济、社会发展、城市化、农业、工业、交通、人口等诸多系统间耦合发展水平的实证研究中。
但在目前研究中出现了大量对该模型的使用误区,并没有引起重视,导致诸多论文因模型本身使用误区而产生错误的结论。本文从最常见的问题出发,并在分析100篇文章的基础上,指出使用该模型最常见的错误,而其根源则让人喷饭,就是作者偷懒不愿计算所导致的。
文章来源:搜2022年11月11日:在知网搜索关键字 耦合协调度,下载200多篇论文。从这些论文中剔除没有数值的,通篇都是吹水只有文字的文章。接着随机抽取100篇,进行分析。
所有文章都没有提供原始数据,这也符合常识。目前只凭借耦合协调度的值,就能判断该文章是否是算对。
耦合度与耦合协调度是怎么算的?
耦合度的计算跟系统的数目有关。耦合度通常用C来表示
$$ C=\left( \frac{\prod \limits_{i=1}^{n} U_i } { \left( \frac{1}{n}\sum \limits_{i=1}^{n}{U_i} \right )^n } \right ) ^\frac{1}{n}$$
$$ C=\frac{ \left( \prod \limits_{i=1}^{n} U_i \right ) ^\frac{1}{n}} { \frac{1}{n}\sum \limits_{i=1}^{n}{U_i} } $$
子系统数目 | 耦合度计算公式 |
子系统数目n=2 | $$ C=\frac{2\sqrt{U_1U_2}}{U_1+U_2} $$ |
子系统数目n=3 | $$ C=\frac{3 \left ({U_1U_2U_3} \right )^ {\frac{1}{3}} }{U_1+U_2+U_3}=\frac{3 \sqrt[3] {U_1U_2U_3} }{U_1+U_2+U_3} $$ |
子系统数目n=4 | $$ C=\frac{4 \left ({U_1U_2U_3U_4} \right )^ {\frac{1}{4}} }{U_1+U_2+U_3+U_4}=\frac{4 \sqrt[4] {U_1U_2U_3U_4} }{U_1+U_2+U_3+U_4} $$ |
…… | …… |
子系统数目为n | $$ C=\frac{n \sqrt[n] {U_1U_2 \ldots U_n} }{U_1+U_2+ \ldots +U_n} $$ |
耦合协调度,又叫协调发展度,简称协调度,是用来衡量子系统之间协调性的一种度量。协调度通常用D来表示。
$$ 协调发展度公式 D=\sqrt{CT} $$
$$ T=\sum \limits_{i=1}^{n}{\omega _i U_i} $$
通常用协调度来表示总系统发展的协调程度,即协调度的好坏。
协调度D的大小区间 | 表示的意义 |
[0, 0.1) | 极度失调衰退类 |
[0.1, 0.2) | 严重失调衰退类 |
[0.2, 0.3) | 中度失调衰退类 |
[0.3, 0.4) | 轻度失调衰退类 |
[0.4, 0.5) | 濒临失调衰退类 |
[0.5, 0.6) | 勉强协调发展类 |
[0.6, 0.7) | 初级协调发展类 |
[0.7, 0.8) | 中级协调发展类 |
[0.8, 0.9) | 良好协调发展类 |
[0.9, 1] | 优质协调发展类 |
重要结论:协调值的大小由子系统的综合值U所决定。这个结论从公式可以看出,因为有U就可以计算出C,计算出T从而计算出D。
重要结论:协调值不会大于1,否则上述濒临失调衰退类这种定义没意义。
现在代入U1=100,U2=100;求T时候分配系数分别为0.5
D显然大于1,因此综合值必定有其取值范围,即是一个归一化的值,即在【0,1】区间。
这标题并不是玩笑,而是真实存在的事情。
类似协调发展度的论文,总是会把领导气得脸色铁青。因为这些论文无一例外的求出的D值都特别低,基本都是小于0.5的,都是属于衰退类的。
领导就不相信了,明明各个子系统的综合值都很好,归一化后都是0.8 0.9的,怎么求出来就发展不协调了呢?
不卖关子了,直接说答案吧,就是研究者错了。原因是偷懒导致的。
错误的主要原因是两大类,第一、归一化的错误。第二、子系统权值的获得的方法不对。其中第二点尤为突出。
无量纲化(nondimensionalize 或者dimensionless)是指通过一个合适的变量替代,将一个涉及物理量的方程的部分或全部的单位移除,以求简化实验或者计算的目的,是科学研究中一种重要的处理思想。
无量纲化方法选择的标准:
① 客观性。无量纲化所选择的转化公式要能够客观地反映指标实际值与指标评价值之间的对应关系。要做到客观性原则,需要评价专家对被评价对象的历史信息做出深入彻底的分析和比较,找出事物发展变化的转折点,才能够确定合适的无量纲化方法。
② 可行性。即所选择的无量纲化方法要确保转化的可行性各种方法各有特点,各有千秋,应用时应当加以注意。
③ 可操作性。即要确保所选方法具有简便易用的特点,并不是所有的非线性无量纲化方法都比线性无量纲化方法更加精确。评价不是绝对的度量,在不影响被评价对象在评价中的影响程度的前提下,可以使用更为简便的线性无量纲化方法代替曲线关系。
无量纲化、规范化、归一化是包含关系。无量纲化的概念最广
归一化方法是指,经过归一化计算后,得到的矩阵,矩阵值都在[0,1]之间。
归一化的作用有两个:
第一、保证最终的综合值在[0-1]范围
第二、保证所有指标是同方向的
其中第二点尤为重要。很多媒体,包括很多博士论文没有注意方向性,会得到及其荒谬的结论。
比如美国一些媒体就声称,美国在抗击新冠疫情的综合表现要远好于中国。这个结论怎么得出来的呢?因为美国感染人数第一,这个感染人数数值上要高于中国的,而没有分清感染人数越多是表现越差!这个指标是负向指标。是数值越小越牛逼。
因此归一化公式必须有两个,一个针对负向指标,一个针对正向指标。只写有一个归一化公式的论文就是错的。这种没有判断方向性的论文大量的出现在很多论文中,包括各种期刊论文,博士论文,硕士论文,本科生的论文,以及一些数学建模比赛中的论文。而且这种错得离谱的论文居然还被评为优秀论文。这些博士论文居然能过审。
$$\begin{array} {|c|c|c|c|} \hline {名称} & {正向指标公式} & {负向指标公式} & {说明} \\ \hline 极差法 & n_{ij} = \frac{{o_{ij}-min(o_{j})}}{{max(o_{j})-min(o_{j})}} & n_{ij} = \frac{max(o_{j})-{o_{ij}}}{{max(o_{j})-min(o_{j})}} & \color{red}{最常用} \\ \hline 欧式距离法 & n_{ij} = \frac {o_{ij}} { \sqrt{ {\sum \limits_{i=1}^{n}{o_{ij}^2}} } }= \frac {o_{ij}} { ( {\sum \limits_{i=1}^{n}{o_{ij}^2}} )^{\frac 1 2} } & n_{ij} = 1- \frac {o_{ij}} { \sqrt{ {\sum \limits_{i=1}^{n}{o_{ij}^2}} } }= 1- \frac {o_{ij}} { ( {\sum \limits_{i=1}^{n}{o_{ij}^2}} )^{\frac 1 2} } & \color{red}{ 每一列数据之间差距不宜过大} \\ \hline 均值标准化(Z-score) & \frac{x-\mu }{\sigma } & \frac{\mu-x }{\sigma } & \color{red}{此方法并非归一化方法,需特殊处理} \\ \hline 反三角函数 & \frac{2 \times atan(o_{ij}) }{ \pi} & 1-\frac{2 \times atan(o_{ij}) }{ \pi} & \color{red}{出现零值需要额外处理} \\ \hline 对数压缩数据法 & n_{ij} = \frac{lg({o_{ij}) }}{{ lg (max(o_{j}))}} & n_{ij} = 1- \frac{lg({o_{ij}) }}{{ lg (max(o_{j}))}} & \color{red}{出现零值需要额外处理} \\ \hline sigmoid函数(Logistic函数) & n_{ij} = \frac{1} {1+{e}^{-o_{ij}} } & n_{ij} = 1-\frac{1} {1+{e}^{-o_{ij}} } & \color{red}{机器学习、神经网络等基本用这个} \\ \hline \end{array}$$
以最常用的极差法为例,它就包含了两个部分,一个是针对正向指标的,一个是针对负向指标。当然还有更复杂的情况,这里就不过多展开。
这里特别要提及综合值U的特征。
从数值大小区间来说U是在0到1之间的一个数。
综合值U必须具有正向性,即数值越大越靠近1越牛逼。这点容易搞反,比如用TOPSIS中到正理想点的值作为综合值,这是不对的,该值是数值越大越差,是个负向指标。
设:总系统为$S$,由两个子系统组成,分别为$S1,S2$且不妨设:两个子系统分别由2个指标
现在假定以小学考试为例:小明考试成绩如下:
$$ \begin{array}{c|c|c|c|c|c|c}{M_{9 \times5}} & S1-语文 & S1-数学 & S2-音乐 & S2-体育\\ \hline 小明 & 100 & 100 & 100 & 100 \\ \hline \end{array} $$
归一化矩阵如下:
$$ \begin{array}{c|c|c|c|c|c|c}{M_{9 \times5}} & S1-语文 & S1-数学 & S2-音乐 & S2-体育\\ \hline 小明 & 1 & 1 & 1 & 1 \\ \hline \end{array} $$
S1的综合值U1=1*0.5+1*0.5=1,假定语文与数学的权重相等
S2的综合值U2=1*0.5+1*0.5=1,假定音乐与体育的权重相等
求得 C=1,T=1,D=1
实际中论文很多人是这么算的。
S1的综合值U1=1*0.25+1*0.25=0.5,假定语文与数学的权重相等
S2的综合值U2=1*0.25+1*0.25=0.5,假定音乐与体育的权重相等
求得 C=1,T=0.5,D=0.707
对比两种算法:发现问题出在哪里了吗?
现在假定U1=0.7,U2=0.7
从总系统里分到子系统的权重分别为0.5,0.5
U1=0.35, U2=0.35
求得 C=1,T=0.35,D=0.59
所以,正确的算综合值的时候,一定要使得每个子系统的权值之和等于1,从总系统拆分到子系统的权值去计算是错误的!
因此,针对领导脸都气绿了,这不是领导的问题。而是研究者的问题!
研究者为什么这么干呢?
偷懒!
尤其是用客观法求权重的方法。比如用熵权法,对于每个子系统要算过一次权值。每次算得都头晕脑胀。所以直接算一次总系统的各个指标的权值。然后分拆出去。这就省了好多事,尤其是有五个,六个子系统的情况。
写这篇文章的起因,其实就是大量的论文算出来的协调度非常低,基本都是0.5以下。这完全不合情理。这明显是把领导脸气绿的节奏。
接着就让一个哥们,给我传了160多篇论文,到后来补充到了220篇论文。这个哥们也是我的领路人。论文全部是期刊论文。因为硕博论文的文件太大,传文件费劲。
在跟领路人交流的过程中,我们突然聊到,怎么这么多论文的协调度都这么低呀。这不符合定义的,很多都是0.2,0.3于是就发出了,领导气得脸色铁青的问题!
通过阅读浏览论文:很快发现论文错误的原因:即归一化的问题,与子系统权重怎么来的问题。就这两类问题导致,所有评价对象的协调度都小于0.5。
判断论文对错的诊断点
归一化方法有没有写两个公式,如果只写一个的判断其为错误。一个都没写的,就不评价了
判断其子系统的权重是否列出。如果是用的熵权法,且协调度都很低,那肯定是错的。尽管他列出了如何计算综合值。但是其实际计算是用分拆出来的方法计算的
这类论文有一种常见的现象,公式抄一遍,由于小论文不用提供原始数据,他们没有任何中间过程。这类论文就不评价。
最过分的一类是,公式都不列(计算综合值的),甚至结果都不列出,全篇文字,或者搞几张图表。甚至协调值是多少的都没有,这种文章就剔除出去,它们甚至连错误都算不上。
就归一化与权重获得方式来说存在如下两个特点:
采用主观法权重的,即直接指定的与诸如AHP方法的,往往在归一化方面出错,即没有指出方向性,只列一半的公式。但是权重问题上一般不会出错。
采用客观法权重的,即诸如熵权法的,往往在归一化方面是对的。但是权重问题上一般都是错的,因为偷懒。
结论:100篇耦合协调度相关论文其中59篇是错的。59%的错误率
详情见表格:
想在线计算解释结构模型的或者直接生成论文的请发电子邮件到, hwstu #sohu.com 把#替换成 @