中国创新只能排第十？扒一扒《全球创新指数》

Hutong9.net · 发表于 2025-9-23 07:02 AM

中国创新只能排第十？扒一扒《全球创新指数》

来源：观察者网陈轩甫
2025-09-23 15:34:31

近日，《全球创新指数》（Global Innovation Index，GII）最新排名公布，中国首次跻身前十，是前三十名中唯一的中等收入经济体。尤为亮眼的是，凭借24个全球百强创新集群，中国在此项指标上领先世界，“深圳-香港-广州”集群首次超越日本的“东京-横滨”，跃居全球榜首。

但国内网友间再次出现了一些质疑的声音，对中国排第十的结果表达了不满，认为不能真实反映中国日新月异的创新成就，甚至怀疑是“野鸡机构”出的东西。

不过，发布该指数的世界知识产权组织（WIPO）是联合国专门机构，报告是与康奈尔大学等知名学术机构合作的产物，在全球范围内有广泛影响力，说它“野鸡”，肯定是夸张了。但指数是怎么算出来的，到底有些什么不足之处，也确实值得扒一扒。

“考试”分数怎么算

作为正规机构，WIPO并没有藏着掖着，而是比较清晰地呈现了GII出台的整体框架。（以下内容可以跳过，直接看后面的比喻。）

GII下面分为两个“子指数”（sub-index），一个是“创新投入子指数”，另一个是“创新产出子指数”。两者的简单平均值，就是GII。

“子指数”下面的一级分类，被称为“支柱”（pillar）。投入子指数包含5个支柱，而产出子指数仅包含2个支柱。

每个“支柱”下面还有三个“次级支柱”（sub-pillar），再下面就是具体的指标（indicator）。

今年的GII，总共有78个指标。原则上，这些指标的基本权重都为1。

但有时，会调整高相关性的指标或次级支柱的权重。这是为了防止几个指标衡量的本质上是同一个东西，导致重复计算。

具体的调整规则是：如果在一个子指数内，任何指标之间的绝对相关性超过0.95，那么这些高度相关的指标权重将被调整为0.5。

不过，在2025年的模型中，没有任何指标触发了这一规则，因此所有78个指标的权重均为1。

但在“创意产出”（Creative outputs）这一支柱下，有两个次级支柱被赋予了0.5的权重，它们分别是“7.2 创意产品与服务”（Creative goods and services）和“7.3 线上创意”（Online creativity）。

打个比方，可以把《全球创新指数》的最终排名，想象成一次对各个经济体创新能力的“大考”。最终成绩是由“期中考试”和“期末考试”两部分的平均分决定的。

“期中考试”就是“创新投入”：这部分考察的是一个经济体为了创新做了多少准备工作，比如教育投入了多少、科研人员多不多、营商环境好不好、基础设施怎么样等等。它包含了5个大的科目（即5个“支柱”）。

“期末考试”就是“创新产出”：这部分考察的是这个经济体实际取得了哪些创新成果，比如专利有多少、高科技产品出口了多少、诞生了多少创意品牌等等。它只包含2个大的科目（即2个“支柱”）。

最终的总分，就是把“创新投入”和“创新产出”这两大块的分数简单地加起来除以2。

这意味着，尽管投入部分考察的科目（5个：制度、人力资本与研究‌、基础设施、市场成熟度、商业成熟度‌）多于产出部分（2个：知识和技术产出、创意产出），但两者在决定最终排名时分量是一样重的。这也使得“产出”部分的每一项成果，在最终分数里的权重显得更高一些。

每个科目的分数又是怎么来的呢？

科目还分为一些小科目（次级支柱），再下面就是最核心的考题（指标）了。构成总分的78道考题（指标），原则上都算1分，相当于让每个知识点在卷面上的基础分值都一样。

当然，也有一些特殊的“计分规则”用来微调。如果发现有几个小项考察的内容太相似了，为了避免重复计算，就会把它们各自的权重都减半，变成0.5分。不过，在今年的评分里，没有出现这种情况，所有考题的权重最后都还是1。

但个别小科目被特殊处理了，在期末考试（“创新产出”）的“创意产出”科目里，有两个小科目的权重被特别设置为了0.5，分别是“创意产品与服务”和“线上创意”。

“考试”题目怎么判？

WIPO也承认，这78道考题，并非都是“客观题”。其中有5道“主观题”和10道“指数题”。

这里比作“主观题”的，就是依赖调查问卷、专家打分的“调查/定性/主观/软数据”（survey/qualitative/subjective/soft data）内容。

而所谓“指数题”，本身就是由其他指数综合而成的“综合指标/指数数据”（composite indicators/index data）。

5道主观题是：

1.3.1 商业政策稳定性（Policy stability for doing business）

来自世界经济论坛（WEF）的《高管意见调查》，评估的是商界领袖对于“政府在多大程度上确保了稳定的商业政策环境”的主观看法。

1.3.2 创业政策与文化（Entrepreneurship policies and culture）

来自全球创业观察（Global Entrepreneurship Monitor ，GEM）的《国家专家调查》（National Expert Survey）。它综合了各领域专家们对于创业支持政策和创业社会文化氛围的主观评分。

4.1.1 对初创和成长型企业的融资（Finance for startups and scaleups）

同样来自GEM的《国家专家调查》，评估的是各领域专家眼中，初创和成长型企业获得融资的难易程度。

5.2.2 大学与产业研发合作（University–industry R&D collaboration）

来自世界经济论坛（WEF）的《高管意见调查》（Executive Opinion Survey），直接由企业高管对其所在经济体大学与产业界研发合作的程度打分。

5.2.4 集群发展状况（State of cluster development）

也来自《高管意见调查》，向高管询问：本国发展成熟的、深度产业集群是否在各领域广泛存在？

10道“指数题”是：

1.1.1企业运营稳定性（Operational stability for businesses）

来自标普全球（S&P Global）市场情报部的国家风险数据集（Country Risk Dataset），衡量影响企业运营的政治、法律、运营或安全风险发生的可能性，以及严重程度。

1.1.2 政府效能（Government effectiveness）

这是世界银行“全球治理指标”（WGI）的一部分，反映了对公共服务质量、公务员队伍的政治独立性、政策制定与执行质量，以及政府承诺可信度的综合主观认知。

1.2.1 监管质量（Regulatory quality）

同样是世界银行“全球治理指标”的主观认知指数，聚焦政府制定和实施健全政策，以准许并促进私营部门发展的能力。

1.2.2 法治水平（Rule of law）

还是世行“全球治理指标”的主观认知指数，反映了社会成员对社会规则（如合同执行、财产权、警察、法院质量）的信心和遵守程度，以及出现犯罪、暴力可能性。

2.3.4 QS世界大学排名，前3名平均

顾名思义就是某经济体在QS全球大学榜里，排名最高的三所大学的平均得分。若排名中列出的大学少于三所，则依然除以三，如果一所没有，就是零了。

WIPO还特别提醒，2025年的排名对应的是2024年6月公布的QS数据。而2024年发布的QS排名在方法上进行了重大改进，新增了三项评估指标：可持续发展、就业成果和国际研究网络。

3.1.1 信息与通信技术接入情况（ICT access）

这是一个综合指数，基于另一家联合国机构国际电信联盟（ITU）的数据。它为以下三项信息与通信技术指标分配了相同的权重：（1）拥有移动电话的个人数量；（2）接入互联网的家庭数量；（3）移动网络（至少3G、至少LTE/WiMax以及至少5G）覆盖的人口百分比。

其中第三项的计算方式为：给至少3G网络覆盖的人口分配30%的权重，给至少LTE/WiMax网络覆盖的人口分配50%的权重，给至少5G网络覆盖的人口分配20%的权重。

3.1.2信息与通信技术使用情况（ICT Use）

数据同样来自ITU，为以下五项指标分配了相同的权重（各占20%）：（1）固定宽带互联网一揽子费用（占人均国民总收入百分比）；（2）固定宽带互联网流量（每用户每月GB数）；（3）移动数据和语音高消费一揽子费用（占人均国民总收入百分比）；（4）国内移动宽带互联网流量（每用户每月GB数）；（5）每100人中活跃的移动宽带用户数。

3.1.3政府在线服务（Government online service）指数

数据来自联合国经济和社会事务部（UNDESA）公共机构和数字政府司（DPIDG）的《2024年电子政务调查报告》，用于评估各经济体政府部门在整个经济体层面利用技术提供公共服务的效果。

它基于对官方网站和电子政务政策的调查，并将得分标准化为0至1的范围。2024年的指数根据五个加权子指数计算得出：服务提供（占比45%）、技术（占比5%）、制度框架（占比10%）、内容提供（占比5%）和电子参与（占比35%）。

3.2.2 物流绩效（Logistics performance）

来自世界银行的“物流绩效指数”（LPI），该指数基于对全球物流专业人士的调查，评估他们对运营所在国的海关效率、基础设施质量、国际航运、服务质量、物流追踪、及时性等的问卷结果。因此，也有一定主观性。

3.2.3 大学产业合作与国际参与度，前5名（University industry and international engagement, top 5）

基于泰晤士高等教育（Times Higher Education）排名数据，计算各国排名前5的大学的平均得分。得分由国际展望（International Outlook）得分（涵盖国际教职员工、国际学生数量及合作论文发表情况），以及产业合作得分（反映产业收入及专利引用情况）的平均值计算得出。

在“指数题”里，有个别是客观数据计算得来，但总体而言，这15题确实含有大量主观因素。

Hutong9.net · 发表于 2025-9-23 07:04 AM

本帖最后由 Hutong9.net 于 2025-9-23 07:15 AM 编辑

由于西方话语的强势地位，以及西式制度在全球的广泛“套用”，对制度方面的评估，无论是“主观题”，还是“指数题”，很容易带有“西方中心”的系统性偏差。

西方治理范式的价值判断，可能低估“非西方模式”下的治理效果。对于不同经济模式和监管理念，人们的理解也常常大相径庭。具体到创新方面，就会低估“国家驱动型创新”或“非市场型创新”的经济体。

更何况，从创业文化到企业运营稳定性，本身就很难以统一的标准让受访者打分。

第一根支柱“制度”的全部6个指标中，2个是“主观题”，4个是“指数题”，毫不意外，中国排名相当低。

每个经济体有7个支柱得分，前10名总共就有70个，其中只有中国的“制度”排名低于35。

GII呈现结果时，将大于35名的支柱排名标为浅绿色，中国的“制度”排名格外显眼 WIPO

另一种可能的系统性问题是“精英集中偏差”。企业高管问卷、专家意见，往往覆盖最顶层群体，或一个经济体内的最发达板块，未必能充分反映基层创新生态和地区特质，特别像中国这样制造业覆盖全产业链，各种微创新层出不穷的国家。

问卷调查还固有“短期情绪偏差”，对突发事件（如经济危机、政策更迭、选举等）较为敏感，不是每个受访者，都能准确把握全年情况。

另一方面，ICT使用、流量、网络覆盖率等，虽然相对客观，总体上也能说明些问题，但完全聚焦于“量”，对“质”（如是否用于科研和企业交流创新）并没有真正的评估。例如，网络覆盖率低的经济体，如果要保障科研院校的网络使用，也是有可能实现的。

对大学排名近年也已经有不少批评，主要的质疑点之一，就是国际化相关内容。而WIPO的相关指标，选取前3名、前5名取平均，更是过于看重少数精英大学，不能反映整体高等教育水平。

回顾历史，中国的创新排名确实出现过几次特殊波动，例如在2009年至2013年间两度被“请出”前30名，不过猜测刻意打压可能有点太过“诛心”，今年就更不可能是这样的情况。

不如说，面对中国这样高速发展、体量巨大的非西方经济体，WIPO的方法论仍有很大的提升空间。

但如果将所有火力都集中在非客观指标上，这样的批评有点太廉价了。

事情并没有那么简单。

以中国的弱项为例，看看“客观题”的漏洞

中国排名最低的几项中，非客观指标其实只有一个——“监管质量”，列第94名，仅仅是中国的倒数第五。

最差的是“5.3.4外国直接投资净流入（FDI net inflows），占 GDP 百分比”，列第110名。

FDI净流入是最近三年投资净流入（新投资减去撤资）的平均值，指为了获得在另一经济体中经营企业的长期管理权益（10%或以上的有表决权股份）而进行的投资。它包括股本、收益再投资、其他长期资本以及国际收支表中显示的短期资本。数据来源于世界银行的《世界发展指标》数据库。

投资人自然是要有利可图，但并不等于就和创新一定有强相关。

首先，小经济体有少量的外资流入，就会在分母（GDP）较小的情况下显得比例特别高。大经济体即便吸引了巨额外资，但因为GDP体量庞大，比例会被稀释。

其次，FDI受全球经济周期、汇率波动、跨国公司战略调整等的影响，更多反映中短期资本趋势，而不是创新生态长期表现。

再者，有的FDI进入房地产、传统制造甚至是“资源掠夺型”投资，并不带来创新。

还有些经济体，是跨国公司资金中转或避税地，这类资金未必停留在本地经济中，也未必促进本地创新。

中国倒数第二的是“2.2.3 高等教育入境流动率，占比（Tertiary inbound mobility，%）”，列第107名。

在某一经济体学习的海外学生人数，占该国高等教育总入学人数的百分比，这和之前的大学产业合作与国际参与度有重复，都考虑国际学生数量，只是参与度那项包含其他因素，可能相关性因此下降了，就没有给指标“打对折”。

而且，中国高等教育做得“太好”，总入学人数“太高”了，这占比的计算结果可想而知。

这个指标同样面临创新相关性的问题。国际学生是本硕博哪个阶段的，对创新带来的影响显然不同，留学生读哪个学科更能带来创新，更是争议巨大。

倒数第三是“5.1.3 青年人口红利（Youth demographic dividend, %）”，列第105名。

青年人口红利是指 0–24 岁人口占总人口的比例。WIPO认为，它反映了未来可能从庞大的青年群体中获得的经济和创新相关优势。这种人口结构被称为“红利”，因为如果能有效教育并融入劳动力市场，年轻人能够增强未来的创新能力，维持长期经济增长，并减缓人口老龄化的影响。

这都不用多说了，关键是“有效教育并融入劳动力市场”啊……

倒数第四是“3.3.1 单位能耗产生的GDP”，列第102名。

计算方法是，按购买力平价计算的国内生产总值除以能源总供应量（TES）。TES 的计算方法为：生产+进口-出口-国际海运燃料-国际航空燃料，再增减库存变动。

这项指标对于可持续发展来说，或许比较重要，但放到创新评估体系里，大概“赶时髦”的意味更大一些。

高能耗产业占比大的经济体（如钢铁、化工、采矿）会天然拉低指标，即使它们在某些高科技领域（如 AI、航天）具有很强的创新能力。

服务业和高附加值产业占比高的经济体（如金融中心、旅游国）会天然抬高指标，但这未必说明其技术创新能力强。

能源资源型经济体和不生产能源的相比，用能源难免大手大脚。这当然不应提倡，但和创新没有必然联系。

最后就是体量问题。在绿色科技的创新、应用方面，中国是无可争议的引领者，但经济体量实在大，门类多，减少能耗仍然任重道远。

可如果以此来衡量创新，倒成了这个指标自己的“尴尬”。

倒数第6是“5.3.3电信、计算机和信息服务进口，占总贸易百分比（ICT services imports, % total trade）”，列第83名。

从中国人的视角看，这或许是最可乐的一项。我们主要负责出口，告辞了……

确实有些ICT领域，进口也不少，但和贸易总量，真的没法比啊。

对于其他发展中经济体来说，这或许有一定的意义，但就像“国际学生”的重复问题一样，这背后对创新的作用，其实也包含在互联网覆盖等指标里了。

并列倒数第7的是“2.1.1教育支出，占GDP百分比”和“7.2.2每百万人口（15–69岁）国产电影长片数量（National feature films/mn pop. 15–69）”，都列第76名。

教育支出涵盖各级政府（地方、区域和中央）的教育总支出（包括经常性支出、资本支出和转移支付）。中国确实也在尝试提高教育的投入和质量，除了职业教育的改革，还有人探讨高中或学前阶段纳入义务教育等。

但中国作为一个大国，在教育已经相当不错的情况下，教育支出占比可能很难有大的提升。

顺便一提，PISA得分也是指标之一，中国排名第一。和这个76名对照着看，尴尬的肯定不是我们咯。

中国还有一个特点是，教师、医生等职业，工作强度非常高，如果和西方比，这部分额外的人力成本相当大，但无法体现在总支出里。

而电影长片的定义是时长 60 分钟或以上，包括剧情片、动画片和纪录片，旨在影院进行商业放映的。专为电视播出制作的影片、新闻片以及广告片不包括在内。

这个低排名指标，就不多说了，或许是中国国内争议最少的一项了。但量和质的权衡问题依然存在。

另外，电影虽然是最重要的文化创意产品之一，但自身也在受到时代的冲击，未来可以考虑换换指标吧。

倒数第9是“4.1.3小额信贷机构贷款，占 GDP 百分比（Loans from microfinance institutions, % GDP）”，列第43名。

创新企业融资难，当然在我国是一个重要的问题。但单看总额占比，而不细究贷款用途，也确实粗糙了点。

中国的倒数第10能列第34名，已经相当高了，指标是“7.2.3娱乐传媒市场 / 每千人口（15–69 岁）（Entertainment and media market/th pop. 15–69）”。

最主要的数据，出自普华永道的《全球电信与娱乐传媒市场展望（每千 15–69 岁人口）》（Global telecom and entertainment & media outlook），它是关于不同地区消费者与广告支出，以及娱乐和传媒细分市场的全球分析与五年预测的综合资料。

这个指标倒也许部分反映了，冲击电影等传统创意产品的新浪潮。然而，如果单纯看市场规模，那么很可能被低质重复的内容“冲量”，里面到底有多少真正的创新，就很难说了。

何况在相当多国人眼中，娱乐业、广告业的创新，并不能与工业技术的创新相提并论。

Hutong9.net · 发表于 2025-9-23 07:17 AM

本帖最后由 Hutong9.net 于 2025-9-23 07:21 AM 编辑

WIPO还说明了所有数据总体的处理过程，比如有标准化和“缩放因子”（Scaling factors）等问题。

大多数GII指标都是使用GDP或人口缩放的（scaled），这样才能实现跨经济体的比较。虽然WIPO重点提示了年际比较的问题，认为“个别指标的年际变化可能由变量本身（分子）或其缩放因子（分母）驱动”，但经济体之间同年的比较，很难说完全排除标准化带来的扭曲。

特别要指出的是，在创新领域，有些问题的关键是“有”或“无”。说电磁弹射、高超声速，那有点太欺负人了，如果局限在商业领域，像成气候的AI企业，基本就是中美两国有。

这样的配图也许并不完美，但用国产AI可以很方便地生成 Deepseek、文心一言

还有些问题具备强烈的规模效应，达到一定程度就难以被撼动，如研发总投入、科研人员总数等。这些如果非要用GDP或人口去“公平处理”，本身可能就是有认识上的不足。

GII的指标不时就有少量调整，近年中国的排名在波动中逐步上升，一方面是中国创新能力确实强劲，另一方面，也很难说有什么主观打压中国的意图。

今年前15名的近年排名，中国稳中有进 WIPO

从前面这些指标的分析看，更多地是由于为了适配各类经济体，加上西方中心主义的强势话语对于某些问题的惯性，导致指标设计存在不少系统性误差。

自己的创新指数，这个可以有

设计GII指标的人，可能带有帮助各经济体提升创新能力的美好意愿，但现实情况远比一个年度排名更为复杂。

无论谁创制指数，都难以十全十美，“真刀真枪”的产业和科技竞争，也不会因为指数得分的高低就直接定胜负；看个指数就决定投资方向的，只能是愣头青而已。

就好像编制综合国力排行、军力排行，如果系统性的偏差较大，得分再高也没用。

但这并非完全“没有意义”。

想象下，如果编制军力排行，可以认为核武器威力巨大，而给出很高的权重，也可以认为核武器几乎不可能使用，而给出较低的权重。这并不会改变现实世界的核博弈，背后其实反映的是编制者的认识，代表了一种声音。

同样地，中国研究者制定自己的创新指数，并不是要“重蹈覆辙”，而是可以借此表达对创新问题的全盘认识。

立足于自身波澜壮阔的创新实践，中国人对创新要素理当有深刻的理解，正需要一个窗口来梳理、诠释。

基于中国大力发展新能源、人工智能、无人机等前沿产业的成功经验，结合我们对制度、市场、人才和资本等要素在创新过程中独特作用的深刻认识，最终有可能推出一套能反映中国创新理念与发展逻辑的评价体系。

清晰地向世界展示中国对创新的理解、定义和价值判断，这本身就是在尝试掌握国际话语权、贡献中国智慧。

如果在此基础上，还能展现出其他经济体的变化趋势，则是额外的收获。作为成功的创新者、赶超者，真正掌握创新精髓的话，对全球创新格局的预测理应靠谱得多。

脱离了产业基础和广阔市场，单纯的“创新”评分可能沦为镜花水月。小经济体往往需要依托主流的创新基础和供应链体系，才能实现有全球影响力的创新活动。这为创新评估和趋势分析增加了难度。

GII并非没有考虑这些方面，但是否有可能给予产业链合作更大的关注，而不是借用些学术合作的指标？中国研究人员如果在这方面提供有说服力的替代，将更好地展现中国在产业链上的地位，以及对其他经济体带来的好处。

综上所述，对于《全球创新指数》的排名，我们应以一种更为超脱和自信的心态来看待。对于自信的人来说，中国早已过了需要依靠某个排名来证明自身实力的阶段。但创新指数也不是毫无用处，无论国内外，都还有不少低估中国创新能力的人，每次排名的进步都有可能带来触动。

而中国的创新之路，也需要一套超越受西方中心思维影响的评价体系，摆脱一些固有的认知框架和方法论局限，完成自我剖析，为人类留下宝贵的经验。

		自动登录	找回密码
密码			注册

中国创新只能排第十？扒一扒《全球创新指数》

浏览过的版块