基于美国实体清单分析的中国卡脖子企业画像构建*

周 磊 王晨阳 李问秋

(1.武汉纺织大学会计学院 武汉 430200;2.武汉纺织大学管理学院 武汉 430200)

科技创新是推动国家富强、产业发展的基石。国家“十四五”规划明确提出“坚持创新驱动发展、全面塑造发展新优势”。我国高科技产业始终保持迅猛发展势头,华为等领军型企业在部分细分领域超越了美国企业巨头。中美经济、科技实力的不断接近使得“中国威胁论”逐渐成为美国社会的主流观点之一。美国政府商务部以增列实体清单受限名单的方式全面落实 “小院高墙”战略,自2018年起将大批中国机构或个人列入该清单,禁止美方与其进行国际贸易和学术交流。《科技日报》于同年强势推出专栏“亟待攻破的核心技术”,首篇报道即以“是什么卡住了我们的脖子”开题。此后,媒体将被美方封锁的技术形象地称为卡脖子技术、被美方制裁的企业称为卡脖子企业。

目前,突破卡脖子技术、破解卡脖子企业的经营困境成为中国社会高度关注的核心问题。卡脖子企业分布于多个行业,创新能力和财务状况各异,为何会被美方限制呢?它们自身有何特点?相互间又有什么共性呢?这些问题的结论与我国产业安全紧密相关,能够为中国企业跳出美方包围圈、实现可持续发展提供参考路径。情报学界亦高度重视中美科技博弈对我国领军企业及高科技产业的深远影响,相关研究依据实体清单对美方技术管制的重点产业、敏感领域进行了基础统计分析。在此基础上,如能以受限企业为研究对象开展细粒度分析,不仅有利于丰富新时期竞争情报理论研究,还能为中国企业突破美方技术“锁喉”提供有针对性的实践指导。基于此,本文尝试引入用户画像技术,对实体清单新增的中方企业进行多维分析和分类,以期发现卡脖子企业的簇群及特征,为卡脖子企业持续经营和高质量发展提供建议。

1.1 中美科技博弈下的竞争情报文献综述

源于国际关系学说的“中国威胁论”已被美国社会广泛接受,其核心观点之一是中美科技、军事、经济实力的不断接近必然导致大国冲突。面对中美科技博弈新局势,近年来研究者针对技术管制产业的竞争情报服务进行了理论研究。周磊等以美国商务部产业与安全局发布的实体清单为根据,系统梳理了中国大陆受限机构类型、技术出口管制领域、技术出口管制形式、技术出口管制原因[1];
郭世杰等利用文本挖掘方法对比中美两国空间技术产品的性能参数,判断两国在该领域的技术差距[2];
陈峰等分析了半导体产业技术出口管制项目并提出该产业竞争情报服务产品的具体功能需求[3];
祝捷频等对比了中美两国在数控系统领域专利发明的数量和质量差距[4];
陆天驰等挖掘了美方针对人工智能领域的技术管制重点和关键主题[5]。还有研究采用定性研究方式,如陈劲等从识别框架、战略转向和突破路径三方面构建了“十四五”时期“卡脖子”技术破解之道[6];
杨道州等分析了当前我国存储器产业发展的机遇与挑战[7];
张治河等提出了服务国家竞争、企业“卡脖子”技术突破的关键技术甄选机制[8];
汤志伟等从垄断程度、攻克难度、是否处于价值链核心位置三个方面从关键技术中筛选出“卡脖子”技术[9];
李莹等从专利侵权、供应链卡脖子、市场被抢占三方面对企业专利风险进行预警并设计了对应的信息系统模块[10]。

1.2 企业画像文献综述

企业画像源于用户画像,后者是由用户真实数据得出的虚拟代表,并已形成基于本体或概念、基于主题或话题、基于兴趣或偏好、基于人格特征与用户情绪、基于用户行为或日志、基于多维或融合等六类画像建模方法。相对而言,企业画像的研究起步不久且以规范性研究为主。目前,学术界尚未对企业画像概念形成一致性意见,多数研究认为企业画像的本质是企业信息化标签,即利用真实的企业数据建立多维度、全方位的企业标签画像,进而对企业群进行归类[11]。从研究功能来看,企业画像多关注于刻画企业信用特征并形成了“大连国税”“百度信用”等典型产品。田娟等人的探索性研究提出基于大数据平台的企业画像应囊括企业属性、信用属性、交易特征、内外关联特征、评价信息等维度,在标签抽取过程中可使用TF -IDF、word2vec、卷积神经网络算法,数据建模过程可以使用关联规则和经典的聚类、分类算法[12]。

综合来看,情报学界已将支撑中美科技博弈的战略情报服务纳入学科理论研究范畴,并分别针对国家、产业层面进行了宏观和中观分析。然而,当前研究亦存在亟待提升的空间。一是针对卡脖子行业的研究多从共性技术着手,尚未深入到竞争情报服务用户——受限企业及其群体,从而降低了对策建议的适应性。二是企业画像技术虽能够为深入刻画卡脖子企业群体提供方法支撑,但其主要功能是企业信用评估而未考虑被管制群体的特征。为了解决上述问题,本文将引入企业画像理论为被列入美国实体清单的“卡脖子”企业群体进行画像,以期为产业高质量发展提供启示。

2.1 卡脖子企业画像标签设计

用户画像构建的关键是建立标签体系和抽取标签,广受认可的标签体系大致可以分为用户相关的稳定性特征、情境相关的动态性特征两大类[13]。受此启发,卡脖子企业画像的标签体系既要涵盖工商登记信息等稳定属性;
又要挖掘各类阶段性成果体现其发展过程的动态性。同时,卡脖子企业是美国对华“科技脱钩”的直接打击对象,具有区别于非管制企业的特殊性;
因而指标体系还应反映中美科技博弈的时代背景。综上所述,本节将基于三个原则构建卡脖子企业画像标签体系。一是全面性原则,即涵盖企业基本属性、企业创新实力、运营能力等多方面。二是相对性原则,“中国威胁论”背后的中美竞争实力接近是促成美国对华技术管制的根本原因,故应关注企业与行业领先者的相对差距。三是受限特征原则,即实体清单给出的企业受限属性,具体包括受限时间、受限领域、受限形式和受限原因。最终形成的“卡脖子”企业用户画像标签体系如表1所示。

表1 卡脖子企业画像标签体系

2.2 卡脖子企业画像信息采集

信息采集涉及多渠道,采集过程分为卡脖子企业确认、卡脖子企业信息采集、标杆企业信息采集3步。第一步收集2018年-2021年间美国商务部实体清单增加的中国机构名录,过滤高校院所、政府机关、个人等,仅保留企业信息并对企业集团进行合并。第二步从多渠道采集多源数据。一是从实体清单采集每一企业的受限属性。由于大量企业在实体清单中未给出ECCN编码,因而受限领域、受限形式、受限原因等需根据企业所属行业进行人工推断。二是从爱企查平台采集企业基本属性,结合中美科技博弈背景确认所属行业、计算企业存续时间;
从企业官网、专利数据库采集企业的基本属性、经营活跃性、创新竞争力属性。第三步根据所属行业,查询受限前一年的《财富500强》企业排行榜,采集Top 1企业的资产、专利数据,进而计算企业受限根本原因。最后,需要人工核对、简化分类数据,确保属性取值满足聚类算法的唯一性要求。

2.3 卡脖子企业画像构建与应用

卡脖子企业画像构建本质上属于无监督学习聚类算法。常见的聚类算法包括K-Means、层次聚类、基于密度的聚类等。然而,由于表1构建的企业画像体系同时存在数值型属性和分类型属性,因而无法采用基于欧式距离的K-means聚类和基于汉明距离的K-mode方法。因此,本节将选择适用于两类数据的K-Prototype聚类作为主算法建立企业画像。

K-Protopype与K-means聚类步骤类似,差别在于样本与类间距离的计算。对于样本量为n的数据集X={X1,X2,…,Xn},任一样本Xi拥有m个属性{Xi1,Xi2, …,Xim},其中前P个属性的取值为数值型,后m-p个属性的取值为分类型。样本Xi和簇Ql的距离为:

式(1)等式右侧的前半部分计算的是样本和簇中心的欧式距离,后半部分是样本和簇中心的汉明距离,其中μ代表分类属性距离的总权重。K-prototype聚类的迭代过程目标是使各样本到对应簇的距离和最小。

此外,作为一项探索性研究,本文未人为指定K值,而是采用肘部算法进行确定。肘部算法的目标函数SSE((Sum of the Squared Errors)表示各点到对应簇中心的距离的平方和。随着K值由1增大到n,SSE的取值逐步降低直至为0。其中, SSE下降率突然变缓的拐点即为“肘”点,对应的K值即为最佳分类。最后,根据肘部算法和聚类效果图,提炼出K个典型企业画像。

最后,决策者可利用该结果从两方面展开应用。一是企业内部决策者可进一步洞察企业竞争圈以及与标杆企业的差距,从而为企业经营管理提供辅助决策支持。二是政府相关部门可以据此对尚未列入实体清单的重点企业进行分类,对其技术管制风险进行预警、指导和协助企业提前进行风险防范。

3.1 中方卡脖子企业基本概况

研究表明美国对华技术出口政策自2018年起发生显著变化,实体清单收录的实体名单大幅增加,反映出美国对华技术管制态势趋严[1]。因而,本文的时间窗口设定为2018年至2021年。下载这一阶段实体清单中新增中国机构,筛选出类型为企业的机构,同时将分支机构合并到母公司名下,如华为公司旗下受限100余家企业均归为华为。人工核实新增企业集团的注册信息,删除因信息不全无法确认的机构后,对2018-2021年间新增的191家卡脖子企业信息进行初步统计,结果如表2所示。

表2 卡脖子企业属性信息的描述性统计

由表2可知,卡脖子企业整体呈现出以下三点特征:

一是窗口期内大批中方企业被纳入美方技术管制,且受限企业的集团化特征明显。各年度的代表性企业包括:2018年纳入管制的中国航天科工集团、中国电子科技集团公司;
2019年纳入管制的华为、海康威视;
2020年纳入管制的烽火通信、中国交通建设集团、中国船舶工业集团、中芯国际;
2021年纳入管制的长沙景嘉微电子、杭州士兰微电子、杭州中科微电子、湖南国科微电子等是国内微电子制造业的骨干。

二是企业的行业性质和受限领域呈现集中化趋势,反映美方对华打压重点集中于计算机和通讯等具有高外溢性的军民两用行业。从国民经济行业分类来看,卡脖子企业集中于计算机、通信和其他电子设备制造业(C39)、软件和信息技术服务业(I65)以及相关产品批发业(F51)。从美方公布的实体清单信息来看,64.9%的受限企业的制裁领域限定为电信和信息安全、计算机、电子。

三是企业间各种能力的差异偏大。首先,就创技术能力而言,尽管华为、中国电子科技集团、中国航天科工集团、中国航天科技集团、中芯国际专利族规模庞大,但大部分受限企业的创新能力不突出。进一步比较创新接近性,企业与标杆的专利族申请量之比均值为0.18,反映出大部分企业与标杆企业的创技术差距大。其次,就经营活跃性而言,仅有18.8%的卡脖子企业成功上市、企业受限前5年内对外股权投资均值为1.8次,说明大部分企业整合外部资源的能力亟待提升。最后,就披露年度报告的企业(华为和35家上市企业)而言,整体研发投入较高,与标杆企业的创新能力更为接近。

3.2 中方卡脖子企业画像展示

由于非上市公司不主动披露经营绩效、研发投入等数据,导致仅有35家上市公司和华为满足表1中所有属性的数据完备性。进一步分析发现,这36家企业除了专利族均值(4 461件)明显高于总体样本外,其主营业务分类、所有制类型、受限时间、领域、形式、原因等属性与总体样本高度一致。本节将对这36家卡脖子企业建立企业画像。首先,利用肘部算法确定最优K值,结果如图1所示。

图1 基于肘部算法的K值选择

由图1可知,该数据集SSE值下降的明显转折点为K=3,并在K=8时保持稳定。因而,本文以K=3作为肘部,将上述企业聚为3类,聚类结果如图2所示。

图2 卡脖子企业层次聚类结果

由图2可知,36家卡脖子企业抽象为3 类企业画像,横轴表示企业序号。为了揭示每一类企业画像的核心特征,绘制图3进一步对共性指标数据进行描述性分析。

图3 卡脖子企业画像

由图3可知,卡脖子企业第Ⅰ类画像命名为制造业骨干企业,其规模最大,包括21家卡脖子企业。上述企业均是2020或2021年被加入实体清单,受限领域同为电子、计算机、信息安全领域,美方主要控制对其出口设备、组件和零件、技术、软件等。为了进一步揭示企业间的差异,可将第Ⅰ类企业进一步细分为5个子群。子群1是活跃投资型企业(序号25和28),尽管创新和资产规模与标杆企业相距甚远,但受限前5年的股权投资分别高达28次和34次。子群2(序号6和21)是家电、石油开采等传统行业的创新领袖,创新规模均高于业标杆。子群3(序号13、23、32、35、14和33)包括6家处于维持型状态的企业,其研发投入、创新规模和经营业绩平平。子群4(序号5、24、11和34)包括4家亟待提升效率的企业,其扎根制造业超过20年,研发投入强度为8%-15%,研发人员占比为30%-45%,但专利规模、资产规模与标杆企业差距明显。子群5(序号12、17、22、18、27、8和16)包括7家企业,其存续时间长、研发经费和人员投入明显高于子群3,但除中芯国际外的其他企业在创新产出、企业规模上均与行业标杆存在极大差距。

卡脖子企业第Ⅱ类画像命名为高研发驱动企业,具体包括13家卡脖子企业。上述企业分别来自于信息服务业和制造业,研发经费投入大、研发人才济济,但创新接近性和规模接近性均低于标杆企业的9%。同时,可将第Ⅱ类企业进一步细分为2个子群。子群1(序号1、3、4、20、26、30、7和9)属于研发投入高地,包括的8家企业被限制前在制造业或信息服务业经营时间从13年至21年不等,研发投入强度为10%-20%,研发人员占比超出50%,除杭州海康威视资产规模达到标杆企业9%、奇虎360专利族规模达到标杆企业9%外,其他企业与标杆企业的差距更大。子群2(序号2、15、31、19和29)属于高研发驱动的成长型企业,包括的5家企业被限制前经营时间从5-13年不等,股权投资活动较频繁;
企业研发投入强度大于30%,研发人员占比超出50%,但其与标杆企业的创新接近性、规模接近性均不到1%。

卡脖子企业第Ⅲ类画像命名为规模领先企业,突出特征是企业与本领域标杆企业的资产规模接近、专利规模领先。画像中的第一家公司是华为(序号0),华为同时是2018年《财富500强》信息和通信行业标杆,当年资产总规模为967.93亿美元,专利族规模为88981件。第二家企业(序号10)是中国交通建设股份有限公司,该领域2019年的标杆企业是中国建筑集团有限公司,对比发现中国交建总资产为中国建筑的59.99%,但技术能力优于后者,专利族规模是后者的9.69倍。

3.3 中方卡脖子企业画像的启示

首先,聚类结果表明创新竞争力、受限根本原因是卡脖子企业内部分层的关键属性。画像I与画像Ⅱ的主要区别在于后者是典型的创新驱动发展模式,研发经费和研发人员投入双高。画像Ⅲ与画像Ⅱ的主要区别在于前者已将研发投入成功转化为研发产出和财务绩效,助力企业综合竞争力步入行业前列。

其次,针对画像Ⅲ指代的规模领先企业,其代表中国在相关领域的最高竞争水平,是美国长期关注和严防死守的重点对象。因此,要充分发挥新型举国体制优势,尽快突破产业链、供应链中的卡脖子问题,实现部分关键核心环节的国产化替代,推动领军企业的稳步发展。

第三,针对画像Ⅱ指代的高研发驱动企业,其尚未将研发投入转化为创新和市场优势,关键核心技术“断供”可能对其生存和发展产生较大影响。因而,高研发驱动企业应坚持非对称赶超战略思想,在标杆企业不知晓、不明晰、不情愿、不重视而缺乏绝对优势的若干领域采取高强度、集中投入,在关键领域形成局部领先优势,以点带面、梯次推进、“弯道超车”,进而带动产业结构的联动式调整。

第四,针对画像I指代的制造业骨干企业,其占比大且不乏烽火通信、中芯国际等知名企业,但总体呈现研发投入平平和产出偏低的问题。这些企业多分布在计算机和通讯制造行业的多个环节,能够满足常见的、中端应用需求。因而,应抓住国内大循环主导、全国统一大市场的政策机遇,加强融通合作以降低交易成本,增强产业链、供应链稳健性。

最后,政府部门和行业协会可根据企业画像结果预测尚未列入实体清单的高风险企业,如中国建筑、中国五矿集团、中国邮政集团等行业标杆,以及声光电科、电科数字等卡脖子企业控制的上市公司。行业协会应组织和指导潜在高风险企业关注外部环境变化,采用幕景分析等竞争情报方法进行预演、谋划和提前布局。

近年来,经济全球化和政治多极化趋势日益凸显,对西方国家主导的全球产业链布局提出了挑战。美国政府自2018年起将大批中国高技术领军企业和机构列入商务部实体清单中,严禁对其输出军民两用战略性技术和产品。这些企业有何特点?它们身处不同行业、创新能力和市场影响力各异,为何会被美方制裁?它们之间存在哪些共性特征呢?围绕上述问题,本文建立融合多源数据的卡脖子企业画像指标体系,并采用K-Prototype聚类算法对数值型和分类型信息同时进行聚类和画像,最终得出了一些有价值的结论。首先,针对2018-2021年新增的191家集团企业的统计分析表明,卡脖子企业具有明显的集团化特征,其中不乏中国航天科工集团、中国电子科技集团公司等代表国家科技创新力量的央企。第二,尽管美国商务部给出的主要制裁理由是“国家安全”,但统计发现2018年以来新增的中国卡脖子企业集中于计算机和通讯等具备军民两用前景行业,属于中美科技博弈的主战场而非传统的“中国军事威胁论”的范畴。第三,进一步以华为和35家上市企业为代表开展实证研究,发现这些企业的专利持有量更高,与标杆企业的创新能力更为接近;
36家企业聚类形成3类卡脖子企业代表,一是占据大多数的、多年深耕制造业的骨干企业,二是高研发驱动的追赶型企业,三是华为和中国交建2家为代表的规模领先企业。

综合来看,本文对技术管制情报相关研究的理论贡献主要体现为两点。一是当前研究多利用实体清单的技术属性进行规范性研究和基础统计,对比中美两国在产业层面的技术差距,忽略了对实体清单主要的直接制裁对象——企业——的细粒度研究。本文首先将是否被列入实体清单作为判断标签,从而清晰界定卡脖子企业。进而建立针对卡脖子企业的画像指标体系并进行统计分析和实证研究,从多方面揭示卡脖子企业的特征,不仅有助于推动研究对象从宏观、中观向微观的深化,还能够警示潜在高风险企业。二是用户画像研究多面向数值型数据;
企业画像相关研究起步较晚,多采用规范性研究范式。本文采用的K-Prototype聚类方法能够同时处理数值型、分类型属性,有助于扩充画像研究的属性多样性;
提出的卡脖子企业画像方法可作为未来企业画像量化研究的基础框架。此外,后续研究可在过滤企业财务属性后,在更大范围内利用本方法进行企业画像。

最后,鉴于本研究重在构建卡脖子企业画像,对画像更新和应用的探讨有限,建议未来研究加强对这两方面的探讨。一是借鉴用户画像更新方法,如基于遗忘衰减规律的方法、基于时间窗口的方法、基于反馈的方法等,增强企业画像更新能力。二是征集专家意见对K-prototype算法各属性进行赋权,进一步增强企业画像的精确度。

猜你喜欢卡脖子标杆画像威猛的画像小哥白尼(神奇星球)(2022年3期)2022-06-06本期导读环球时报(2022-04-18)2022-04-18种子科技:打赢种业翻身仗 如何破解“卡脖子”难题今日农业(2021年3期)2021-12-05全省农业科技“五五”工程暨农业“卡脖子”关键技术攻关推进会在黄冈召开湖北农业科学(2021年8期)2021-05-11“00后”画像新世纪智能(高一语文)(2020年9期)2021-01-04卡脖子与保鲜问题中关村(2020年11期)2020-12-21哨兵“后退一步,走”,树立“守规矩”鲜活标杆公民与法治(2020年22期)2020-12-14画像非公有制企业党建(2020年10期)2020-10-27北京城建:从标杆到引领,兴胜公司在跨越中华建设(2020年5期)2020-07-24网络小说标杆作品2019网络文学评论(2019年6期)2019-12-13

推荐访问:卡脖子 美国 画像