2023-05-08 09:54:56
人工智能技术度量结果及启示
张光平 吴杰
从1997年“深蓝”打败全球国际象棋世界冠军到2006年深度学习的崛起,特别是近期ChatGPT发布以来,人工智能技术受到前所未有的关注度,是几个月来全球各种学术期刊、网络及媒体讨论宣传的热点。但大量的技术性学术论文和书籍及讨论评论却鲜有对机器学习和深度学习的技术度量研究,使得我们对之前相关技术进展难以把握,对今后的预判更缺乏必要的依据。
技术度量是一项较为复杂的跨学科题目。各企业研发投资是其科技产出的必要条件,但由于企业研发效率有较大的差异,仅从研发投资金额难以度量出企业的科技程度。作为技术载体的各类专利自然承载着各类技术的成分,但由于各经济体国际专利的技术含量或质量同样有较大的差异而难以直接比较,因此国际专利数量也难以直接用来对技术进行度量。本文从世界知识产权组织二十多年来的各类专利数据中提炼或“萃取”出人工智能和生成式人工智能技术对应的专利,进而利用各经济体平均每项国际专利产生的知识产权“出口使用费”,最后利用合适的数据模型设计并计算出人工智能发展指标、自主度指标和国际化指标在内的人工智能技术指标体系度量结果。这些技术度量结果不仅可以用来计算对经贸、金融和包括就业在内的社会影响,也可以为其今后发展预判提供必要的参考依据。
一、基于技术演进路径“萃取”技术度量所需的专利数据
所有理论和技术的发展提高都是在现有知识的基础演进升华,都有一个从量变积累到质变飞跃的过程,人工智能技术也不例外。要科学预判人工智能技术今后发展,首先要定位当前技术,总体把握之前十多年甚至二十多年来技术演进节奏,特别是要找到能用来科学判断技术演进的要素或指标。
科学技术不仅自然隐含或“嵌入”于各种产品功能中,当然也隐含在生产这些产品的产业链或生产链中。我们目前关注的产品价格,不仅隐含了数以百计或千万计的技术细节,也反映了市场供求关系,直接从价格中提炼或“萃取”技术度量要素显然存在较大难度。
但是世界知识产权组织(WIPO)公布的全球各经济体各类专利数据反映了全球技术扩散的主要内涵,是技术度量的最佳数据源。我们可以从这些专利数据的“金矿”中,基于技术演进路径,运用最新的数学方法来提炼或“萃取”出人工智能和生成式人工智能的专利类型,进而设计并计算出相应的技术度量结果。
二、人工智能技术对应的专利类型选择
(一)人工智能的概述
人工智能就是让机器具有人类的智慧,这是人类长期追求的目标。或简单地说,人工智能就是机器学习的相关方法和结果,截至目前能够学习的机器也非计算机莫属。因此,人工智能与计算机关系密切,是计算科学的一个分支,主要研究、开发、用于模拟、延伸、挖掘和扩展人类智能的理论、方法、技术及应用系统等。
(二)人工智能技术的核心专利涵盖计算机技术。尽管人工智能技术涉及面广,这里难以系统介绍,但全球人工智能的绝大部分成果应该涵盖在各类学术期刊和计算机技术相关的专利中。世界知识产权组织公布的36类国际专利中专门有计算机技术一大类,而且此类专利二十多年来保持了36类专利数量最高的地位未变,表明计算机技术几十年来对其它技术和全球的巨大影响力。因此,计算机专利应该是人工智能技术的核心专利。
(三)人工智能技术还涵盖相关的专利技术。除计算机这项人工智能核心专利外,人工智能的其它专利类型需要用相关性、相似性和同步性相关原则来确定。通过模型可以确定计算机专利与其他35类专利(包括其他34类国际专利外的其他专利共35类)之间相互影响程度,进而依据影响程度来确定人工智能的其他主要专利类型。计算结果显示,与计算机技术相互影响程度最高的专利包括半导体专利、数字通讯专利、基于计算机的管理方法、测量、控制、声像、电讯和基础通讯等,这些专利和计算机专利一起构成了人工智能技术的主要专利。
三、人工智能技术指标体系的度量结果
(一)各经济体和全球人工智能技术发展指标。
人工智能发展指标由各经济体内自己授权的人工智能专利数据构成。如2016年到2021年,我国人工智能专利数据保持了八大货币发行体的最高增幅,虽然年复合增长率从之前五年的28.4%略降到了17.1%,但仍保持了前八大货币发行体之外其他国家和地区人工智能专利增幅最高的记录。然而,由于各经济体国际专利不能直接比较,直接利用各经济体专利数据计算出的发展指标同样具有不可比的局限性。因此,本文利用张光平和周小全(2023)一文给出的相应的方法进行加权处理后形成可比的发展指标。结果显示,2016-2021年我国人工智能技术年份复合增长率为38.3%,较之前五年年均增长率37.7%提高了0.6%,这表明加权国际专利计算出的各经济体人工智能技术发展指标具有相对合理性。各经济体加权专利可以进行直接比较,将各经济体人工智能加权专利值相加,我们即可获得全球人工智能发展指标。
(二)全球人工智能专利的国际化指标总体度量结果。基于人工智能核心专利的构成分析,利用世界知识产权组织公布的全球100多个经济体境外授权人工智能专利、在辖内授权的其他经济体的人工智能专利数以及相应经济体知识产权进出口使用费数据,运用前述的数学方法即可计算出全球人工智能专利的国际化指标总体度量结果,即各经济体人工智能加权专利占全球总加权专利比重(详见表1)。
数据来源:根据世界知识产权组织公布的2000-2021年各经济体人工智能专利数据和张光平、周小全(2023)主要货币发行体国际专利平均权重结果计算得出;2022-2035年的结果根据2015-2016年主要货币发行体国际专利年均复合增长率估算得出,其中日本2022-2035年国际专利下降率为2015-2021年下降率8.51%的一半,中国2022-2025年、2026-2030年和2031-2035年的三个时间段内国际专利增长率分别为2015-2021年年均复合增长率40.91%的一半、四分之一和八分之一。
表1显示,2015年、2017年和2019年,中国人工智能国际化之水平分别超过了澳大利亚、加拿大、瑞士和英国,显示近年来我国人工智能技术快速提高的良好态势;根据相关货币发行体2015-2021年国际专利年均复合增长率估算,2023年、2027年和2031年,中国人工智能技术国际化将分别超过欧元区、日本和八大主要货币发行体外其他国家和地区,成为仅次于美国的全球第二大人工智能技术国。
(三)全球主要经济体人工智能技术自主度指标
自主度指标是指该经济体境外授权的人工智能专利产生的总知识产权出口使用费占相应的人工智能知识产权进出口使用费 的比重,相应的各经济体相对与另一经济体人工智能技术自主度则是经济体在另一经济体授权的人工智能专利产生知识产权出口使用费占相应的人工智能知识产权进出口使用费(从另一经济体人工智能进口使用费,本经济体授权另一经济体的人工智能专利产生的相应使用费)。计算结果显示,2010年我国人工智能技术对欧元区的相对自主度首次超过了50%、2017年对日本、2019年对美国的相对自主度首次超过了50%;2021年我国人工智能技术对全球首次实现了相对自主,而到2025年前后我国人工智能技术对全球的自主度有望首次超过六成,显示未来我国人工智能技术自主度将有显著提升的潜能。
我们可以类似地计算出任何经济体人工智能技术对其他经济体人工智能技术自主度度量结果,这些结果反映经济体间人工智能技术相对变化或相对落差,这里不拟一一列举。如上计算出的各货币发行体人工智能发展指标、人工智能国际化指标和人工智能自主度/依赖度指标一起构成了全球人工智能指标体系。
四、生成式人工智能技术专利的确定及相关结果
近几个月来,基于神经网络深度学习的生成式人工智能在全球范围内引起了广泛的关注,然而从专利角度定量分析却难见踪迹。生成式人工智能专利(基于神经网络学习的各类算法专利)主要涵盖在各经济体计算机专利中,WIPO检索分类主要体现在“基于特定计算模型的计算机系统”(国际专利分类IPC G06N)和“语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码”(IPC G10L)中。这些专利的数据对我们判断生成式人工智能技术变化至关重要。由于如上人工智能指标体系是基于WIPO 36类国际专利在境外授权的一级专利或一级国际专利数,而IPC G06N和IPC G10L属于计算机专利的二级专利。要获得全球各经济体这些专利本地授权数,特别是境外授权数,需要较大的工作量,我们难以及时获得对生成式人工智能技术如上文对人工智能技术的度量结果。
尽管美国计算机技术国际化从2000年的64.4%下降到了2013年的37.4%,但2021年又回升到了50.3%,显示美国仍保持了全球计算机技术国际化程度最高的国家。美国该两类专利的变化对全球生成式人工智能技术有很好的代表性。由于美国多年来保持是全球计算机技术国际化程度最高的国家,美国IPC G06N专利数据对全球生产式人工智能技术的发展有较好的代表性。2004-2022年美国G10L类专利年均复合增长率为11.33%,仅相当于同期G06N类专利年均复合增长率41.75%的四分之一,而且美国同期G10L类专利数与G06N类专利数比例从2.59持续下降到了0.29,表明G10L类专利并非近期生成式人工智能技术高速增长的核心动力,下文重点介绍和分析G06N类专利。
数据显示,2013-2022年,美国计算机专利年均复合增长率-1.73%,同期美国G06N专利年均复合增长率41.75%,略超摩尔定律两年翻一翻所需的年均复合增长率41.42%,这是几十年来全球半导体技术外另一个高速增长的技术领域(美国G06N外其他计算机专利的同期年均复合增长率仅-11.51%)。另外,2004-2013年,美国G06N专利占美国计算机专利比重保持在2.51%的上下,变化不大,而2013-2022年占比则从2.24%猛增到了40%以上的高位,以近乎“摩尔定律”相应的速度增长,成为美国计算机技术高速发展的热点和动力,与G06N外其他计算机技术明显回落形成显著反差。由于缺乏G06N专利的全球分布的完整数据,我们无法获得全球生成式人工智能技术指标体系的国际化度量结果,但美国此类技术十年来的增长为我们判断未来发展趋势提供了较为有力的证据。期盼今后能够在数据齐全的情况下获得与上文全球人工智能指标体系相似的结果。
五、小结
近期全球范围内关于聊天机器人的讨论更引出了人工智能奇点(人工智能取代人类的时间点)会在今后一二十年到来(“只剩7年!人工智能奇点逼近人类”,美国《大众机械》月刊站2023年2月14日报告,参考消息3月1日报道)。这些报道缺乏对技术进步的有效度量,因此缺乏必要的科学性。受“摩尔定律”减速的影响,近十年来全球计算机加权专利年均复合增长率从之前十年的8.3%下降到3.3%,但受神经网络学习领域的快速发展的带动,美国深度学习的相关专利达到“摩尔定律”所需的两年翻一翻的高速增速,预示着该技术今后有着巨大的发展潜能。
本文利用全球国际专利数据和各经济体知识产权进出口使用费数据对全球人工智能技术发展指标、自主度指标和国际化指标进行了定量化分析,相关结果有利于我们更准确地认识和把握20多年来全球人工智能技术变化和主要经济体间相对自主度变化。
正如周杰5等(2023)所示,生成式人工智能技术的局限性决定了该技术不可避免地产生与事实不符的相关内容,ChatGPT也莫能例外,并且还存在感知缺乏以及学习规则学习方法的组合爆炸问题,仅基于当前对神经网络研究的简单结果而得出的生成式人工技术及后多少年可超过人类的结果为时过早。近年来,在市场相对低迷时国际上涌现出数字货币、元宇宙等产品,也是重在概念宣传推动,离人类真实应用场景还有非常远的距离。
(张光平现任上海市人民政府参事、中国科学技术发展战略研究院高级顾问、上海银保监局原一级巡视员;吴杰现任复旦大学计算机科学技术学院副院长、研究员、博士生导师。笔者特别感谢上海专利商标事务所有限公司范征总经理一年多来对笔者相关研究讨论的启发和支持;感谢吴红兴、李智鑫、任文和张俪馨对本文研究的支持。)
参考文献:
1:丘锡鹏,2020,《神经网络与深度学习》,机械工业出版社;
2:张光平、周小全,2023,“科技是企业发展和价值的引擎”,2023年1月17日,上海证券报;
3:张光平、郑润祥,2023,“从MBA向MTA的演进是科技时代的必然趋势”,2023年2月17日,上海证券报;
4:张光平、刘军,2023,“如何度量专利的市场价值?---技术流、技术平衡表和市研率的重要性”,2023年4月12日,国际金融报;
5:周杰、柯沛、丘锡鹏、黄民烈、张军平,2023,“ChatGPT:潜力、前景和局限”,2023年2月28日,复旦大学在线出版。
来源:上海证券报 https://news.cnstock.com/news,yw-202305-5057422.htm