检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome 、Edge、Firefox 。 X
2024年8月26日,美国信息技术与创新基金会(ITIF)发布《中国人工智能创新力如何?》(How Innovative Is China in AI?)报告。报告认为,受益于领先的研究型大学、强大的科技行业以及迄今为止支持性的监管环境,美国一直走在人工智能(AI)创新的前沿。然而,在过去十年中,中国已崛起为一个强大的竞争者。中国强大的学术机构和创新研究,尤其是清华大学,催生中国大多数顶尖的AI初创企业,包括目前排名前四的生成式AI初创企业——智谱AI(Zhipu AI)、百川智能(Baichuan AI)、月之暗面(Moonshot AI)和稀宇科技(MiniMax)——它们均由清华大学的教职员工和校友创立。中国在AI研究出版物数量上居全球首位,在生成式AI领域与美国不相上下,而且正在迅速缩小与美国在大语言模型(Large Language Models,LLMs)领域的差距,尤其是在双语基准方面。
但是中国AI创新如何呢?报告从三个角度来评估中国在AI领域的创新。首先,评估AI创新的全球数据,从科学论文、专利、人才和基础设施等方面评估中国对AI的创新投入;其次,采访并与全球专家就中国AI行业举行焦点小组圆桌会议;第三,对两家领先的AI公司(智谱AI和Moonshot AI)进行深入的案例研究评估。
报告研究得出的结论如下:
一、评估中国对AI的创新投入
1、中国在AI研究出版物数量上居全球首位,全球AI研究论文发表量最大的五家机构都是中国机构。但是中国的AI研究出版物质量(或影响力)不如美国,引用量较少,私营部门的参与度也较低,中国AI研究领域排名前十的机构都是学术机构,而美国顶级AI研究机构则是学术机构和私营企业的混合体,美国在将尖端研究转化为实际产品方面表现出色正是得益于其私营企业的推动。在新兴的生成式AI领域,中国和美国的出版水平相似,截至2023年,中国约有12450篇生成式AI出版物,而美国有12030篇。尽管在出版物数量上中国和美国不相上下,但在引用量方面却相差甚远。在引用量最高的生成式AI研究前10名榜单中,中国仅占据一席之地。相比之下,美国占据排行榜的一半,包括前五名中的四名。
2、中国在AI专利方面数量遥遥领先但质量落后。自2013年以来,中国一直是授予AI专利的最大来源国,到2022年,中国组织提交的AI专利数量约为美国同行的四倍,中国专利局授予的专利数量几乎是美国专利局的三倍。尽管中国授予的AI专利数量较多,但是专利质量参差不齐。中国专利局颁发的许多专利质量相对较差,中国的专利数量很难与美国专利商标局(USPTO)或欧洲专利局颁发的专利数量进行比较。事实上,在中国首次提交的AI专利中,只有4%也在其他司法管辖区提交申请,而在美国专利商标局首次提交的专利比例为32%,这表明美国专利的质量明显更高。
3、中国在人才培养方面处于领先地位,留住比过去更多的人才。在培养顶级AI研究人员方面,中国处于领先地位。智库MacroPolo的分析显示,到2022年,中国培养了全球47%的顶级AI研究人员(“顶级”定义为所有AI研究人员中的前五分之一),而2019年这一比例为29%。最顶尖的AI研究人员(定义为所有AI研究人员中的前2%)中,26%来自中国,而28%来自美国。与2019年相比,这是一个显著的增长,当时中国仅培养10%的顶尖AI研究人员,而美国则培养35%。MacroPolo的全球AI追踪器发现,到2022年,28%的顶级AI研究人员在中国工作,而2019年这一比例仅为11%。这一趋势表明,中国正在成功地为其顶级人才创造有吸引力的机会和环境,平衡外迁并促进国内创新。
4、在AI基础设施方面,中国在数据数量上处于领先地位但在数据质量和多样性方面落后。获取先进芯片对于研究和开发先进的AI系统至关重要,因为这些系统通常需要强大的计算能力。中国在AI芯片上高度依赖美国,中国企业在芯片设计和制造所需的子行业都存在弱点尤其是光刻、计量和检测。
二、采访专家对中国如何支持原始创新能力提出三个关键见解
1、中国政府提供财政支持,培育具有高潜力的企业。政府使用的最重要的两个机制是政府引导基金和补贴。
2、虽然许多中国新兴的生成式AI公司正试图复制OpenAI在ChatGPT上的成功,但在中国还没有出现一个明确的领导者或突破性的应用,成为最受欢迎或应用最广泛的应用。然而,在清华大学等高校的支持下,中国出现一批新兴的生成式AI初创企业,如智谱AI、百川智能、月之暗面(Moonshot AI)、稀宇科技(MiniMax)和零一万物(01.AI),这五家公司正跻身中国AI“独角兽”之列,是中国生成式AI生态系统的核心,特别是智谱AI的模型表现稳定,是挑战OpenAI的中国领跑者。
3、与美国相比,中国能够生产出具有竞争力的、有时甚至更优秀的AI模型,凸显其高水平的原始创新能力。中国前沿AI模型正在缩小与美国的性能差距。开发中国顶级模型的参与者既有初创企业,也有科技巨头。中国的开源LLM生态系统正在获得巨大的发展,中国开源模型的一些迭代也击败美国同行。
三、公司案例研究
1、智谱AI
智谱AI是中国最杰出的生成式AI初创公司,是中国估值最高的AI初创公司之一,截至2024年5月,其估值为30亿美元。就像OpenAI创建ChatGPT作为GPT模型的专门应用一样,智谱AI创建了ChatGLM作为基于其GLM架构的应用,旨在出色完成中英文双语任务。但ChatGLM并不是智谱AI的唯一产品;该公司拥有一系列产品,包括专为网络搜索和检索功能而设计的WebGLM;旨在理解和生成文本和图像的VisualGLM;旨在有效完成需要解释视觉数据任务的多模态理解模型CogVLM;以及代码生成模型CodeGeeX2-6B等。
2、月之暗面(Moonshot AI)
Moonshot AI成立于2023年3月。该公司专注于大语言模型(LLMs)的开发,但其独特之处在于它擅长于长文本处理。2023年10月,Moonshot AI推出全球首个支持输入20万汉字的聊天机器人Kimi,主打无损记忆以及“长文本(Long Context)”,善于读长文、搜网页,可以用于会议纪要、辅助编程、文案写作等场景,据称这一容量远远超过其最接近的竞争对手。2024年3月,Moonshot AI声称Kimi可以在一次提示中处理多达200万个汉字,短短六个月内就增加十倍。
主要参考文献:
1、 https://itif.org/publications/2024/08/26/how-innovative-is-china-in-ai/
2、 ITIF.How Innovative Is China in AI?