检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome 、Edge、Firefox 。 X
近来,日本推进人工智能(以下称“AI”)产业发展的脚步持续加快。2023年12月21日,日本AI战略会议在首相官邸举办第七次会议;2024年1月12日,日本以人类为中心的AI社会原则会议举办第三次闭门会议。其中,此次AI战略会议除了AI相关专家之外,首相岸田文雄、科学技术政策担当大臣高市早苗、总务大臣松本刚明、文部科学大臣盛山正仁、经济产业大臣斋藤健、数字副大臣石川昭政等日本政府高层一同出席会议,听取关于广岛AI进程、AI企业指导方针的报告,并就2024财年AI战略会议的议题进行讨论。会上,总务大臣提出国立研究开发法人信息通信研究机构(以下称“NICT”)已经做好准备向日本国内的AI开发者提供其所拥有的高质量日语数据,用于AI学习。此外,日本内阁府已经建立面向AI开发者的沟通窗口,日前日本国会通过的日本政府2023财年(2023年4月1日-2024年3月31日)补充预算也为生成式AI计算资源整合项目新安排了690亿日元。日本正在按照内阁府制定的促进提供AI学习数据行动计划,以提供政府数据为突破口,推动日本国内生成式AI的开发。以下就内阁府制定的“关于促进提供AI学习数据的行动计划1.0”(以下简称“行动计划”)进行介绍。
一、行动计划的概要
日本内阁府在第六次AI战略会议上发布旨在以AI易于读取的格式向国内生成式AI开发者提供政府数据的行动计划。根据行动计划,提供的数据包括政府审议会资料、法令、专利、地图等信息等。对于目前尚未对外公开、政府所属研发机构保存的研究数据,也将根据企业的需求提供。由于此前日本政府数据大多以不易于计算机处理的PDF格式公开,行动计划将大力推动政府数据格式转换,转为易于AI学习的格式。为了推进行动计划,日本内阁府和数字厅新组建一支专门队伍——数据项目团队,从2024年开始服务,计划从2025年开始将业务移交给国立印刷局并继续进行。最初一年,政府数据的使用费将由日本政府承担,免费提供,但从2025年之后可能会转为收费,政府数据的转售将受到严格限制。
二、行动计划的五大目标和具体举措
1、目标一:大力宣传将政府数据提供用于AI学习
利用各种机会进行宣传,促进将政府持有的数据用作AI学习,进一步增强日本AI模型的开发实力。具体举措包括:一是在AI战略会议、AI战略团队的官方网站上发布电子政府(e-Gov)数据门户网站链接,介绍政府上传的超过22,000个数据集。二是敦促相关省厅尽快将政府持有的数据上传至e-Gov数据门户网站。三是在AI业内人士汇集的各种活动上宣传e-Gov数据门户网站、人工智能日本(AI Japan)数据门户网站(https://www.ai-japan.go.jp/menu/learn/ai-53/)以及内阁府等建立的沟通窗口。四是梳理能够公开利用的国立研发机构数据,将可下载的网址(URL)列表,发布在国立研发机构的网站上。
2、目标二:设置面向AI开发者的沟通窗口
接受关于AI学习数据的咨询(数据需求等),并做出回应;汇总企业需求,在未来制定政策时作为重要参考。具体举措包括:一是设计业务流程,在内阁府设立由高级专业人员组成、专门面向AI开发者的沟通窗口,接受希望政府提供AI学习数据的人员的咨询,并与相关省厅等合作迅速做出回应。二是敦促相关省厅和相关机构设立类似的窗口服务。三是掌握和积累来窗口咨询的AI学习数据相关企业需求等信息,并进行研究分析。
3、目标三:推进非机读数据的格式转换
基于企业需求,针对用于AI学习的数据,将非机读数据(PDF或JPEG格式等)转换为机读数据(文本或HTML格式等)格式。具体举措包括:一是在AI战略团队下设数据项目团队。二是明确机读数据格式的准确定义。三是将公开数据的机读数据格式转换作为内阁府项目试行,同时探讨与其他省厅合作开展可行的案例或进一步明确具体推进方向。四是在总结机读数据格式转换试行项目成果的基础上,探讨制定中长期的数据格式转换推进方法、体制及费用等规则,并建立业务框架计划。五是针对政府持有的数据,将AI开发者迫切需要用于AI学习的数据进行分类整理,并制定清单。六是将机读数据格式转换作为政府整体的行动。
4、目标四:向符合条件的申请者迅速提供访问受限的数据
对于AI开发者迫切需要用于AI学习的数据,排查是否具有访问限制,在法律允许访问的前提下,向符合条件的申请者迅速提供访问受限的数据。具体举措包括:一是在2024年年初以共同研究的形式提供NICT所持有的日文数据,作为先行案例。二是针对政府持有的数据,确认AI开发者迫切需要用于AI学习的数据是否存在访问限制,并研究探讨是否可以提供访问支持。三是针对允许AI开发者访问但却受限的数据,制定访问所需的条件和文件等,并向符合条件的申请者迅速提供。
5、目标五:政府自身试行AI学习
政府积极尝试AI学习,用于提高工作效率和提升服务,挑战更具创造性的业务(如拟订政策性文件草案等)。具体举措包括:一是由政府自身尝试将公立机构持有的数据用于AI学习。二是针对实施AI学习的政府相关项目和业务,汇总与AI学习数据相关的问题及其解决方案等。
参考资料:
1. AI戦略会議 - 科学技術・イノベーション - 内閣府. [EB/OL]. [2024-1-25]. https://www8.cao.go.jp/cstp/ai/ai_senryaku/ai_senryaku.html
2. AI学習データに関するコミュニケーション窓口 - 科学技術・イノベーション - 内閣府. [EB/OL]. [2024-1-25]. https://www8.cao.go.jp/cstp/ai/aidata/communicationdesk.html
3. 人間中心のAI社会原則会議 - 科学技術・イノベーション - 内閣府. [EB/OL]. [2024-1-25]. https://www8.cao.go.jp/cstp/ai/ningen/ningen.html