检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome 、Edge、Firefox 。 X
2023年3月,科技部会同自然科学基金委启动“人工智能驱动的科学研究(AI for Science)”专项部署工作,布局“人工智能驱动的科学研究”前沿科技研发体系。在2018年,微软的数据科学家Wee Hyong领导成立了全球精英研究团队,启动了微软的“地球人工智能计划”(AI for Earth)[1]。该计划旨在为个人和组织提供人工智能技术支持,专注于解决涉及地球健康和人类未来的关键问题。主要关注农业、水资源、生物多样性和气候变化等四大领域,为这些问题提供可持续的解决方案。
AI for Science 在地球科学领域主要的研究进展有构建地理空间基础模型,开发地学学术大模型和遥感AI大模型等,主要解决的问题有卫星图像分析、预测农作物产量、检测温室气体、灾害防治、自然资源管理、农业估产、城市运营等。
一、地理空间基础模型
2023年8月,IBM与Hugging Face合作发布了基于NASA卫星数据构建的IBM watsonx.ai地理空间基础模型[2]。这是Hugging Face迄今为止最大的地理空间基础模型,也是首个与NASA合作构建的开源AI基础模型。该模型旨在解决气候科学研究中获取最新数据的挑战,并通过与NASA的合作扩大对AI技术在气候和地球科学研究中的应用。模型由IBM和NASA共同训练,利用Harmonized Landsat Sentinel-2卫星数据,并在洪水和焚烧区域的标记数据基础上进行调优。相较于领先技术,该模型在使用一半标记数据的情况下实现了15%的效果改进。除了观测数据分析,该模型还可应用于追踪森林砍伐、预测农作物产量、检测温室气体等任务。
二、地学学术大模型
2023年12月,上海交通大学团队推出了一个名为GeoGalactica的地学学术型大模型,其参数数量达到了300亿[3]。此前,该团队在五月份发布了70亿参数的地学大语言模型K2,而在七月份正式完成了GeoGalactica的训练。GeoGalactica的训练语料库主要覆盖计算机科学和生物化学领域的文献,尽管地球科学领域的覆盖相对较少。为了增强在地球科学领域的专业知识,团队收集了约600万篇专门针对地球科学的研究论文,这些论文由地学领域的专业专家精心挑选。
除此之外,GeoGalactica还扩展了基于K2的GeoSignal数据集,以更全面地支持地球科学研究中的自然语言处理任务。扩展后的数据集用于对模型进行进一步的预训练和微调。通过不断的改进和训练,GeoGalactica作为更进一步探索大语言模型在地学领域能力的演进版本,展现出了更高水平的地学科学语言生成能力。这一系列模型的问世为地学研究提供了新的视角和工具。
三、遥感AI大模型
2023年10月,阿里巴巴达摩院发布了具有地表万物识别功能的遥感AI大模型,标志着人工智能技术在遥感领域取得了重大突破[4]。该模型通过深度学习技术能够快速准确地识别农田、农作物、建筑等地表万物,提高了遥感图像的分析效率。具有多模态数据处理能力,支持可见光、多光谱、高光谱、激光雷达等多元化数据,提升了技术的适用性和精度。借助阿里云的高性能计算能力,模型在处理大规模遥感数据时表现出色,为实时监测和应急响应提供可能。阿里达摩院将其开放在AI Earth地球科学云平台上,促进了遥感技术的普及和应用创新。
该模型的发布具有四大亮点:1)地表万物识别,通过深度学习自动提取地物特征提高分析效率;2)多模态数据处理,支持多种光谱数据,增强适用性和精度;3)高性能计算,借助阿里云提高效率,实现复杂地表分析任务的快速完成;4)开放性平台,在AI Earth地球科学云平台上开放使用,方便用户进行实验和开发。
该模型对灾害防治、自然资源管理、农业估产、城市运营等领域具有重要影响。在灾害防治方面,能够提供早期预警和评估支持;在自然资源管理中,帮助进行有效的资源管理和利用;在农业估产方面,通过监测和评估农作物生长状况实现精准估产;在城市运营中,为城市规划和社会管理提供丰富数据支持。这一技术突破为地球科学领域带来了新的发展机遇,同时也为相关行业带来了挑战。这一创新有望推动遥感技术更加智能、自动和精细,为人类提供更加便捷和高效的服务。
参考文献
[1]. AI for Earth | 如何用数据科学“拯救地球”?[EB/OL].[2018-10-23]. https://www.sohu.com/a/270715876_629694.
[2]. NASA 携手IBM 发布Hugging Face平台最大开源地理空间AI基础模型[EB/OL].[2023-08-08]. https://china.newsroom.ibm.com/2023-08-08-NASA-IBM-Hugging-Face-AI.
[3]. Lin Z, Deng C, Zhou L, et al. GeoGalactica: A Scientific Large Language Model in Geoscience[J]. arXiv preprint arXiv:2401.00434, 2023
[4]. 遥感AI大模型发布:阿里达摩院领跑未来科技趋势[EB/OL].[2023-10-20]. https://aiqicha.baidu.com/qifuknowledge/detail?id=17501227246