工作动态
当前位置: 首页 >> 双一流建设 >> 工作动态 >> 正文

地球科学领域垂直大模型——“元古大模型”正式发布

时间:2024-12-10 作者: 编辑:文新 浏览量:

  2024年12月7日,在中国古生物学会新技术新方法专业委员会(筹)第一届会员代表大会暨第一届一次学术年会上,由中国地质大学(武汉)与科大讯飞以产学研协同模式打造的地球科学领域垂直大模型——“元古大模型”正式发布

“元古大模型”正式发布


   依托地球科学学院宋海军教授团队在地球生物学领域的研究成果,研究团队对62万多张古生物化石图片、3000篇地学文献的45万余条地质实体与属性进行数据清洗与标注,这些数据构成了千亿参数的“元古大模型”基石。

  依托处理后的高质量地学数据集,团队采用预训练和微调相结合的方法,完成了对古生物化石图片识别和地学文献实体抽取任务的训练,并利用大模型技术,实现了古生物化石的复原工作。区别于传统机器学习方法,“元古大模型”综合运用了图生文、文生图、文生文的生成式预训练模型架构,成功验证了在全国产化算力和算法基础上,利用多模态大模型技术解决地球科学领域问题的技术可行性。

按照化石形态学特征复原的鱼类图


  “元古大模型”的体系架构是一个综合性框架,旨在通过云端运行的智能算力基础设施和多模态大模型集成能力,形成一个全面、高效的地球科学研究、教育教学和社会服务为一体的智能化系统。目前,已推出古生物化石标本识别助手、地质文献数据挖掘助手和古生物学智能知识问答助手,并将陆续上线地学智能搜索引擎和古生物科普数字人,为地球科学专业的学生、地质工作者等提供全方位的教学、实践、科研及服务支持。

  古生物化石标本识别助手能够识别120类常见的古生物化石、岩石,并能以科学工作者视角精细化描述化石数量、颜色、外形结构等多维度信息,并基于化石结构推理出化石种类。目前其能力已同步训练到星火大模型最新版本,可供公众及地学科研工作者调用和使用,实现科研成果向社会服务转化。

古生物化石标本识别助手


  地质文献数据挖掘助手:依托训练完成的地学文献实体抽取任务,通过大模型辅助地学文献研读、自动抽取地学领域实体和属性,攻克了由于专业术语多、信息的隐式表达、数据稀缺导致的通用大模型实体抽取覆盖率低等技术难点,为基于大规模文献揭示极地温度演化新规律、发现古生物、古环境等领域的新规律提供有力的工具支持。

地质文献数据挖掘助手-实体抽取


  此外,面向师生及地质工作者打造的地学智能搜索引擎也将逐步开放。该引擎基于“元古大模型”强大的推理能力,可实现地学专业知识的即问即答,以及面向各类地学专业网站科普资源、公开的地学音视频资源、预印本网站论文等丰富数据的精准搜索。


地学智能搜索引擎


  “元古”,来自于地质时代“元古宙”,是地球历史上存在时间最久的一个宙,也是智力起源的时代,真核生命、多细胞生命和动物均起源于元古宙。“元古”寓意着地球科学的古老与深邃,也象征着智慧与创新的崭新起点,是地球科学领域深刻变革的星星之火。未来,“元古大模型”将以“科研工作者的科研助手”“地大学习者的良师益友”“地质工作者的勘探利器”“地学爱好者的百科全书”为最终目标,不断优化数据质量、丰富数据类型、训练科学任务、开发创新应用、提供多样化的应用场景,为地球科学学科发展作出新贡献。


                                                                                                        文章内容来自“科大讯飞集团”微信公众号



友情链接: