近日,中国科学院东莞材料科学与技术研究所(下称“东莞材料所”)发布国内首个专注于材料科学领域的AI智能体升级版MatChat 2.0。该产品基于80万篇权威学术论文构建,在知识库规模、推理能力等多维度实现升级,更以1.3%的超低幻觉率大幅优于多款主流大模型,为材料科学研究打造了全新的智能研究范式。
作为材料科学领域的专业AI智能体,MatChat 2.0的知识库实现跨越式扩容,从原有28万篇学术论文拓展至80万篇以上,知识储量增长近三倍。其知识库内容均来源于权威学术期刊与会议论文,经严格筛选与质量把控,覆盖新能源材料、电子信息材料、结构材料、生物医用材料等材料科学各分支领域,确保信息的前沿性与可靠性。
除知识库外,MatChat 2.0在响应效率、领域理解、应用场景三大维度同步实现核心升级。
响应效率上,通过引入全新的动态路由算法与知识检索优化技术,平均响应时间压缩至秒级,可为科研人员提供即时文献调研支持;领域理解方面,系统搭建四层协同架构,智能上下文持久层支持十余轮持续深度对话,意图分类与路由层精准识别用户需求,智能体推理与执行层兼顾深度思考与快速响应,学术知识数据库引擎整合近百万量级权威文献资源,保障复杂研究场景下的专业交互;应用场景上,已覆盖材料合成与制备、性能表征与测试、学术论文撰写、项目申报等科研关键环节,可提供全流程专业智能支持。
长期以来,大模型的“幻觉”问题是制约其在学术领域深入应用的核心障碍,传统通用大模型在专业领域的幻觉率通常高达10%以上,易导致研究结论偏差,甚至危及科研人员学术声誉。此次发布的MatChat 2.0将幻觉率控制在1.3%,这一数据大幅领先GPT-4.1(5.6%)、DeepSeek-V3(6.1%)、Llama-3.3(4.1%)、Grok-3(5.8%)等主流大模型,相关模型幻觉率对比数据来源于Vectara Hallucination Leaderboard。
MatChat 2.0的低幻觉率突破,源于其独创的三级可信保障机制。第一道防线为源头锚定,系统严格遵循“检索结果中未出现的信息绝对不生成”原则,从根源消除虚构信息产生的可能,同时配备空值检测功能,在检索结果为空时明确告知用户知识边界;第二道防线是来源绑定,每一个结论均精准关联原始文献的具体段落,用户可通过DOI链接一键直达原文验证,实现“所言有所据,所据即原文”;第三道防线为过程透明,AI从问题分解、信息检索到知识整合、结论生成的完整推理过程全开放,每一步均可追溯、可检查。
MatChat 2.0的发布,是东莞材料所“AI+Science”战略部署的重要一环。作为粤港澳大湾区重要的材料科学创新高地,东莞材料所聚焦信息材料、能源材料、功能陶瓷、先进金属等领域研究,正加快抢占新材料领域科技制高点。当前全球科技竞争加速向“AI+科学”赛道演进,全球“AI+材料”领域已形成国家战略与市场创新双轮并行的竞争格局。
在此背景下,东莞材料所立足国家战略需求,前瞻性布局“AI+材料”全链条创新体系。目前已构建起涵盖Atomly材料科学数据库、GPTFF人工智能力场、MatChat AI智能体等核心应用平台,以及机器人科学家、科学数据开放平台、智库智能体等系列数字化工具的创新矩阵,初步形成材料科学智能研究的一体化闭环机制。通过平台共享与工具开源,该创新体系正广泛赋能全国科研机构与产业用户,有效服务国家创新需求。
东莞材料所相关规划显示,未来将持续深耕“AI+材料”领域,力争构建我国自主可控的“AI+材料”创新生态,形成全链条自主可控、产学研用深度融合、开放高效协同的新格局。目前,科研人员可通过MatChat体验官网(https://matchat.cn/)体验该智能工具。
南方+记者 唐卓
订阅后可查看全文(剩余80%)

