东莞材料所发布MatChat 2.0，1.3%超低幻觉率大幅优于主流大模型_南方+

近日，中国科学院东莞材料科学与技术研究所（下称“东莞材料所”）发布国内首个专注于材料科学领域的AI智能体升级版MatChat 2.0。该产品基于80万篇权威学术论文构建，在知识库规模、推理能力等多维度实现升级，更以1.3%的超低幻觉率大幅优于多款主流大模型，为材料科学研究打造了全新的智能研究范式。

作为材料科学领域的专业AI智能体，MatChat 2.0的知识库实现跨越式扩容，从原有28万篇学术论文拓展至80万篇以上，知识储量增长近三倍。其知识库内容均来源于权威学术期刊与会议论文，经严格筛选与质量把控，覆盖新能源材料、电子信息材料、结构材料、生物医用材料等材料科学各分支领域，确保信息的前沿性与可靠性。

除知识库外，MatChat 2.0在响应效率、领域理解、应用场景三大维度同步实现核心升级。

响应效率上，通过引入全新的动态路由算法与知识检索优化技术，平均响应时间压缩至秒级，可为科研人员提供即时文献调研支持；领域理解方面，系统搭建四层协同架构，智能上下文持久层支持十余轮持续深度对话，意图分类与路由层精准识别用户需求，智能体推理与执行层兼顾深度思考与快速响应，学术知识数据库引擎整合近百万量级权威文献资源，保障复杂研究场景下的专业交互；应用场景上，已覆盖材料合成与制备、性能表征与测试、学术论文撰写、项目申报等科研关键环节，可提供全流程专业智能支持。

长期以来，大模型的“幻觉”问题是制约其在学术领域深入应用的核心障碍，传统通用大模型在专业领域的幻觉率通常高达10%以上，易导致研究结论偏差，甚至危及科研人员学术声誉。此次发布的MatChat 2.0将幻觉率控制在1.3%，这一数据大幅领先GPT-4.1（5.6%）、DeepSeek-V3（6.1%）、Llama-3.3（4.1%）、Grok-3（5.8%）等主流大模型，相关模型幻觉率对比数据来源于Vectara Hallucination Leaderboard。

MatChat 2.0的低幻觉率突破，源于其独创的三级可信保障机制。第一道防线为源头锚定，系统严格遵循“检索结果中未出现的信息绝对不生成”原则，从根源消除虚构信息产生的可能，同时配备空值检测功能，在检索结果为空时明确告知用户知识边界；第二道防线是来源绑定，每一个结论均精准关联原始文献的具体段落，用户可通过DOI链接一键直达原文验证，实现“所言有所据，所据即原文”；第三道防线为过程透明，AI从问题分解、信息检索到知识整合、结论生成的完整推理过程全开放，每一步均可追溯、可检查。

MatChat 2.0的发布，是东莞材料所“AI+Science”战略部署的重要一环。作为粤港澳大湾区重要的材料科学创新高地，东莞材料所聚焦信息材料、能源材料、功能陶瓷、先进金属等领域研究，正加快抢占新材料领域科技制高点。当前全球科技竞争加速向“AI+科学”赛道演进，全球“AI+材料”领域已形成国家战略与市场创新双轮并行的竞争格局。

在此背景下，东莞材料所立足国家战略需求，前瞻性布局“AI+材料”全链条创新体系。目前已构建起涵盖Atomly材料科学数据库、GPTFF人工智能力场、MatChat AI智能体等核心应用平台，以及机器人科学家、科学数据开放平台、智库智能体等系列数字化工具的创新矩阵，初步形成材料科学智能研究的一体化闭环机制。通过平台共享与工具开源，该创新体系正广泛赋能全国科研机构与产业用户，有效服务国家创新需求。

东莞材料所相关规划显示，未来将持续深耕“AI+材料”领域，力争构建我国自主可控的“AI+材料”创新生态，形成全链条自主可控、产学研用深度融合、开放高效协同的新格局。目前，科研人员可通过MatChat体验官网（https://matchat.cn/）体验该智能工具。

南方+记者唐卓

南方日报、南方+客户端原创，未经授权不得转载

编辑　黎晗

订阅后可查看全文(剩余80%)