北京大学近日发布“智镜”大语言模型审美评估平台建设新进展:科研团队给AI(人工智能)建了一套“中国画考试系统”,AI来答题,人类专家来阅卷,通过“考试”客观反映AI的中式审美水平,为模型的本土化调优提供方向。团队尝试在国内首次系统构建基于中国美学传统的多模态大模型评测基准,计划于今年5月开放平台,届时社会公众也能参与阅卷。
为AI“照镜子”,是“智镜”平台名字的寓意。北大艺术学院教授李洋说,人们想要看懂一幅中国画,需要长期积累,培养审美能力。“AI能看懂中国画吗?”基于这个问题,团队对全球范围内的大语言模型进行了广泛调研。研究发现,当前主流评测体系大多基于西方美学框架,中国古代艺术体系成熟、内涵丰富,却长期缺乏一个能够对AI表现进行系统评估的标准。于是,北大艺术学院联合北大计算艺术实验室于2025年3月启动“智镜”平台建设,通过学者和艺术家的专业评审,将意境、气韵、神采等中国传统美学转化为算法可理解的评估体系。

图源:“智镜计划”微信公众号
目前,平台上的“中国画考试系统”涵盖了超1.8万张中国古代书画艺术图像,每件作品配以创作背景、风格流派、文化寓意、评论文献等信息,形成“试题”数据库。专家进入系统,能看到大模型对作品的解读,并从作品信息准确性、构图分析、笔墨技法、意境解读等维度评判AI的中式审美,指出模型在审美范式、历史背景、文化常识等方面的典型错误。
现阶段,“智镜”平台面向受邀专家开放。已有70余名来自清华大学、中央美术学院、中国美术学院等高校与研究机构的评审专家,以及中国古代美术史与相关方向的学者和博士生完成多轮阅卷。后续,还将有更多院校的学者加入测评。今年5月,平台还将对公众开放。
“在AI时代,我们仍然需要讲美。”李洋表示,建设“智镜”平台,希望守住人类感受世界、理解美、创造美的能力。未来,平台将联合高校、科研机构及相关行业力量,定期发布审美评测结果,并在现有图像评测基础上,逐步引入文本、音乐、视频等多模态内容,考察大模型在不同媒介中的审美理解能力。
订阅后可查看全文(剩余80%)