华大在线讯(通讯员 万仟)近日,人工智能教育学部刘三女牙教授团队在教育大模型研究方向取得重要进展,创新性提出基于经典教育学理论“经验之塔”的教育大模型塔式构建法,在此基础上设计了多智能体自主驱动的教学场景数据合成框架,为促进教育大模型创新发展提供了一种新颖且有效的技术途径。此外,研究团队成功获批本年度国家自然科学基金重点项目“面向智慧教育的多模态模型构建方法”。
研究成果“COMET: ‘Cone of Experience’ Enhanced Large Multimodal Model for Mathematical Problem Generation”在《中国科学:信息科学》英文版《SCIENCE CHINA Information Sciences》在线发表。数学试题作为重要的知识载体与考核工具,其自动生成技术在教学过程中具有重要的应用价值。传统出题与解题分离的研究路径、单调的微调数据结构以及单一的模型优化目标,限制了数学试题生成模型在教学场景中的应用。该成果从能力互促与应用逻辑出发,在一个大模型上整合了题干生成与题目解析两种能力;提出了一种基于“经验之塔”的三阶段塔式构建框架,以类人学习的视角探索大模型训练过程类比人类学习经历的有效性,通过剖析优秀人类教师的成长历程,将微调数据按照抽象、观察和实践三个层次的经验内涵分别构造,并设计多种精细化的数据形式与注入方法;构建了一个中文多模态数学试题数据集CMM12K,为后续研究提供测评基准。在三个数据集上执行10个模型参与的高达15个测试维度的性能对比:相比开源大模型,所提方法在12个测试维度上达到了当前领域最佳水平。
研究成果“VCR: A ‘Cone of Experience’ Driven Synthetic Data Generation Framework for Mathematical Reasoning”被人工智能国际顶级会议AAAI《The 39th Annual AAAI Conference on Artificial Intelligence》正式接收录用。大语言模型在自然语言处理方面性能出色,但面对数学推理往往存在较大挑战。随着训练模式的逐渐固化,学术界提出以数据为中心的人工智能思想,强调开发更高质量的数据以增强大语言模型性能。现有研究扩展数据集构建面向数学推理的合成数据,进而监督微调大语言模型。这类方法大多关注数量而忽视质量,具有挑战性的样本在数据合成过程中没有得到充分的考虑,导致数据构建成本高、密度低、同质化严重。该成果提出了一种名为Virtual ClassRoom(VCR)的多智能体环境,利用大语言模型驱动多种智能体角色构建高质量、多元化的合成数据。基于“经验之塔”理论,VCR类比人类学习,在数据合成过程中引入三个层次的经验,精心设计了用户友好的指令集和角色扮演系统,使VCR能够自主规划合成数据的规模。该系统实现了包括讲授、研讨、问题设计、问题解决等多种教育场景的自主模拟。多个实验表明VCR生成的合成数据具有更高的质量密度和泛化能力,能够以较小的训练代价提高大语言模型的数学推理性能。
近年来,刘三女牙教授带领研究团队立足“人工智能+教育”国家战略需求和学术前沿,系统化开展教育可计算理论、方法与应用创新研究,在教育研究、Nature Computational Science、C&E、ACM/IEEE Trans,以及AAAI、ACM MM、AIED、WWW等教育科学、信息科学领域的顶刊顶会发表了一系列成果,发展了AI4EduSci教育科学智能新范式、计算教育学新方向以及教育大模型构建新方法,服务于中国特色教育科学知识体系建构与教育强国建设。
SCIENCE CHINA Information Sciences是由中国科学院和国家自然科学基金委员会共同主办的期刊,致力于发表在计算机科学与技术、控制科学与工程、信息与通信工程、微电子与固体电子、量子信息等信息科学领域的高质量、原创成果。该刊是SCI JCR Q1期刊,也是中国计算机学会CCF推荐A类期刊。
AAAI是人工智能促进协会主办的国际顶级人工智能学术会议,旨在推动人工智能科学研究,促进人工智能领域研究人员、从业者、科学家、学生和工程师之间的学术交流,主题包括机器学习、自然语言处理、计算机视觉、数据挖掘、多智能体系统、知识表示和人在回路人工智能等。AAAI是中国计算机学会CCF推荐A类会议。
刘三女牙教授为SCIENCE CHINA Information Sciences与AAAI两篇论文成果的第一作者,万仟博士后、沈筱譞博士后与孙建文教授为论文共同通讯作者,立博体育app官网为SCIENCE CHINA Information Sciences论文成果的第一完成单位,以及AAAI论文成果的唯一完成单位。浙江大学为SCIENCE CHINA Information Sciences论文成果的合作完成单位,罗亚威研究员参与该论文的合作研究。研究获得了国家自然科学基金重点项目“面向智慧教育的多模态模型构建方法”、国家自然科学基金重大项目“人工智能赋能教与学的理论与关键技术研究”、新一代人工智能国家科技重大专项项目“面向智慧教育的学习者认知与情感计算研究”等资助。
相关链接:
https://engine.scichina.com/doi/10.1007/s11432-024-4242-0
https://mp.weixin.qq.com/s/vtpeGydR9Nr8gL2-ycrlkw
(审读人:左明章)