以共商促共享，以善治促善智—— 卓育教育集团派遣研发团队参观2024世界人工智能大会展览

山西卓育教育集团有限公司

创建于07-12

阅读 3251

2023年，是大模型引领AI落地和应用的元年，以ChatGPT为引领的大语言模型技术快速演进，为我们展现出了一个通向“通用人工智能”未来的大框架，为千行百业带来赋能。在这一浪潮的推动下，我们也深切认识到人工智能技术对教育行业转型的重要性，迫切需要吸收最新的前沿技术为自有产品赋能。

7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议在上海隆重召开，卓育教育集团派遣卓育信息研发中心团队成员数名前往上海参加本次盛会。通过观展、学习与交流，以期为公司的持续发展和教育行业的创新进步注入新的活力和灵感。

参观学习

展会上，各种人工智能技术和应用让人目不暇接，我们的研发团队与多家企业进行了深入的交流与探讨。在教育领域，智能教学系统、个性化学习路径推荐、虚拟教育助手等技术及产品，让我们看到了教育现代化的美好前景，为未来注入新的动能与活力。

猿力科技—海豚教育大模型

通过深入的参观交流，我们了解到猿力科技是如何利用知识图谱、图像识别、语音识别、语音合成、语音评测、自然语言处理、XR 技术、实时音视频等前沿技术，成功构建了海豚教育大模型，提供了“学（互动学习）— 练（个性推题）—补（定向提升）—纠（答疑巩固）—测（周周检测）”的全方位学习场景解决方案，有效促进学生学习方式从被动学到主动学的转变。

其中，智能推题、AI 批改（初中全科 AI 批改）、错题归纳、错题讲解、举一反三薄弱点专题练习、启发式阅读、个性化学习、AI 口语陪练、名人对话等功能都是我们可以学习借鉴的地方。

猿力科技大模型技术已覆盖对话辅导、口语陪练、阅读理解等面向家庭教育端的应用场景，以及作业批改、学情分析、答疑辅导等服务于政府和学校端的教育应用场景。

联通—元景大模型

联通的元景大模型是AI 教学助手督导评课大模型。它拥有督导评课、网络巡课、复习回看；改变传统教学模式，提供全面、准确的教学评价与分析、赋能教学过程全方位监管；语音转写、AI 问答、课堂概览、教学分析、章节速览、提问分析、课堂预警、互动分析、智能评价、高频词汇等功能，是小而美的刚需产品。

星环科技—无涯·问知/问数

无涯·问知是一款基于星环自研预训练模型无涯 Infinity 和向量数据库 Hippo、图数据库 StellarDB 构建的企业级垂直领域问答知识库应用。产品支持不限长度的音视频图文等多模态数据快速入库，且支持自动化文档切片及向量化处理，配合自研的 RAG 框架，可实现知识的精准召回，可用于市场研究分析、企业供应链分析、法律风险预警、智能写作等业务场景中。

无涯·问数革新性智能业务分析洞察平台，让用户用自然语言轻松进行数据分析，解决传统 BI（商业智能）使用门槛高、效率低的挑战。基于星环数据分析大模型打造，自然语言提问实现无拖拽数据探索。大模型输出结果的安全性和可解释性。具备超过 10 年以上的数据平台实施经验，星环积累了海量数据开发、数据分析的数据经验，可以转换为专项垂直大模型的训练数据和经验录入。

第四范式

第四范式的A I 资料查询是白泽终身教育智能学伴，智能问数解决方案是一款基于大模型底座的数据问答引擎。提供以自然语言方式获取可信数据、智能化数据分析及可视化能力（可生成图表）。产品可以让不具备代码编写能力的企业管理层和业务人员能轻松高效地利用数据资产，做出高质量的决策，提升企业经营效率。

合合信息

合合信息致力于通过智能文字识别及商业大数据领域的核心技术、C 端和 B 端产品以及行业解决方案为全球企业和个人用户提供创新的数字化、智能化服务。

底层开放AI、大数据，其OCR 产品实现智能文档抽取、准确理解复杂版面、多模态抽取等功能；图像处理实现图像切边增强、文档切边矫正、手写自动擦除等功能；复杂图表解析实现通用表格识别功能。

华为—盘古多模态大模型

盘古多模态大模型具有丰富的功能，如文字识别、表格识别和手写体识别等。但它是通用模型，在教育领域效果并不理想。

松鼠 AI—智适应教育大模型

松鼠 Ai 智适应教育大模型将智适应系统与多模态大模型结合，具备更高效地绘制学生的学习画像、为学生提供个性化教育服务的能力，智适应学习推荐，智适应学习习惯培养，智适应学习路径规划等。

百度

百度通用大模型—文心大模型，模型服务产品—飞桨星河社区，文心一言—知识增强大语言模型等，成功打造了甄知（国内首个大模型全面重构的一站式知识管理平台）、曦灵（国内首个大模型全面重构的数字人平台）、客悦（国内首款大模型重构的智能客服产品）等产品，都值得我们广泛学习和关注。

如今 AI、大模型百花齐放，在人工智能大会中基本每家企业都有自己的模型，包括通用的和各个行业细分领域的，但其对自己模型的性能和能力都有夸大，光从展会上的演示无法分辨其是否适合商用于公司的实际场景。但我们相信不出两年，在 AI 大模型方面一定会产生像阿里、腾讯一样的头部企业。到那个时候，使用现有模型或训练自己的模型就和现在买一台云服务器一样容易。

人工智能有三驾马车：“数据、算力、算法”，其中算法由科学家和大公司去研究，而算力包括芯片和能源，随着我国的自研芯片的发展和新能源的布局，算力的成本也会越来越低。因此数据才是最核心、最长远、最基础性的要素。

上海人工智能实验室的科学家何聪辉指出，模型研发的范式会慢慢从“以模型为中心”变成“以数据为中心”。现在用于模型训练的数据都是由过去几十年产生的，随着人工智能的发展这些数据将无法满足新模型训练的需求，而从现在的情况来看，新数据的产生也有限，这意味着未来模型训练使用的高质量数据将会愈来愈昂贵，网络走向碎片化和封闭化，内容创作者将会竭尽全力防止其内容被免费抓取。《2023 全球人工智能创新指数报告》就指出我国在数据开发利用方面仍存在不足，其中最重要的就是高质量数据资源的稀缺。

综上所述，我们认为公司的 AI 相关技术发展要“顶天立地”。“顶天”就是要紧跟相关企业的最新 AI 技术应用，如AI 阅卷、AI 个性化组题等；“立地”就是要建立我们自己的数据仓库，包括高质量的题库（每道题都要有讲解视频和知识点标注）和学生的作答信息等，这将是我们的核心竞争力，到时利用成熟的开源模型算法就可以迅速训练出我们的 AI 模型。

收获反思

大模型产业链

为期两天的展览参观，仿佛置身于未来世界的入口，让我们对大模型而衍生出的产业链有了较为清晰的认知。以下七个部分就是大模型出现后而衍生的产业链环节，其中对接垂类/通用模型进行产品研发是大部分科技公司的切入点，也是我们需要攻克的方向。

大模型应用

展会上各种大模型层出不穷。针对现有的通用大模型，我们如何将这些技术融入到自己的产品中，实现产品的创新升级，提升用户体验，提供更加个性化的教育服务一直是我们思考的问题。

一、TOB产品方向

1.智能切题（网阅）

智能切题可以实现快速切题。答题卡、试卷、答案等场景支持一键快速裁切，教师只需要进行微调。市场上很多家企业都在做，我们完全可以调用接口，而且可行性较高，投入的人力和物力较少，可以加快提升我们的网阅速率。

2.学情—智能复杂图表分析

合合信息复杂图表解析的功能可以弥补我们学情分析在数据解读功能上的欠缺。通过引入图表分析，可以帮助老师和学生更清晰地理解数据，促进数据的有效应用和理解。

然而，由于图表可分析出的内容较多，需要依托某些场景做针对性训练，在协助用户解读的情况下是否能够帮助我们生成图表是有待确定的难点。同时，我们也需考虑模型是否能够本地化部署以防信息泄漏，以及模型的准确度也有待进一步确认。

3.巡课、听课人工智能（智慧课堂）

运用联通大模型打造智慧课堂，实现巡课、听课人工智能化，成为行走的“课堂记录员”。

4.智能助教

智能助教可以帮助教师实现备课（教案、ppt）—出题练习—智能批改—学习情况分析—错题讲解—举一反三千人千面—智能批改等功能，上述每个环节都要考虑落地操作（软硬件结合），需要依托语音识别、图像识别、资料检索、智能推荐、图表智能分析、AI 批改等技术。最具挑战的是对通用大模型的精度进行体验确定。

5.智能心理辅导师（智慧校园）

当前，青少年的心理健康成为学校普遍关注的问题，但学校的心理辅导老师却少之又少。因此，智能心理辅导教师将会弥补这一空白。

展会上我们了解到至少有两家企业在做这方面的软件，但智能教师在形象上显得有些呆板，与真人有很大差别，且回复不够智能，更像是在背长篇课文，这对于需要心理辅导的孩子来说无法减轻负担，反而会更容易加剧孩子的心理负担。

针对此种情况，我们提出了未来可能的发展方向。在数字人形象上完全可以由孩子自己确定，每一个孩子在心理辅导前都可以选择自己喜欢的人物、卡通、图形等任意外形来降低学生的戒备心理。可以像 MBTI 人格测试一样，在对话过程中提出一些轻松愉快的问题，用于侧面了解学生近期生活状况，是否存在校园霸凌、家暴受虐趋势、自杀倾向等，可以提前做出智能判断，后续由人工进行干预。

二、TOC产品方向

1.学习助手

学习助手可以分析学生学习行为，引导学生沟通，深入了解学生性格，生成独属于学生自己的人工智能伙伴。还可智能分析学生学业情况、思维逻辑情况、心理情况等，根据学生各项情况，千人千面推荐解决方法。

2.AI 批改

如今，作业批改是家长比较关注的问题。AI 批改可以实现全科填空题、主观题、计算题按步骤打分、作文自动批改（不给分，只标注）的功能。学生个人错题本，无需家长和教师过多参与，学生可自行批改错题。目前最具挑战的是通用模型是否可用。

3.智能错题讲解

智能错题讲解可以根据学生多个错题中薄弱项的共通点，智能生成针对性讲解视频，相较于传统错题预录制讲解，智能错题讲解更能达到让学生了解并掌握薄弱知识点以及薄弱能力点的效果。

教师还可调整视频的讲解内容，重新生成适合本班的讲解视频。但需要联动“知识点多维标注”，才能达到最佳效果。目前市面上此类产品稀缺，可以作为未来发展的主要方向。

4.知识点多维标注

知识点多维标注可以将知识点细化为更多维度，需要由更多的专家参与探讨，用大量数据分析探求可行性。这一功能技术难度较大，需要投入大量的人力、物力、财力，但对于教学助力大有裨益。

5.智能资源管理

智能资源管理可以实现文件资源搜索、文件资源整合分析解读，视频资源智能时间分段、字幕标注、语音转文字，资源统计、图片识别文字以及智能教学 ppt 制作—生成式人工智能等功能。然而要实现这一功能，会是一笔巨大的投入，将面临人工成本、时间成本以及接入模型的成本，对于中小型企业来说将是一个巨大的挑战。

大模型比对

当前K12 教育大模型涌现，技术算力、大数据和教育理解构成核心竞争力。相关大模型比对分析如下，为科技公司选用合适的大模型提供了依据。

何去何从

虽然目前我们仍然可以使用机器学习和深度学习进行研发，获得短期效益，但未来我们要逐步实现产品的“人工智能化”，尝试在“推荐”上使用人工智能，如千人千面错题推荐、组题推荐、复习推荐等等，直至“教”、“评”、“研”全方位实现人工智能化。

同时，我们应充分发挥大模型在产品优化中的作用，考虑探索调用前沿技术接口。我们还需深入研究大模型，并从通用大型模型的提示词工程入手，逐步过渡到模型微调阶段。

此外，我们更应注重内容为王，以优质内容为核心，扩充题库和视频资源。充分利用大模型对单题目进行丰富的打标，同时对视频讲解内容进行文字梳理，以提升产品质量和用户体验。

未来可期

本次世界人工智能大会之旅，不仅让我们的研发团队拓宽了视野、增长了见识，了解了最前沿的人工智能技术，还对人工智能在教育领域的深入情况及应用发展有了更深刻的认识和思考。我们坚信，此次的学习与交流将为公司的技术革新注入强大动力，会不断为用户提供更高效、更优质的教育服务。

未来已来，我们期待在更宽广的平台上，与行业对齐，对标一流，实现深度合作，共同探索人工智能技术在教育领域的广阔发展前景。

路漫漫其修远兮，吾将上下而求索。这将是一个漫漫的探索之路，会付出巨大的时间、人力和资金成本。如果能够有一个更加宽松、包容、开放的营商环境，我们相信山西教育信息化水平会“守得云开见月明”，进一步加速教育行业数字化转型的进程。