机器之心原创
作者:张倩
「电力系统运转正常,正在运行中的总机组容量为 2.8 亿千瓦,全国电网运行基本正常,只有一座中等城市和五座小城市发生断电事故,正在全力修复。城市供水系统运转正常,73% 的大型城市和 40% 的中型城市能保证不间断供水……」这是科幻作家刘慈欣在 1991 年出版的小说《超新星纪元》中描写的一个片段。
在这本小说中,作者创造了一个完全由孩子掌控的世界(大人们因为超新星爆发产生的辐射相继离世)。辅助他们处理政务的是一台能和人交谈的超级量子计算机。这台计算机能够记录、报告各个关键部门的运行状况,把所有信息显示在一块巨型屏幕上。此外,它还能同时给数以亿计的孩子打去电话,并根据他们每个人的情况主动提供帮助。
在今年 WAIC 世界人工智能大会的现场,我们就看到了有类似功能的 AI 大模型。
视频加载中...
这个模型来自中国移动,是专门用于政务场景的行业大模型。和它一起发布的还有中国移动的客服大模型。
为什么先做这两个行业?因为这两个行业离每一个普通人最近,可以直接服务于普通大众,可以为我们的日常生活排忧解难。下面我们从这两个行业模型的 技术特色、业务特色、中国移动大模型体系布局 三个维度来解读。
技术篇
我们知道,自今年三月份以来,各种基础大模型和行业大模型相继涌现,通用智能水平大幅提升。可以说,自从人类有了文明以来,我们从未如此近距离地看到通用智能的曙光。然而,当前以 Transformer 为核心结构的大模型还存在诸多方面的挑战,其中最为显著的:
一是 大模型的幻觉问题 。也就是大家常说的「一本正经地胡说八道」。「一本正经地胡说」表明模型的稳健性、可信性不足,一个公司、部门或行业组织很难把自己的客户交给一个可靠性难以控制、可信性不能充分保障的系统来服务。
二是 大模型自身的无行业目标性 。用户提问题或者给大模型指令,大模型生成回复。大模型并不驱动对话,大模型的这种无目的性与大量行业智能应用需求之间需要一个桥梁。行业模型需要提供领域内的引导能力,实现基于行业模型的主动驱动,完成该行业的诸多任务。比如一个牛肉面店主去政务大厅办理一个牛肉面馆的注册,政务人员比开店老板更了解办理的流程和常见的问题,因此会一步一步引导店主以最高效的方式办完这些流程, 而不会仅仅等待用户来驱动事项的办理,一个行业模型就一定要具备行业工作人员多项专业的技能。
中国移动发布的两个行业大模型 —— 九天・海算政务大模型 和 九天・客服大模型 从以下几个方面来克服上面的技术挑战,确保用户可以放心使用大模型的靠谱服务。
一、 动态信息场 。基于对用户的了解以及用户当下提出的需求,九天行业大模型被专门训练来构建动态信息场,涵盖相关的文档、知识、功能接口、数据库接口、流程、分析表图等等,信息场内的数据分为私域数据和公域数据,私域数据隐编码后和公域数据共同提供给模型,作为对模型生成回复的一个重要输入和约束。信息场一方面保护了私域数据的隐私,一方面降低了模型的幻觉问题。
二、 全流程贯通 。在很多行业中,人工智能小模型已经得到广泛的应用,嵌入在行业应用的某些环节。九天行业大模型强调面向行业全流程、全场景进行建模,比如九天・海算政务大模型服务于事项办理、政策解读、流程辅助、政务决策大屏分析等场景;九天・客服大模型服务于客户服务的所有环节,包括知识采编、在线客服、热线客服、服务质量检查等等。行业智能化应用的质量,在实际场景中需要从用户的角度去做端到端的评价,这也成为行业大模型的主要评估方式, 相比之下,以前分块服务的小模型没有机制来保证端到端服务质量的提升。
三、 关怀驱动 。不管是政务服务还是客户服务,一个核心的目的是更好地服务于广大用户。一个用户或客户,不只需要得到信息的满足,也需要在交互中得到关怀。2022 年中国移动在 EMNLP 会议上公开了一个「面向关怀」的人人对话数据集,该数据集是当前最大的带标注的人人对话集,为这个方向的技术研究提供了基础。九天行业模型将情感关怀作为数据过滤、模型训练的目标之一,让技术更有温度,让服务更能顺应客户的意愿。
四、 人机协同 。大部分行业模型和基础大模型被训练用作大模型和用户之间一对一的交互,九天行业模型则强调人机协同式交互,也即大模型和专业人工服务协同共同为用户服务。比如在九天·客服大模型中,大模型先与客户沟通,在需要更高权限时请求人工客服加入并执行复杂任务,之后客服人员和大模型共同为客户服务。客服人员一方面可以给大模型安排新的任务,给大模型以引导, 另一方面将大模型作为助理,弥补人工知识不足、 查询时间长、形成专业回复时间长的劣势。
业务篇
如果你去过当地的政务服务中心,那你可能对「 一网通办 」这个词有印象。它指的是进「一个网站」就能办全部事,本质上是打通了不同部门的信息系统,让民众只需操作一个办事系统,就能办成不同领域的事项,解决「办不完的手续、盖不完的章、跑不完的路」这些「关键小事」。
这样的系统通常是非常人性化的,设置了智能问答、情形引导等功能,帮助办事民众一步步走完办事流程。
不过,如果你想咨询一些具体问题,比如办理营业执照时如何确定经营范围,现有的智能问答系统可能就答不上来了。实际上,现阶段这些问题主要是由人来回答的。而人手紧张、容易出错等问题在这一场景中非常突出。
九天・海算政务大模型就是为解决这类问题而诞生的。就解决「一网通办」问题来说,这个大模型有以下几个特点:
一是 政务事项深度理解能力 。模型实现了政务政策、事项、数据深度贯穿,它可以把民众的话语转化为政府办事的语言,打通口语化表述与专业化事项名词之间的壁垒。比如,民众咨询的是「我想开个烧烤店,需要办哪些手续?」系统通过大型语言模型进行语义理解和意图识别,发现这个问题涉及多个政务事项。为了实现「一件事一次办」,大模型把所有事情都清清楚楚地列了出来,甚至还列出了一些事项模板和审批结果样本。
二是 安全可信的信息关联扩展能力 。中国移动首创的「政务大模型 - 政务服务信息场 - 应用」体系,将事项、政策、流程以及其他可能用到的政务数据汇聚到信息场中。例如,在提问者询问某个选址是否可行时,大模型列出了这个地点的人口密度、年龄构成、商业配套、竞品情况等信息,甚至还给出了自己的建议。这些信息是大模型从打通了海量政务数据的政府服务信息场中获取到的,并结合用户的私域数据进行解答,实现政务流程不出场,保证政务领域应用的安全可信。
从这些角度来看,九天・海算政务大模型可以改变现有的一网通办模式,帮助民众「 高效地办成一件事 」。但其实,要想真正提高民众生产生活的舒适度和温度,保证政务业务人员「 高效地处置一件事 」同样非常重要,这就涉及到大模型对「 一网统管 」的优化了。
举个例子,某政务业务人员想要查询系统中的个人用户注册量。由于不具备 SQL 编程能力,他需要先找到数据工程人员完成相应 SQL 编程工作,然后才能得到想要的结果。
但通过大模型和信息场的联动,他可以直接用自然语言与数据库中的海量政务数据表和运营分析指令交互,快速获取直观的数据分析结果。在此过程中,大模型和信息场组成的系统可以串联多来源、复杂异构的数据表,解决工作人员的动态实时管理需求。
除了一网通办和一网统管,九天・海算政务大模型还能用于「 一网协同 」,在公文写作等环节提升政务人员的工作效率。
可以预见,随着政务大模型的不断完善, 未来的政务服务、管理界面可能会变成一个对话框 :民众只需要说出或输入想解决的问题,简单几轮对话就可以得到结果;政务工作人员只需要编辑简单的自然语言指令,就能快速获取政务管理信息、写出规范的公文,实现三网(一网通办、一网通管、一网协同)的全面升级。
九天・客服大模型:与 10086 坐席并肩作战的超级助手
「欢迎致电中国移动 10086 客户服务热线,业务查询请按 1,手机充值请按 2…… 人工服务请按 0。」在很长一段时间里,拨打 10086 的用户都会听到这样一段语音提示,然后按照提示指引完成业务办理。
这种基于预定义对话流程和固定问题答案的对话系统有很多局限,包括限制用户表达、无法应对复杂问题、交互时间冗长等。而且这种对话系统无法根据用户的个性化需求和历史信息提供定制化的服务。
因此,中国移动近年来开始转变交互方式,将上述模板式语音提示换成了可以交互的语音助手。
为了让这个助手更聪明,中国移动集团客户服务部、在线营销服务中心和研究院密切合作,共同研发了九天・客服大模型。 他们希望能让大模型和人工坐席并肩作战,为客户带来全新的服务体验 。
通过现场的展示,我们看到九天・客服大模型确实表现出了这样的能力:
一是 为客户带来更加个性化、更有温度的服务 。我们从对话中发现了很多有意思的地方,九天・客服大模型可以直接调用各业务系统的 API,了解用户各项信息、迅速整理历史对话的上下文,为客户进行日常回访。大模型在得知用户网络故障后能很详细的引导用户去发现故障点,还能通俗易懂地向用户解释「光猫」、「带宽」这些专业知识。客服大模型真正做到把握与客户接触的每一次机会,主动关怀客户。
二是 显著提高了人工坐席的服务能力 。在大会现场,中国移动向观众演示了大模型和人工坐席二者合作的效果:在发现故障比较复杂后主动接通人工客服等。它还可以根据对话内容为坐席提示回复话术,人工客服在接手实时对话后也能迅速进入状态,继续排查问题,并在需要时再次唤醒大模型。大模型帮助人工客服减少回答的时间和思考负担。在这样一个「用户 - 大模型 - 人工坐席」三方沟通场中,大模型的多轮对话理解、对话摘要等能力与人工坐席解决复杂问题的能力互相补充,大大提升了用户体验。
大模型确实带给了客服新的延展和新的想象,但真正实现客户服务的全面智能化不仅仅取决于大模型技术本身,更需要和每家企业自身的禀赋优势、业务策略深度结合。「 我们将逐步、稳健地把大模型部署到中国移动在线客户服务、热线客户服务、全场景客户服务的服务流程中,也将使能中国移动的云客服的产品。 」中国移动集团级首席科学家冯俊兰博士在发布的最后也阐述了中国移动的实施策略,相信这次发布是一个非常好的起点。
中国移动大模型体系及战略定位:让智能像移动通信一样人人可及
「 我们国家将人工智能定位为新基建之智,我们相信未来使用人工智能服务会像今天使用水电、5G 通信服务一样便捷、普适、安全、低成本。人工智能新型基础设施及服务将成为国家经济社会发展的底座,也是国家整体信息和数据的关键入口,事关国家发展的命脉和人民的根本利益。 」在今年 WAIC 的「中国移动『大模型与深度行业智能』创新论坛 」上,中国移动副总经理高同庆分享了他对人工智能重要性的看法。
早在 10 年前,中国移动就开始布局人工智能技术和产品的自主研发,如今更是将人工智能作为公司转型战略的核心部分。「 大家认为中国移动是一个传统的电信运营商,其实早就不是这样了 」中国移动旗下系统集成公司副总王昀解释说。
经过 10 年耕耘,他们已建立起由业内知名专家冯俊兰博士领衔的 600 多人的「九天」人工智能团队。10 年间,这支团队申请了 700 多项发明专利,近两年 19 次跻身国际 AI 竞赛 Top 10。更重要的是,该团队自主研发的「九天」人工智能平台已经能够提供全面的大模型训推一体化研发能力和新型 MaaS 能力,形成规模化的人工智能产业服务。
在这支团队的努力以及中国移动特有的数据、算力、平台优势的加持下,「九天」基础大模型和行业大模型组成的大模型体系应运而生。
对于这个体系中的行业大模型,中国移动有着自己的理解,认为它们不是一个个缩小版的、简单融入了行业知识的通用智能模型,也不止是外挂式的大脑,而是以通用智能大模型为基础,利用行业场景的专业知识、专家经验和生产数据,以完成行业生产任务为目标,在高动态生产环境中不断自适应优化和持续学习,性能与结果达到行业标准的专用智能大模型。
「 因此,行业大模型是更为复杂、准确性要求更高、能够嵌入到复杂生产系统、可自适应闭环升级的高强度密集型研发的大模型 」高同庆表示。同时,这也是中国移动研发行业大模型的标准。
而且,与之前发布行业大模型的企业不同,中国移动瞄准的是国民经济骨干行业,包括通信、政务、客服、司法、医疗、能源、制造等。这些大模型旨在加速各行业各领域智能化转型升级,促进我国整体生产力跃升。
当然,这些大模型只是中国移动建设新型人工智能基础设施 —— 面向通用人工智能的「人工智能大平台」总体目标的一部分。除了模型之外,该平台还包括大规模智算中心、数据汇聚平台、人工智能模型训推服务平台等基础设施。
「 未来,中国移动将面向更多行业推出更加丰富的大模型产品 」高同庆预告说。这些模型将采用协同共建的形式打造,并在实际生产环境中反复磨练,因为只有这样才能真正让智能转化为生产力跃升的根本,让智能像移动通信一样人人可及。