聚热点 juredian

迈向通用人工智能,大模型将如何拉开新时代序幕?

AI大模型最早的关注度起源于NLP领域,随着多模态能力的演进,CV领域及多模态通用大模型逐渐成为发展主流。基于大模型的各类应用的爆发,尤其是生成式AI为用户提供了突破性的创新机会,促使大模型升级成为人类生产力工具的颠覆式革新。数据规模和参数规模的有机提升,让大模型具备了不断学习和成长的基因。大模型开始具备涌现能力,逐渐拉开了通用人工智能(AGI)的发展序幕。

为此,2023年4月27日,弗若斯特沙利文(Frost & Sullivan,简称“沙利文”)正式发布《2023年AI大模型行业白皮书》,本报告将从发展现状到驱动因素洞察AI大模型厂商竞争与发展关键点,并推演竞争格局的逻辑分析过程,形成对中国AI大模型发展情况的客观评估,为行业未来发展提供参考建议与启发。

Part 1 AI大模型掀起时代浪潮,加速通用人工智能(AGI)时代的来临

01 人工智能发展进入以AGI为代表的新里程碑阶段

AI大模型人工智能预训练大模型的简称,包含了“预训练”和“大模型”两层含义,二者结合产生了新的人工智能模式,即模型在大规模数据集上完成预训练后,仅需少量数据的微调甚至无需微调,就能直接支撑各类应用。这些模型通常具有多层神经网络结构,并使用高级的优化算法和计算资源进行训练,具有强大的泛化性、通用性和实用性,可以在自然语言处理、计算机视觉、智能语音等多个领域实现突破性性能提升。

AI大模型人工智能迈向通用人工智能的里程碑技术。以目前热门的ChatGPT为例,ChatGPT的最大贡献在于基本实现了理想LLM的接口层,能够使LLM自主适配人的习惯命令表达方式,由此增加了LLM的易用性,提升了用户体验。InstructGPT/ChatGPT首先意识到这个问题,并给出了相应解决方案,较之前few shot prompting方案更符合人类表达习惯。

人工智能发展历程中主要有两大里程碑:其一,2012年CNN获得ImageNet第一,标志着机器视觉识别能力开始逐渐超越人眼识别准确率,开启了人工智能革命;其二,2022年ChatGPT的出现,掀起了又一波人工智能发展热潮,以大模型 +RLHF为核心的技术落地意味着人工智能开启AI 新范式。人工智能相关产业开始基于强大的基模型进行发展,通过人类反馈和强化学习不断解锁基模型的能力,以解决海量开放式任务,带来了新的研究范式。

02 通往AGI的技术路径多元,目前大模型是最佳实现方式

模型是通向AGI时代的最佳技术路径,并开始在以自动驾驶为代表的场景下所体现。以自动驾驶场景为例,在输入层,大模型能全链条覆盖感知环境,并生成大量实景图片。在输出层,解码器负责重构3D环境、预测路径规划、解释自动驾驶的动机等。大模型能实现自动驾驶感知决策一体化集成,更接近人的驾驶行为预判断,助于提升自动驾驶的安全性、可靠性和可解释性。

模型的缩放法则和涌现性与AGI的发展息息相关。缩放法则是指随着模型规模逐步放大,任务的表现越来越好;涌现性是指随着模型的规模增长,当规模跨过一定阈值,对某类任务的效果会出现突然的性能增长,涌现出新的能力。当全部人类的知识被存储在大模型中,这些知识被动态连接起来时,其所具有的智能远超人们预期。

AGI将实现从“数据飞轮”到“智慧飞轮”的演进,最终迈向人机共智。现有AI体系主要基于数据飞轮,AGI催生了新的研究范式——智慧飞轮,通过强化学习和人类反馈不断解锁基模型新的能力,以更高效地解决海量的开放式任务。

03 人工智能生产范式发生转变,新的“二八定律”形成

模型的出现,将重构人工智能生产范式。传统的软件开发模式是通过任务/业务数据集形成专属模型,小模型不断迭代,开发人员用明确的代码去表达程序执行的逻辑,而随着业务场景从通用场景发展到长尾、碎片场景,该模式则逐渐显现出开发成本高,精确度不佳等一系列挑战。

在大模型的加持下,逐渐形成围绕大模型结合人工反馈强化学习为核心的软件开发新范式,通过模型微调的手段,可以基于超大规模基模型,打造出领域大模型或者行业大模型,进而覆盖更多行业自场景。与此同时,通过提示工程,只需用示例向计算机表达预期目标,计算机将通过神经网络自行找出达到目标的方法。

传统软件开发时期,解决单一问题的深度学习方法与工业化小模型生产工具逐步成熟,现阶段在一些垂直领域仍会应用,如医疗影像、工业检测等。未来软件开发新范式将是AI大模型驱动的商业模式与产品设计的基础。

人工智能的小模型时代下,解决单一问题的深度学习方法与工业化小模型生产工具逐步成熟。在大模型时代,在AI原生基础设施上,大模型即服务(Model as a Service)结合数据反馈闭环是未来人工智能模型驱动的商业模式与产品设计的基础,在此前景下,新范式将会更加注重基础设施成本、算力与数据规模、以及实时用户大数据的反馈和迭代。

新的“二八定律”形成,AI大模型将释放开发者的生产力。进入大模型时代,未来软件80%的价值将由AI大模型提供,剩余20%会由提示工程和传统业务开发组成,新的“二八定律”由此形成。大模型通过机器学习训练代码,直接生成满足需求的程序代码。大模型不仅能生成代码,补全必要的代码块,还能够保证一定的准确率。基于大模型的高精度代码生成,能够提高软件开发的效率,标志着人工智能向AGI更进一步。

04 AI大模型技术创新,助推生成式AI应用场景加速落地

伴随AI技术升级和大模型成熟,AI绘画与ChatGPT的成功破圈,生成式AI技术迎来发展拐点,行业关注度大幅提升。以ChatGPT、Midjourney、文心一格、商汤商量、Codex为代表的生成式AI应用拥有文本语言理解能力、涌现能力以及思维链推理能力。目前,国内电商、游戏、文娱、设计等行业正在积极使用相关的生成式AI应用来提高自身工作效率,尤其以文生图应用为主。

生成式AI不仅能够增强并加速下游多领域的设计,而且有潜力“发明”人类可能错过的新设计、新对象。生成式AI有生成大规模、高质量、低成本内容优势,在算力和算法支持下生成大量内容,生成的内容质量将持续超越UGC与PGC。未来有望为各行业提供内容支持并促进其内容繁荣,最大化释放内容生产力。

文字生成属于发展成熟、易于跨界转化的赛道,而跨模态生成赛道的发展潜力最高。生成式AI应用中语音合成、文本生成、图像属性编辑等技术应用目前较为成熟,跨模态生成、策略生成是高增长潜力的应用场景,在自动驾驶、机器人控制等领域有极高应用价值,随着未来技术不断发展成熟,预计3-5年可实现稳定落地。

Part 2 大模型迎来发展新机遇,未来前景可期

从“十二五”到“十四五”规划,国家从宏观层面上对人工智能新技术、新产业给予巨大支持,同时国家国家重视人工智能产业的安全可信和伦理秩序,开始出台相应的生成式AI监管建议,如《生成式人工智能服务管理办法(征求意见稿)》,进一步支撑大模型生态的有序发展。

模型的神经网络架构和训练大模型的AI基础设施,均逐渐发展成熟,推动大模型的生产更加系统化和工程化。下游企业用户的AI部署需求进一步规模化发展,急需在上游大模型支撑下,获得 AI应用开发门槛降低,部署精度提高等基础价值,进而降低AI规模化部署的成本。

展望未来,大模型的发展趋于通用化与专用化并进,平台化与简易化并进。大模型“训练基础设施 – 底层技术 – 基础应用 – 垂直应用”发展路线逐渐清晰,依托Model as a Service,大模型建立起面向政企、消费者群体等差异化的商业模式,并逐渐形成基模型、领域、行业大模型一体的商业化架构。大模型将加速赋能交通、医疗、金融等各个行业和领域,引发一场以强人工智能和通用人工智能为代表的新一轮智能革命浪潮,大幅提高生产和生活效率,带来深刻的经济、社会和产业变革。

技术和安全伦理等层面的多重挑战,成为大模型发展和应用道路上的阻碍,考验大模型厂商的技术和AI治理能力。

模型厂商在数据管理、AI基础设施建设与运营、模型系统和算法设计等全栈大模型训练与研发能力的积累对于大模型的开发落地不可或缺。基于繁荣的开源生态,厂商近年来业务场景落地经验的沉淀,能够孵化迭代更优秀的技术产品。在先进且持续的AI安全治理举措的加持下,AI大模型厂商能够规避AI技术对伦理秩序的破坏,推动大模型的商业化落地。掌握关键成功因素,大模型厂商将构筑竞争优势,在市场上展开角逐。

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:人工智能  人工智能词条  迈向  迈向词条  序幕  序幕词条  新时代  新时代词条  拉开  拉开词条