文 | 魅影
编辑 | 嘉欣
长久以来,任何一项革命性的技术/产品在推进初期,都同时存在两股核心力量:
其一是大胆创新的创业公司;其二是那些有着坚定战略目标和无畏投入勇气的大型科技公司。
现在,在生成式AI领域,这两家代表性的公司都出现了。
OpenAI去年底发布了ChatGPT,引爆了这个行业,日前它又发布了多模态预训练大模型GPT-4,被视为是里程碑式的进步。
3月16日下午,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。这是全球范围内第一个由大厂做出来的、直接对标ChatGPT甚至GPT-4的产品。
过去数月,OpenAI引发了关于AI最激烈的讨论,向外界证明了自己的能力。现在,这些同样类型的讨论、对比、质疑,来到了百度这里。
在发布会现场,李彦宏坦诚,大语言模型并非能在几个月内突击完成,深度学习、自然语言处理,都需要多年的坚持和积累。
数智界观察到,文心一言目前展现出了不俗的交互能力。比如在文学创作、数理推算等方面,它能够为用户提供与ChatGPT不相上下的交流体验,在中文理解和多模态生成等方面,表现则比后者要更加优秀。
在这一基础上,更值得关注的问题有两个:
1、为什么百度会成为走在大厂最前列的那个玩家?
2、文心一言未来的想象力会来自于哪里?
一、文心一言实力几何?
发布会上,百度创始人、董事长兼首席执行官李彦宏介绍,目前文心一言的使用场景主要包含文学创作、商业文案创作、数理推算、中文理解和多模态生成。
基于以上这几大使用场景,李彦宏在现场播放并讲解了文心一言的演示视频。数智界选取了其中几个比较有代表性的问题,让我们来看看文心一言的表现。
文学创作能力上。在回答“可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发”这一问题时,文心一言都做出了令人惊喜的回答。
尤其是在“续写”上,文心一言给出了四个角度,分别是角色塑造、情节设计、文化背景、哲学思考——这体现出了一定程度上的思考能力。
商业文案创作上。文心一言顺利完成了给公司起名、写Slogan、写新闻稿等创作任务。
数理推算上。“鸡兔同笼”的数学题面前,在第一轮题目出错的情况下,文心一言没有急着给出答案,而是首先意识到“题是不是出错了”,紧接着第二轮问答,文心一言快速给出了准确答案,还给出了详细的解题思路和步骤。
我们看到,虽然题目本身难度并不大,但文心一言已经具备了一定程度上的质疑能力、逻辑推算能力。
有意思的是,如果你用以上类似的问题与ChatGPT对谈,多半也能得到很好的解答,但如果是下面这两个场景,文心一言的表现,会比ChatGPT更好。
第一是中文理解场景。
发布会现场的演示视频中,文心一言能正确解释成语“洛阳纸贵”含义、准确描述典故由来,能讲出这个成语背后对应的经济学理论,甚至还能在极短的时间里创作藏头诗。
ChatGPT在这一层面则略逊一筹。比如有媒体用“关羽和秦琼谁更厉害”同时问ChatGPT和文心一言时,二者的回答区别不小:
文心一言会从战绩、历史地位和贡献等多个维度进行比较;ChatGPT的回答则是简单的“都是著名的武将、都在各自的时代展现出了战斗技能和领导才能、成就和贡献都不可忽视、都值得尊重和学习。”——乍一看没错,但是是正确的废话。
第二是多模态生成场景。
文心一言有一个能力,用户输入文字描述后,它能够生成图片、语言、文字三种模态的内容。
做个简单对比,OpenAI最新推出的GPT-4,目前支持输入图片和文字,但只能生成文字。
理性来看,在当前阶段,简单地将ChatGPT与文心一言做直接对比并不客观。
一来双方诞生的土壤不一样,比如百度扎根中国市场,更理解中国文化,文心一言具备中文领域最先进的自然语言处理能力,但是李彦宏也坦言,“目前文心一言对英文语种、代码场景的训练还不够多,表现还有待提升。”
二来,基于他们当前所表现出来的能力下结论,也值得商榷。
因为随着数据规模越来越大,在参数达到千亿级别甚至更高后,大模型就可能发生“智能涌现”,涌现出更强的知识和逻辑推理能力。
换言之,无论是OpenAI还是文心一言,最应该被期待的,并不是当前表现出来的能力,而是接下来的进步空间。
二、文心一言能带来什么?
前段时间,ChatGPT掀起生成式AI热潮之后,对于它对潜在领域颠覆性的讨论中,争论最多的是搜索领域。
原因是,ChatGPT拥有基于对话形式接收输入指令并输出结果的能力,与传统的搜索引擎功能具有一定的重合。
这给海内外传统的搜索巨头带来了压力。比如谷歌管理层甚至发布了“红色代码”警报,在硅谷这意味着拉响了“火警”。
但是被颠覆的真的只有搜索业吗?能够被赋能的也真的只有搜索业吗?
从2月7日百度正式官宣要发布文心一言以来,一个多月的时间里,已经有650家企业宣布接入文心一言生态——这意味着,越来越多的企业已经明白,生成式AI,是当前任何一家企业都不应该错过的机会。
李彦宏指出,生成式AI代表了新的技术范式,会带来市场需求的爆发性增长,商业价值的释放会是前所未有的指数级。
“文心一言不仅仅会影响到搜索,也不仅仅会影响到互联网公司,它会影响到美宜佳公司,由于它超强的自然语言理解能力、表达能力以及推理能力,它可以使得任何一家公司都能离客户更近、提供更好的客户体验、更好地留住用户。”他这么说道。
我们也看到,对于文心一言,百度的定位也并非将其当做一个“工具”或者“产品”,而是一个人工智能基座型的赋能平台。
具体来看,文心一言的发布或者说生成式大模型的问世,会带来哪些创业机会、投资机会?百度认为,至少有以下几个方面的机会。
第一,云计算的游戏规则可能会被颠覆,利好大模型基础设施公司。
现在云计算领域主要的商业模式是IaaS,即通过出租算力、存储等基础云服务赚钱。
不过李彦宏认为,生成式大模型问世以及成为主流之后,云计算的商业模式会朝着MaaS(Model As A Service)的方向演进,即应用建立在大模型上,而非建立在过去的云计算算力或者存储上。
用他的话说,未来客户对与厂商的需求,将更聚焦智能服务,要看框架好不好、模型好不好,以及模型、框架、芯片、应用四层架构之间的协同性。他认为“这是一场To B领域的决定性战役”。
第二,基于通用大模型的垂直场景化模型的开发会加速,利好进行行业模型精调的公司。
现阶段来看,无论是ChatGPT还是文心一言,都是通用型大模型,好处在于涉猎的知识领域广泛,但也面临着“通而不精”的一定缺陷。
这个时候,就需要位于通用型大模型和企业之间的中间层涌现出来,开发出基于大模型的垂直场景化模型,在实际场景中作为专用模型服务垂直领域客户。
第三,基于大模型底座的应用开发会进一步加速,利好有技术、有实力的广泛的创业企业。
如同移动互联网时代基于操作系统的第三方应用开发商、云计算时代基于大型云厂商IaaS层以上的第三方SaaS服务商那样,大模型主导生成式AI的时代,最顶层的应用侧,也是一片巨大的蓝海。
正像李彦宏说的那样,未来,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,有可能涌现出很多创业明星公司,他们也极有可能成为未来的新巨头。
而基于以上三点,我们看到,对于文心一言,百度想的其实很清楚:
它想要构建的,是一个依托百度多年来的人工智能大底座、以大模型为新的锚点的AI生态。
三、为什么是百度?
ChatGPT爆火之后,几乎全球范围的大厂都开始加速布局,他们不愿错过这个极其性感的、有着无限想象空间的赛道。
但当前阶段,唯一交出确定性成果的,只有百度一家。
全球的大厂当中,百度是一个发布的。微软是直接调用OpenAI、Google、Facebook、Meta、Amazon,他们都没有真正发布同类型、同级别的产品。
当然,李彦宏也指出,早在内测阶段体验到文心一言的能力时,确实不算完美,百度之所以要在这个阶段发布,是因为市场有需求。
“百度的各个产品线,从搜索到智能云到自动驾驶到小度,都在等着要用这样的技术。更重要的是我们的客户,我们的合作伙伴等着用这样的技术,大家都在催我们尽早把它发布出来。”李彦宏这么说道。
不过,基于市场需求侧的快速响应,只是最表面的原因。
数智界认为,当前,百度能最先跑出来的原因,核心应该归结为以下几点。
第一,人工智能时代,IT技术的技术栈发生了根本性变化,从过去的“芯片层——操作系统层——应用层”转变为当前的“芯片层——框架层——模型层——应用层”,百度已经在这一变化面前做好了充分的准备。
自去年底开始,百度智能云已经通过三大动作全面升级了云服务能力:
去年12月,发布了国内首个全栈自研的AI基础设施“AI大底座”、今年2月升级了AI研发运营一体化(MLOps)能力、3月百度阳泉智算中心再完成升级。
比如文心一言背后的算力基础设施均由百度智算中心支持,后续百度多个智算中心也将为文心一言面向产业的规模化落地提供底层支撑。
目前,百度已经在山西阳泉、江苏盐城等地建设了智算中心,并计划在全国范围内布局更多。
这些智算中心,都有自己的独特优势。比如阳泉智算中心是亚洲最大单体智算中心、盐城智算中心是基于昆仑芯AI通用处理器的智算中心等。
第二,早在十年前乃至更久以前,百度就在做人工智能这件事了,长期的技术投入是最内核的因。
文心一言虽然看起来是当前才推出,但其背后的技术,却源自百度多年来的积累和沉淀。
比如早在2019年,百度就推出了文心大模型ERNIE 1.0,现在的ERNIE3.0每天能接受数十亿用户的搜索请求和其他百度移动生态App的训练——随着时间不断推移,文心一言将给予一个庞大的、标注清晰的数据池,实现快速的改进和学习。
我们也看到,百度文心一言的突出能力,也正是建立在万亿级的网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据、以及5500亿事实的知识图谱的模型训练基础上的。
这与百度长久以来的重投入密不可分。
过去十年,百度在人工智能领域持续深耕,累计研发投入超过1000亿,核心研发费用占百度核心收入比例已经连续多个季度超过20%。
去年一季度财报发布后,李彦宏还发了一封内部信,其中提到,百度要坚定方向,坚持长期注意思维,将继续践行“压强式、马拉松式”的研发投入。
也正是因此,无论是文心一言的正式推出,还是百度智能云近两年来的逆势增长,并非短期内的突飞猛进,而是厚积薄发。
因为早在十年前,百度就埋下了那颗种子。