文 | 山核桃
就像播下了一颗火种,中国科技圈与创投圈正因大模型变得前所未有的热闹。
截至目前,中国已有超40家公司或机构相继发布了大模型产品或公布了大模型计划。在这场“百模大战”的盛况中,手握船票的不仅包括了百度、阿里、腾讯等大公司,也有一批初出茅庐的AI初创企业。
几乎所有人达成的共识是,比起移动互联网时期,大模型技术所代表的AI2.0时代,是一次巨大的平台式机会。大模型有望解决“人工智能如何理解世界”的问题,提供了一条可能迈向AGI(通用人工智能)之路的可能性。
作为国内最早推出大模型的大厂,百度创始人、董事长兼CEO李彦宏在近期的演讲中也提到了类似的观点:“过去的人工智能是,我想让机器学会什么技能,就教它什么技能。教过的有可能会,没教过的就不会。大模型出现‘智能涌现’之后,以前没教过的技能,它也会了。”
这的确是一个令人澎湃的技术奇点时刻,也是AI创业者的黄金年代。但中国的AI大模型领域从卷参数到卷应用,在极短的时间内走完了过去AI领域要走数十年的路,这让人兴奋,但也让人焦虑。
更多人想要关注的是,这场“大模型热”背后,创业者还有没有入场机会?如果有,机会在哪里?又该怎么做?
“大模型热”需要冷思考与热作为
随着大模型创业潮的兴起,科技巨头、创业公司与高校研究院们展开了一轮关于“大模型”的军备竞赛,整个2023年,几乎可以被称为“大模型之年”。
在行业忙着招兵买马与发布产品时,百度却悄悄做了一件大事。
5月31日,在摩根大通全球中国峰会期间,李彦宏对外发出了“全球AI英雄”召集令。 百度将砸下10亿元规模的文心投资基金,启动了大模型领域首个创业大赛——百度“文心杯”创业大赛。
百度方面表示,只要专注于AI方向且有意愿基于百度文心大模型搭建自己的应用,或可以将其与自有产品进行结合的参赛团队都可以来参加。
仅从参赛要求来看,这张“英雄帖”极客味十足,不论出身,只看创意。无论是有创业计划的初创团队,还是已有成型产品或demo的初创公司,均可报名参赛。
李彦宏也借此机会喊话创业者:“参赛者可以提交想法和原型,我们将寻找最有潜力的想法,并为其提供资金。美国开发者正基于ChatGPT或其他语言模型开发新应用。在中国,更多开发者将会基于文心大模型来开发AI应用。”
百度所提供的“资源池”诚意十足。除了设立基金规模10亿元的文心投资基金外,参赛团队获得百度技术、资金、人才的全方位支持。
事实上,在移动互联网时代,为了鼓励创新或基于业务需求,无论是对内,还是对外,类似的创业比赛并不鲜见。但在大模型领域,百度“文心杯”创业大赛却是第一次。
为什么百度选择在此刻做这样一件事?
一方面,这当然与“大模型热”相关。大模型技术的通用性与涌现性存在着巨大的机遇,很容易让人联想起2000年左右百花齐放的移动互联网创业。
但另一方面,也因“大算力、强算法与大数据”的限制,“大模型创业”往往是一场勇者间的冒险。
特别对身处浪潮间的创企而言,尽管已手拿“冲浪板”,但机会窗口正因一些行业现状与现实考量而逐渐收窄。
首先,是被抬高的创业门槛。 大模型极为“烧钱”,每一次训练任务都耗资巨大,从0到1极为不易,很多初创公司即便有好的demo和idea,但由于缺乏底层算力基础,难以入局。
其次,区别于国外在AI原生应用上繁荣的创业生态,中国目前暂未出现适合AI创企的繁荣生态,导致中国依旧缺少真正有影响力的应用产品。
李彦宏此前曾提到“大模型时代的三大产业机会”,其中第三类便是基于通用大语言模型开发应用服务的应用服务提供商,“这可能才是真正的机会,很多创业明星公司可能就是未来的新巨头。”
这一点并不难理解。参考移动互联网时代,真正的超级应用往往是基于安卓和iOS而开发出的,如微信、抖音、滴滴等。
但我们看到的是,在生产式AI赛道上,除了OpenAI的ChatGPT,国外已诞生了诸多具备潜力的独角兽企业,它们逐步从“小而美”走向“大而全”。比如,视频和图像编辑软件公司Lightricks、写作及艺术内容生成器Jasper和AI图像生成器开发商Stability.ai等。
但在国内,AI原生应用端还尚未形成这样百花齐放的生态。
可能的原因指向割裂的创新生态。
对比国外,如微软与OpenAI的互相成就,国内往往是单点创新多,协同创新少,玩家往往都“既要、又要、还要”,最终的结果难以提升创新效率,只能重复造轮子。
理解了上述行业现状,也就理解了百度为何要在此刻向全球发出“AI召集令”。这实则是这家企业对当前“中国大模型热”的冷思考与热作为。
百度的B面,一个务实的“创新加速器”
科技史告诉我们,在塑造创新生态这件事上,需要极强的战略定力与资源整合力。就连被称为“科技圣地”的硅谷,其之所以成为创业者的热土,也与历史的机缘、活跃的风投资本以及政策的大力支持,离不开关系。
但一些关键问题也因此浮出水面,百度为什么要做这件事?为什么百度有能力成为AI创业者们背后的“创新加速器”?
一个最明显的答案是百度独特的创新文化。多年以前,百度就开始投入AI创业浪潮,确定AI就是百度的未来,这是企业的基因。
在AI2.0时代,李彦宏也率先提出:“百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构。”
“创新理论之父”熊彼特就曾认为:“创新就是重构”。这种始终如一的创新冒险气质与敢于从头再来的勇气,正是大模型时代所需要的。
另一个原因是百度独特的全栈式AI能力。
百度是目前唯一一家在芯片层、框架层、模型层和应用层都有领先产品布局的企业。这四层架构相互协同优化,既可以显著地降本增效,又形成了“数据-模型-应用”的飞轮。
在芯片层,百度是中国第一批自研AI芯片的大厂,目前已实现两代通用AI芯片“昆仑”的量产及应用,这为大模型的落地提供了强大算力支撑。
在框架层,“飞桨”作为国内首个自主研发的产业级深度学习平台,可以帮助开发者快速创建、部署模型,降低了AI开发和应用的门槛。
在模型层,“文心大模型”包括基础大模型、任务大模型、行业大模型三级体系,能够满足产业应用需求。
而在应用层,百度启动内测的“文心一言”和“文心千帆”两大产品,进一步推动生态构建与应用场景的落地,在to C和to B两条路线上,让大模型能够真正地用起来。
除了独特的创新文化与技术基础设施外,另一个不可忽视的竞争优势其实是百度的资源整合力,这对创企而言尤为重要。
梳理目前国内大模型领域诞生的明星初创企业,能迅速卡位赛道的玩家,要么是有创始人经历或个人魅力背书,要么就是有长期跟踪孵化的生态方,并非人人都能融到大钱,获得资源。
因此,借助百度这类科技大公司的杠杆,创业者可以撬动更广阔的产业资源,从百度生态中获得丰富的产学研资源,借助协同创新,在为数不多的机会窗口中,更快地跑出来。
从这一点来说,或许应该换一个视角看百度了。在AI科技企业的A面外,百度的B面是一个务实的“创新加速器”。
“百度AI+”的想象力
正如咨询机构IDC在《2022中国大模型发展白皮书》中所预测的,大模型是AI发展的必然趋势,大模型从科研创新走向产业落地,必须通过开放的生态才能持续释放红利。
海外微软的发展路径已验证了“开放”的重要性。微软与OpenAI在资金、技术和应用上的深度合作,在推动产品快速落地的同时,形成了“模型调用-数据反馈-模型迭代”的正反馈循环。
随着人工智能领域的竞争日益激烈,对中国玩家而言,面临的挑战也在进一步升级。
毫无疑问,技术是理想的,但场景与产业是务实的,两者结合并不容易。而站在更远的角度,文心杯创业大赛是“百度AI+”想象力的体现,将带来更深远的影响。
一方面,更多具备潜力的创企诞生,本身能激发AI商业化潜力,重构商业模式,让AI进一步与千行百业相结合。
这背后是百度对技术创新更务实的考量。李彦宏曾反思技术创新:“(很多技术)离市场很远,很多时候是自嗨。”因此,大模型技术只有与市场结合,为市场服务,才能称之为真正地落地。
文心一言就是上述思路的典型例证。从3月16日内测至今,文心一言已完成了4次技术版本升级,推理成本降到了十分之一,推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。
目前已有15万企业申请加入文心一言内测,覆盖了政务、金融、媒体、电商零售等行业。具体到案例上,在汽车领域,如长安汽车正基于百度文心大模型开发一款智能产品,赋能长安汽车的一款量产车型。在SaaS软件行业,金山办公也与文心一言针对意图理解、PPT大纲生成、范文书写、生成待办列表、文生图等多模态生成的场景进行联合开发,目前已取得了进展。
另一方面,对行业而言,也能激活创新生态,形成更专业垂直的分工体系,降低创新的不确定性。
正如上文所说,国外的生产式AI赛道在应用层有着繁荣的生态,大多数的企业成长路径即借助具备生成式能力的大模型,找到擅长的细分赛道,做应用层的开发,这种垂直的分工体系,大大降低了创新创业的不确定性。
这其实与百度的思路一致。文心一言某种程度上扮演了AI时代操作系统的角色,开发者可以自由调用文心一言的能力,低成本开发自己的“APP”。
毫无疑问,迈入大模型时代,中国科技企业正在加速构建自己的生态系统,拥有自己的大语言模型和基础模型。根据李彦宏的预测:“中国会出现至少一个、也可能是两个或三个基础大模型,可以支持人们开发各种AI原生应用。而百度的文心大模型就致力于成为AI开发者的默认基础模型之一。”
更深远的意义在于“先上牌桌”。在全球人工智能的这场军备赛中,中国科技企业只有先上牌桌,才能拥有话语权。
李彦宏曾说:“算力可以买来,创新能力买不来。”对中国科技企业而言,只有提前规划布局AI生态,将技术优势转化为生态优势,才能加速赶超引领的步伐,参与全球人工智能规则的制定,拿到这场竞赛的入场券。
从这一角度来说,百度无疑开了一个好头。而对日新月异的中国大模型行业而言,一个好的起步,已是研发能力与商业能力跃升的一大步。