作者|雨谷
声明|题图来源于网络。惊蛰研究所原创文章,如需转载请留言申请开白。
上半年生成式AI的大热,让人们再次对人工智能技术变革下各行各业的产业创新充满期待。从硅谷到中关村,科技巨头们围绕大模型进行的“百模大战”已然拉开帷幕。
未来大模型的主战场会率先发生在哪个领域?中国又能否在新一轮的科技革新中抢得先机?关于这些问题,百度创始人李彦宏在刚刚举办的2023百度云智大会上的发言,恰好给出明确答案。他认为,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义。
李彦宏所言非虚。从工业革命到信息革命,每一次生产力升级都经历了概念导入、技术突破、行业应用到产业全面落地的完整路径。眼下,热度持续高涨的大模型已然度过了概念导入期,进入技术突破阶段,而在群雄逐鹿的大模型创业浪潮下,由大模型开启的繁荣景象也正渐渐浮出水面。
从“黑客松”走向AI竞赛
“黑客松”(编程马拉松)几乎是全球开发者以及科技公司们眼中,最具极客色彩和实际价值的活动。因为在汇聚了顶尖开发团队的“黑客松”活动期间,总能为过去某一个细分场景下的难题找到更高效的解答,一些计算机行业的技术难题往往也因此突破瓶颈。而在AI创新如火如荼的当下,“黑客松”也有了“大模型版本”。
今年5月31日,百度启动了“文心杯”创业大赛,随后不到1个月的时间里,吸引了近1000个项目的激烈角逐。经过了数月的权威评审和层层筛选,从“决赛圈”成功突围的几支队伍也逐渐吸引到外界的关注,其中就有不少能够为未来AI应用方向带来启发的创业项目。
例如提供面向大模型的中间件服务商Vanus AI,能够帮助企业基于大模型构建AI应用的创新平台,无需任何代码开发,几分钟内构建专属的AI应用。又比如,高品质AI平面设计及创意生成平台Nolibox,可以在电商营销场景下,为电商用户提供从创意设计到基于智能排版组合的低成本、个性化内容营销物料生成的工具包。
从应用AI到运用AI提升产业效率,百度“文心杯”创业大赛的参赛项目提供了很好的思路,并且将想法都变成了现实。而其中,一家名为幻量科技的初创公司,格外吸引惊蛰研究所的关注。
官方资料显示,幻量科技的参赛项目是AI驱动的新材料发现平台,该项目不仅是百度文心大模型+AI For Science(简写“AI4S”)在材料学的应用,也是近几年来高校、科技巨头以及资本市场都在密切关注的“AI4S”科研模式的落地场景之一。
相较于将文字大模型用于生成小说、剧本的应用模式,“AI+新材料”更充满科学和人文气息。因为它不但能够为现代工业找到符合实际需求的材料,更有可能验证“AI4S”科研模式的实际价值,将人类的科技水平和社会生产力提到一个全新的阶段。
了解新材料研发的人都知道,发现新材料本质上是一个复杂而艰辛的过程,且新材料的诞生往往是多学科交叉作用的结果。每种材料的特性、性能参数不尽相同,要根据具体需求研发新材料,不只是将各种各样的既有材料简单地排列组合,更需要大量的高精度实验来验证新材料的特性、对比优缺点。
幻量科技团队的做法是,基于材料信息学,结合AI、计算物理、高通量实验等,融合跨领域数据,进行正向预测与反向设计,加速各行业新材料研发的产业落地。并且幻量科技目前完成超过5家企业的POC,节省客户研发成本的同时,保证了材料性能的提升。
比起用AI替代人类进行重复性的工作,用AI来解决科学研究中的具体问题,实现科研效率的提升,进而让科研下游的工业及其他领域享受到技术创新带来的巨大帮助,无疑让AI变得更加性感。这也正是惊蛰研究所格外关注幻量科技的重要原因。
百度大模型成为“AI革命”金手指?
作为参赛项目,幻量科技的“AI驱动的新材料发现平台”找到了一条极具潜力的应用方向。但更值得关注的是,它充分运用了AI大模型现阶段全面且不断迭代的技术能力。
根据幻量科技团队的介绍,除了借助AI进行正向预测与反向设计来加速新材料的发现,该团队还在前端结合大模型的逻辑推理和信息聚合能力,搭建AI实验助手,缩小实验范围并加速工作流程,并自动调用后端机器学习、物理模拟仿真和自动化实验室技术进行验证。
这套研究系统有效避免了前序工作中的无效尝试,同时提升了验证环节的效率,达到了为研究人员“减负”的目的,也体现了“AI4S”科研模式的优越性。
幻量科技CEO刘雨阳向惊蛰研究所进一步解释道,“传统的材料研发,主要通过大量实验试错的方式去尝试配方,有时覆盖的领域会比较窄,这时就比较依赖于科研专家的经验来进行选择,所以通常耗费的时间长、成本比较高、可控性比较低。”
但是在AI的辅助下,可以根据需要的材料属性反向推导可用的材料配方及制备工艺,不再是靠运气盲目猜测,也不用完全依赖行业专家的个人经验,仅仅以底层理论为基础就可以让AI进行因果关系的推演,给出可参考的材料配方,再加上计算机模拟的方式,进行机器学习和快速验证的结合,提高新材料研发成功率,缩短研发周期。
在研究之外,大模型的价值同样不容忽视。刘雨阳告诉惊蛰研究所,“幻量科技希望借助大模型这个工具去构建一个不需要研发人员掌握代码,就可以调用最先进算法进行实验和计算的新材料发现平台。”因为大语言模型能够降低使用软件、操作仪器的门槛,因此人们可以通过语音指令的方式带动服务端的具体执行。
用语音指令取代传统操作方式的构想,和《钢铁侠》里的AI贾维斯如出一辙,而“通过接收语音指令,快速进行数据分析”的目标一旦实现,AI无疑将让每一个科研人员拥有自己的AI助手。
不过,前提是大语言模型拥有足够的实力,能够满足不同细分产业的差异化需求。根据IDC最新发布的《AI大模型技术能力评估报告,2023》显示,百度文心大模型3.5拿下12项指标中的7个满分,综合评分第一。
此外,在代表基础能力的算法模型和代表产业应用情况的行业覆盖方面,文心大模型也都是唯一拿到第一的大模型。“对于我们来说,百度的文心一言也给了我们一个可以尝试通过语言交互的方式来取代传统操作界面的机会。”刘雨阳说到。
从百度文心大模型赋能新材料发现领域的这一实例中可以看到,在AI竞赛的产业氛围下,AI也拥有了如同“黑客松”一样的行业创新引擎,吸引全球顶尖AI专家共赴一场以AI赋能解锁各行各业的“大模型革命”。
“文心一言”全面开放,决胜AI的世界竞赛
“AI4S”概念之所以会产生,是因为随着现代科学不断发展,数据的维度不断增加,过去基于数据驱动的开普勒范式和基于模型驱动的牛顿范式,要面对呈现指数级增长的数据量,以及越来越高的实验环境和精度要求。
但“AI4S”最终能够成为现实,更得益于AI技术的快速迭代,让过去只靠科学家和实验仪器探索科学新发现的“作坊式”传统科研模式,迎接来自AI时代的产业革命。
自2019年3月发布文心大模型1.0版以来,百度用四年的技术深耕和研发迭代,完成了文心大模型3.5版。每一次的迭代,除了实现效果、功能、性能的全面提升外,百度也在为文心大模型赋予自我成长的能力。
在文心大模型3.5训练中,百度采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,以多种策略优化数据源及数据分布,大大加快了模型的迭代速度。相较今年3月份发布的3.0版本,飞桨与文心协同优化后,模型训练速度提升至原来的3倍,推理速度达到30多倍。
未来,不断成长的AI大模型不仅会成为科研的底座,提供包括基于基础学科原理的模型和算法、精准高效的实验方法、以及快捷低成本的算力等基础设施,也会在千行百业以AI赋能实现生产力的全面提升,孵化出一大批AI原生应用。
随着AI应用的全面开放,大模型又可以借助大量的用户反馈不断迭代。例如不久前,文心一言向社会全面开放后的24小时内,共计回复网友超3342万个问题。借由大量真实的人工反馈,百度快速、高效地改进了基础模型。而据李彦宏透露,文心大模型4.0版本也将很快推出。
当越来越多的行业开始使用百度AI,更多用户感受到文心大模型带来的创新力量,基于文心大模型构建的AI原生应用,也将逐渐拉开中国大模型生态繁荣的帷幕。百度相关负责人表示,百度的目标是打造大模型的基础能力,支持好的AI原生应用开发。百度一直希望与行业各方合作共赢,共建中国的AI大模型生态。
某种程度上来说,这一场创业大赛吸引的不只是创业者、投资圈的高度关注,也让人们看到,百度文心在行业覆盖上的广度和深度优势,并以AI代际变革的历史性机遇引发市场热情,引导人们畅想大模型在千行百业落地的美好未来。这也更加令人期待,将于10月17日举办的“Baidu World 2023”上,还会出现哪些令人眼前一亮的AI原生应用。
自从1956年“人工智能”概念被提出以来,人类从未停止过对AI应用的探索。而眼下,大模型为AI应用的全面落地提供了生态基础。正如李彦宏在“文心杯”创业大赛的颁奖致辞中所提到的那样,移动互联网时代,操作系统只有安卓和iOS,而特别成功的应用有很多。只有在大模型的基础之上,产生了足够多的AI原生应用,才是一个健康的生态环境。
在探索真理的路上,人类正在借助AI技术实现模拟、预测和优化自然科学和社会科学领域的各种现象和规律,让科学发现和创新将变得高效且有迹可循。而大模型则让全体人类拥有了抵达未来世界的机会,并且看到曾经的美好构想,正在逐步照进现实。