国产大模型亟待“安卓”出现。
作者 | 周佟
编辑 | 趣解商业
2022年底,OpenAI发布ChatGPT掀起了人工智能热浪,时隔一年后,谷歌终于“杀回”人工智能赛道。
当地时间,12月6日,谷歌正式发布了Gemini大模型。谷歌CEO桑达尔·皮查伊称,Gemini的发布,是谷歌新时代的开始;但人们最关注的问题还是Gemini和GPT-4相比水平谁更高。
谷歌公司高管称,三种不同版本的套件中的Gemini Pro,表现优于GPT-3.5,但暂未直接回应Gemini与GPT-4相比表现如何的问题。不过外界有测评认为,它们已经超过了GPT-4。
图片来源:微博截图
不管是否超过,作为大模型的“风向标”,由一年前推出的ChatGPT引发的“生成式人工智能”革命,仍在不断地改写着每个人的认知。
如今巨头谷歌已“上线”,过去一年,在ChatGPT的引领下,国内的大模型企业也从摸索和尝试,逐渐步入深水区。
01.“百模大战”,从震惊到追赶
ChatGPT的出现并非毫无征兆。
创造它的OpenAI早在2015年便已成立,并在2018年就推出了初代生成式预训练模型GPT-1,这也是ChatGPT最初的原型。
公开资料显示,在GPT-1之前,业内的NLP模型(Neuro logic level自然语言处理)主要是基于针对特定任务的大量标注数据进行训练,能力有限。
GPT是第一个结合Transformer(多层变换器)结构和自监督预训练目标的模型,在自然语言推理、问答任务和常识推理等方面取得了突破,为此它们也获得了微软10亿美元投资。随后,从GPT-1到GPT-2,到GPT-3,短短2年时间里GPT的能力不断提高。
图片来源:OpenAI官网截图
2022年11月27日,随着由GPT-3.5修改而来的人工智能对话聊天机器人ChatGPT的推出,这个一直在小圈子走红的研究成果,才第一次为大众所认识。能聊天、画画、写文案、编代码,强大的功能,使得ChatGPT一经发布迅速走红,5天时间注册用户数超过百万,两个月时间月活突破1亿,成为史上增长最快的消费者应用。
消息传至国内,一石激起千层浪。人工智能竟然已经发展到如此地步了?震惊之下,淘宝上售卖ChatGPT账号甚至都成了一门生意。与此同时,看到巨大商机的各界大佬们,也纷纷下场,表态要尽快推出自己的大模型。
率先落地的是百度。2023年3月16日,国内首个大语言模型“文心一言”问世,发布会上,百度CEO李彦宏直言,“生成式AI是任何企业都不应错过的大机会”。
而百度之所以能够拔得国内大语言模型的“头筹”,源自其过去10多年中,在AI研发上的坚持投入。按李彦宏的说法,文心大模型的第一个版本早在2019年就发布了,此后每年都有更新,文心一言的发布只是百度多年努力的“自然延续”。
图片来源:百度文心一言公众号
紧接着,3月29日,360集团发布人工智能战略及360智脑大模型1.0版本,创始人周鸿祎现场演示了大模型在搜索场景的应用。4月11日,阿里巴巴的“通义千问”大模型在阿里云峰会上揭晓,CEO张勇宣布未来阿里巴巴所有产品都将接入“通义千问”。5月6日,科大讯飞星火大模型发布,董事长刘庆峰表态要在10月24日实现中文超过ChatGPT,英文赶上ChatGPT。9月7日,腾讯混元大模型上线。
至此,国内传统的三大互联网巨头“BAT”全部下场。
此外,华为、京东、字节跳动、商汤科技、昆仑万维等等都陆续推出了大模型产品,甚至连移动、联通、电信三大运营商,长虹等家电生产企业,清华、复旦、中科院等科研院所和高校,都发布了各自的大模型。
图片来源:华为云AI公众号
5月底举行的中关村论坛上,有专家披露,中国10亿级参数规模以上大模型已发布了79个;在7月初的2023世界人工智能大会中有信息表明,中国已有130家研发大模型的公司。此时,ChatGPT引起的大模型研发热,已经带动国内形成“百模大战”的格局。
不过相比当初外卖界的“百团大战”,“百模大战”对资金的需求更为苛刻。
根据NVIDIA官方信息,在训练底层模型阶段,训练一次1750亿参数的GPT-3需要34天、使用1024张A100 GPU芯片,而为了维持日常推理,OpenAI至少需要3.24万张A100,以此推算,ChatGPT仅硬件成本就超过了8亿美元。
昆仑万维集团CEO方汉更是公开表示,“没有2000张A100的卡,实验都做不了”。为此,海天瑞声、因赛集团等“AI概念股”甚至接连发布定增预案,募集资金用于训练大模型。
此时 ,如何在缩小与ChatGPT差距的同时,尽快找到应用落地的方向,实现自我造血,成为了“百模大战”中,每一位参与者都要面对的问题。
02.人工智能+将所有行业做一遍?
从商业角度分析,大模型带来的机遇,可以概括为成本减少效率提升、原有市场需求再扩大、创造新的市场需求三大类。
在今年8月31日、11月4日,根据网信办《生成式人工智能服务管理办法(征求意见稿)》的要求,国内先后有两批涉及26家公司的AI大模型和151个深度合成服务算法通过备案,陆续向全社会开放服务,其中的商业化尝试,也基本是围绕这三类展开的。
图片来源:网信办截图
大模型超强的人机对话、图文及音视频生成能力,不但让其在传统客服场景中获得了广泛应用,对于游戏、影视制作等也产生了深远影响。
阿里、美团的在线智能客服算法,以及中国移动的“九天大模型”、中国电信的TeleChat大模型等,都属于此类产品,将应用场景直接锁定在了智能客服、智慧政务等方面。在今年的亚运会上,科大讯飞与中国移动联合推出了基于星火大模型的5G新通话,接完电话之后,申请服务,会即刻转成文字、生成纪要、生成待办事项。
游戏、影视制作方面,导演陆川曾在采访时表示,“用AI画电影海报,15秒出来的效果比专业海报公司做一个月的还要好。”光线传媒、华策影视等率先尝试将大模型应用在影视创作中的公司,股价在年中都收获了一波大涨。
原有市场需求再扩大,则体现在对于传统业务的升级上,这也是大模型应用最广泛的领域。以传统的搜索引擎为例,接入文心一言后,在百度搜索框里输入问题,给出的可以不再是链接,而是一个更准确的答案。
10月17日,文心一言4.0发布,根据李彦宏现场的演示,除了搜索外,百度地图、网盘、文库等十余款应用,都接入文心一言完成了重构。
旗下业务众多的腾讯,对腾讯云、腾讯广告、腾讯游戏、腾讯会议等多个业务和产品,也已完成了接入腾讯混元大模型的测试,并取得了初步效果。
图片来源:腾讯混元官网截图
此外,在传统的教育、医疗、汽车等领域,大模型也获得了广泛的应用。接入讯飞星火大模型后,科大讯飞的学习机实现了AI一对一辅助教学、中英文作文批改、口语陪练等功能;百度推出了产业级的医疗行业大模型“灵医”,有超过1000家企业级机构先行体验;华为云盘古大模型的赋能,则让问界新M7在智能驾驶领域“遥遥领先”,两个月大定突破10万台。
在创造新的市场需求方面,AI超级助理、AI机器人等需求也被不断创造出来。前者,包括文心一言、讯飞星火、360智脑、通义千问等在内的各家通用大模型都有相应产品提供,它们大都能理解用户的语言语义,并具备图像理解能力,可以通过调用软件API,使用各种各样的工具来帮助用户完成任务;而后者,在今年8月16日举行的2023世界机器人大会上,包括优必选、追觅、宇树在内的不少于 10 家机器人企业,展出了相关产品,赛道也正呈现井喷态势。
图片来源:通义官网截图
不过,在一片欣欣向荣背后,也存在隐忧。比照各家大模型的应用不难发现,不管是提高效率还是扩大需求,市场上绝大多数的应用,实现的功能都较为雷同。
以AI学习机为例,除了科大讯飞有相关产品外,接入子曰大模型的网易有道、接入MathGPT的好未来、接入银河大模型的作业帮,以及接入文心一言的百度、接入360智脑的360,都有类似的产品在售。功能方面,各自宣传的也都大同小异,AI一对一辅导、全科AI作业助手、虚拟人口语教练等,站在消费者的角度,几乎很难体会到其中的差别。
尽管各家都能拿出一堆的排名榜单来论证,自己的大模型得分更高、能力更强,但体现在实际应用中时,那百分之几甚至是千分之几的差别,还是让人不得不产生疑惑:我们真的需要这么多大模型吗?
03.AI原生应用至上,亟待“安卓”出现
对于大模型步入“深水区”将会遇到的挑战,百度创始人、董事长兼首席执行官李彦宏提出了自己的看法。
近期,在深圳2023西丽湖论坛开幕式上,李彦宏就直言,拥抱AI时代,是“一把手工程”。因为CTO、IT负责人更关注技术本身,认为自己做大模型是交作业,结果不仅资源浪费,而且用不起来,最后一地鸡毛;只有一把手才会真的关注,新技术如何提升自己业务的关键指标,一把手上阵,才能让新技术真正为企业所用。
不断地重复开发基础大模型是对社会资源的极大浪费。在李彦宏看来,国内如今的大模型实在是太多了。根据统计,截止10月份,国内已经发布的大模型达到了238个,比5月科技部统计时的79个,翻了三倍,但与此同时,市场上真正的AI原生应用却很难找出几个。一把手应该主导做AI原生应用,而不是大模型。
图片来源:微博截图
“人类进入AI时代的标志,不是产生很多的大模型,而是产生很多的AI原生应用。”李彦宏认为,大模型时代其实和PC时代、移动互联网时代极为类似。PC时代,主流的操作系统只有Windows一个,移动互联网时代,也基本只有安卓和iOS两家,然而围绕着它们,诞生了无数的应用软件。
大模型本身也属于基础底座,类似操作系统,最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。“AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”
这确实是国内的大模型玩家们不得不面对的难题。尽管市场上大模型产品有几百个,但细究起来都是在各玩各的,360智脑只为自家搜索赋能,讯飞星火此前主要是为科大讯飞的学习机产品服务。
相比大模型训练的高额花费,如果不能够有效扩大“朋友圈”,让自家的大模型为更多人所用,只是一味投入,显然难以为继。
上半年大涨的AI概念股们,下半年几乎集体熄火,与此不无关系。科大讯飞(002230.SZ)10月19日发布的三季报显示,前三季度实现营业收入126亿元,同比下滑0.27%,净利润9936万元,同比跌了76%。根据公告,其利润下滑的主要原因,就是源自对大模型的“坚定投入”。
图片来源:财报截图
三六零(601360.SH)的情况也没有好多少,上半年尽管新兴业务“360智脑”创造了近2000万元营收,但在9.1亿元的总收入中,占比不过2.1%。
在“百模大战”进入深水区后,如何围绕各自的大模型,“扩大朋友圈”创造生态,争取更多的开发者,成了国内通用大模型玩家们不约而同的选择。
在1024开发者节上,科大讯飞董事长刘庆峰透露,除了联合相关企业发布了包含金融、汽车、住建、法律等在内的12个行业大模型外,在讯飞星火上,已有1.5万助手开发者,开发了超过2.9万个助手应用。
图片来源:讯飞开放平台公众号
百度则先后推出了“百度智能云千帆大模型平台”、“灵境矩阵”,帮助企业开发自己的专属大模型,目前平台月活企业数已近万家。
阿里巴巴旗下的通义千问,从18亿、70亿、140亿到720亿参数规模,率先成为业界首个“全尺寸开源”的大模型,以吸引更多合作伙伴加入,共促通义千问生态建设。
去年11月,阿里巴巴发布AI开源社区“魔搭”,中国80%的大模型研发机构把魔搭作为模型开源的首发平台。短短一年时间,魔搭汇聚了280万开发者、2300多个优质模型,模型下载量超过1亿。
正如中国科学院院士、中国计算机学会(CCF)开源发展委员会主任王怀民所说,开源是AI发展的重要驱动力,AI开源社区不仅将有力推动AI迈向广泛的落地应用,还将助力中国从开源世界的参与者逐步成长为引领者。
大模型行业的未来,如智能手机系统的迭代。曾经,除了苹果的iOS外,手机操作系统中还有诺基亚的Symbian、微软的Windows Phone、黑莓的BlackBerry,但是最终它们无一例外都败给了“在2012年,就拥有10万开发者,超过40万活跃应用”的Android。
期待国产大模型们,早日跑出本赛道的“Android”。