目前互联网公司和AI公司都在大模型上较劲,晚推出一个月,都有可能影响自己的股价。既然GPT1和GPT2和已经开源,那么在已有的模型基础之上来建立自己的大模型产品,是既合法也经济的选择。
作者|程怡 小船 杨知潮
编辑|秦安娜
微信公众号:略大参考(ID:hyzibenlun)
当科技圈讨论AI大模型,他们在思考什么?
阿里巴巴董事局主席张勇说,所有产品都值得用AI重做一遍。李彦宏说,百度同学要有意识的培养AI原生应用的思维方式和理念,用新理念重构现在的每个产品,每个业务。周鸿祎说360鼓励每一位员工、每个产品和业务都要全面拥抱人工智能,适应人机协作,着手产品重塑。
凡此种种的表态,无一不在透露一种思考:AI大模型是技术浪潮,也会是产品思维方式的浪潮,它会推动人工智能时代出行跟互联网、移动互联网时代,不同的思考模式和产品形式。
处于巨变前夜,科大讯飞表态在10月底,新发布的星火大模型会追上ChatGPT的发言,就没有那么激动人心。一方面,说今年能追赶上的人太多了。另一方面ChatGPT的价值不仅仅是OpenAI基于GPT大模型,打造出来的一款成功产品。借用周鸿祎的话说,ChatGPT让人工智能变成了一项云服务。
百度的文心大模型发布之后,饱受非议,并不耽误百度宣传“百度云是国内第一个训练出大模型的云”。前阵子,阿里云毫不留情,启动史上最大规模降价抢占市场,存储业务最高降幅50%。因为投资OpenAI成为生成式AI赢家的微软,多笔对OpenAI的投资,都是以云服务消费券的方式提供现金+云服务的投资形式。
在人工智能同各行业、多应用场景结合带来的大数据爆发阶段,科技企业们一边走在探索AI重构产品形态的道路,一边用云技术作为底层技术基础,存储和分析海量,挖掘服务收入,对冲探索成本。即便是作为“AI后辈”的商汤,也搭建出来算力中心的商业模型,想做人工智能行业的“水电煤”。
在告别营收连续10年增长的业绩之后,科大讯飞借用生成式AI的新“旧瓶”,却装进一个客户、一个应用场景的技术落地之路的“旧模式”,辛苦当搬水工,商业模式看起来就没有那么性感了。
科大讯飞要去追赶ChatGPT,但对押注AI的互联网企业来说,它们想追赶的是微软。
01 重新定义自研
自从大洋彼岸的OpenAI于2022年11月推出ChatGPT后,一场波及全球科技的“海啸”就此爆发。在国内大模型扎堆的上半年,中国几乎所有的知名的科技企业,都发布了类ChatGPT的“AI大模型”。
科大讯飞并非冲在第一阵线的排头兵。尽管有十余年对于认知智能相关的研究和计划,拥有“人工智能国家队”的美名,讯飞的认知大模型成果发布会直到5月6日才姗姗来迟。而在其4月17日对于发布会的官宣公告中,有一句颇为保守的补充说明——“公司尚不能预测相关技术及应用对2023年度销售收入和经营业绩的提升影响”。
但5月6日的发布会上基调定得很高,围绕讯飞星火认知大模型,科大讯飞董事长刘庆峰和讯飞研究院院长刘聪,一同在现场进行了1个小时左右的实时演示,展示星火在语言理解、知识问答、逻辑推理,数学、代码及多模态等方面的能力。
科大讯飞方面表示,讯飞星火在长文本生成、数学能力和泛领域开放式知识问答三大能力已超ChatGPT。 在 2023 年内预计还会进行三次升级,分批次增强数学能力、补足代码能力,希望最终将在10月24日全球开发者大会期间,能够全面对标 ChatGPT,在中文上要超越 ChatGPT。
官方的“王婆卖瓜”是一码事,星火大模型在用户端的实际使用情况如何呢?
5月9日晚,一段关于讯飞星火的群聊记录在各个群广为流传,一张截图显示,得到内测资格的提问者问道星火提供的API接口是OpenAI的?星火大模型回答道,“是的,我是由OpenAI开发的”。紧跟截图后面,是群内的议论,指向星火大模型疑似套壳OpenAI?
当然,孩童也会说自己是奥特曼。今天的AI还处在幼儿期,星火大模型说自己来自OpenAI,就一定来自OpenAI吗?
答案是不一定。 西安交通大学AI学院的浩儒博士告诉“略大参考”,大模型还是靠函数拟合,没有真正的自我认知,他们不知道自己是谁,很可能在哪个网站上学习过这句话就说了出来。
但是他认为,星火大模型也有可能是“借鉴”了GPT。浩儒博士表示:“模型都是经过预训练的,相当于硬盘出厂的时候里面就有资料,如果你把GPT开源的模型直接拿过来用,就可能会一块学习到GPT的语料,造成这种乌龙事件。”
类似的事件在国内AI行业不是第一次发生,早在星火大模型推出之前,也有用户发现百度的文心一言的绘图疑似为汉译英后再绘制,有使用国外框架的嫌疑。
浩儒博士透露,把别人开源的模型拿过来直接用,在自然语言处理科研领域是很常见的的做法:“高校不可能都从头开始训练”。 对企业来说也是如此,目前互联网公司和AI公司都在大模型上较劲,晚推出一个月,都有可能影响自己的股价。既然GPT1和GPT2和已经开源,那么在已有的模型基础之上来建立自己的大模型产品,是既合法也经济的选择。
市场端的及时反应则是,科大讯飞成为5月10日北向资金净卖出7只个股中金额最多的一只,收盘价65.45元,净卖出4.377亿元。
02 增长神话终结
如果“借鉴”了GPT,那还算是原创的大模型吗?这可能是个哲学问题。 浩儒博士表示。语言大模型是混沌系统,运行原理都是未知的,构成更是根本说不清楚:“就像忒休斯的船,即使你用了别人的骨干,也很难说不断学习后的大模型还是不是之前的大模型。”
一个月前,商汤在交流日上也曾因为号称完全自研的文生图创作平台“秒画SenseMirage”在精选模型中出现AI模型站civitai的图片引发广泛质疑。商汤方面的解释是:秒画SenseMirage包含商汤自研AIGC大模型,也提供第三方社区开源模型。
就像此前的发布会惯例一样, 国内的AI大模型发布会不单是为了炫技,主要是用来“卖”的。 讯飞星火将在教育、办公、汽车、数字员工四个领域的寻找应用方向,与讯飞旗下教育产品AI学习机以及办公产品讯飞听见相结合,寻找落地场景。处于审慎考虑,稍晚时刻,科大讯飞会推出面向医疗场景的服务。
近两年,人工智能技术发生了方向性的改变,用李彦宏的话说:从辨别式的人工智能走向生成式的人工智能,AIGC成为新方向。
科大讯飞是“辨别式”人工智能时代,很早一批从事人工智能研究的企业,几乎跟BAT是同一时期创立的,2008年已在深交所上市。前身历史甚至更悠久,是80年代中国科技大学的电子工程系人机语音通信实验室。
不过,很长时间科大讯飞以to B端服务商的身份,蛰居在客户身后。2016年,罗永浩在锤子M1手机新品发布会上的一番“胡说八道”带火了科大讯飞。
罗永浩在发布会现场,展示一段没有经过编排,只是一些生活琐事,且语速较快的“口水话”,结果讯飞输入法在罗永浩结束语音输入的瞬间,几乎是秒将语音转换成文字,而且完全正确。现场响起了哇的惊呼,和长达23秒的掌声。
锤子的新品发布会,结果讯飞输入法“炸”了,一炮而红, 市值和产品下载量双双暴增。
在人工智能时代以检测和识别为主要应用的阶段,科大讯飞在语音识别领域,将业务伸向众多应用场景,形成了 ToB + ToC + ToG 的三驾马车。收入也水涨船高,从过连续10年业绩增长的神话,增长幅度较少的年份,增速都接近30%。
然而,AI技术不断更迭,在深度神经网络及云计算、大模型的演进过程中,理解、推理逻辑为基础的生成式AI,成为新趋势,AI技术的迭代路径,已不在科大讯飞的优势区域了。
反映在财报上,便是连续 10 年的业绩增长神话终结 。财报显示,2022 年科大讯飞实现营收188.2 亿元,同比仅增长2.77%;归母净利润5.61 亿元,同比下滑 63.94%。
这是近五年来科大讯飞净利润的首次下滑。
03 商业模式之战
最近几个月大半个科技圈为AI大模型沸腾。
2月份出门问问的创始人李志飞到硅谷转了一圈,想搞懂什么是大模型。见了几位谷歌科学家,了解一圈信息后,回国在源码资本的分享会上跟王兴、王慧文等创业者分享,结果分享出一位竞争对手:王慧文虽然不懂,但大受震撼,激动的要自带资金,肉身入股,加入到AI大模型的科技浪潮。
其他人也没闲着,纷纷从功成名就的幕后,走向台前,李开复、王小川要组建团队。退休后的张一鸣,没有公开表态,也在悄咪咪的准备,挑灯夜读学习OpenAI的论文。
今年以来市场隔三差五有一款大模型产品问世,华为盘古,昆仑万维天工。市场涌向大模型的热烈氛围被形容为蹭热点的多,技术能打的少。
国内人工智能企业,似乎形成一种共识,构建起关键性门槛的并不是技术和算法环节,比拼的关键在于吸引客户的能力。 李志飞对此有过形象表述:“90%以上的技术都没有独门武器,更多是一个门票。”
刘庆峰相信人工智能拼场景的商业模式,他曾说。“人工智能改变世界,需要在一个又一个的领域进行应用的创新”。星火大模型发布后,他亦说道“谁能够在具备社会刚需的应用场景落地,谁就最先能形成自我造血的良性循环。”
在应用落地上,国内AI公司的发展速度比硅谷快10倍。 科大讯飞自去年12月15日正式启动“1+N”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。
只是,国内无论哪家企业发布AI大模型产品,几乎都是卷进相同的应用场景。但一家技术型公司要一下子摸透各种细分行业的门道,并不现实。
技术不行,有时候就得靠技巧来凑。科大讯飞曾被爆出了人工翻译冒充AI的造假丑闻。 在2018创新与新兴产业发展国际会议(IEID)的高端装备技术与产业分会上,科大讯飞称为现场提供了AI同声传译。
但事后,那场会议的同声传译员却在知乎上曝光,整场会议的翻译都是由人员提供的,他甚至还提供了视频证据,视频显示,AI同传的语音几乎都是在复读一位女翻译员的翻译。科大讯飞事后回应,“个别同传译员对于科大讯飞存在误解,我们认为仅仅是对会议服务方面的分工沟通了解不清。”科大讯飞只是将同传的“语音”转成“文字”。
科大讯飞的短板在于,面向C端它没有一款国民级的应用,同样是办公场景,钉钉接入阿里的通义千问,通过输入斜杠 “/”,可唤起 10 余项 AI 能力;字节跳动旗下的飞书也将上线 AI 助手 “My AI”,它们的人工智能技术可以跟现有的产品做结合。
面向B端,结合客户的需求,做应用场景的数据、算法。服务用户的成本,难以分摊的。传统的语音识别赛道,增速放缓,做toG业务,需要考虑漫长的回款周期,现金流承压。
好在,科大讯飞能得到政府支持,2022年计入当期损益的政府补助金额甚至升到了 10 亿元,它一年净利润也不过才5.61亿元。
但拿到这些支持的科大讯飞老实发展技术了吗?由于是高科技企业,科大讯飞能够获得许多政策上的支持,2018年,央视曝光了科大讯飞的投机套路:以建设培训基地为名换取园区类土地,再通过买卖地皮套现。
2021年,科大讯飞董事长刘庆峰曾豪言,提出“2025年千亿营收目标,构建万亿生态”的承诺。 按照现在目标进度,还没有完成20%。它试图通过拥抱多元化,发展横跨机器人、教育、医疗、城市运营、房地产、消费、汽车、金融等多个条线的“一揽子”应用场景落地计划,更像是为了达到营收目标的“饥不择食”。
科大讯飞喊出追赶ChatGPT,但对押注AI的互联网企业来说,他们想追赶的是微软。云计算是生成式AI时代的肥肉,就像无论谁做大模型,赢家都是英伟达,谁也绕不过被英伟达A100芯片缺货支配的命运。
ChatGPT是人工智能产业中被广为讨论的显性因素,就像飘在冰面上的一小块儿浮冰,而掩藏在水下的冰山体积,才是更为庞大的部分,算力是AI的商业想象力。