幻想最多的可能不是大模型,而是AIGC本身
文/王子威@零售威观察
AIGC,或者叫做“生成式AI(Generative AI)”,是当下极其热门的投资领域。近期,在交流过海量项目,并对部分早期项目进行投资后,我认为有必要进行一些反思,对过去几个月的心路历程进行复盘。
本文内容仅为个人总结、个人观点,其中必然充满偏见和错误,希望可以抛砖引玉。请勿作为投资指导,DYOR。
【壹】模型
AIGC的第一个投资维度是模型。
生成式AI的爆发是伴随着ChatGPT在2022年11月的横空出世,此后,大量的大语言模型(LLM)也逐步走入市场。毫无疑问,从逻辑上看,模型是一个投资视角。
然而,问题很明显,投入过于巨大:模型的单次训练成本极高,人才要求极高,所以国内基本都是大厂——例如百度、阿里、科大讯飞等机构在做,虽然有一些非大厂已经提供了优秀的大模型,但是他们的估值大多数也已经达到数十亿元,这已经不是普通VC能接受的了。
换句话说,在国内,模型方面的投资窗口,从目前看,基本已经关闭了。
【贰】数据
AIGC的第二个投资维度是数据。
数据既要关注质又要关注量,比如Chat GPT的数据源就包括维基百科、特定书籍与期刊、Reddit精选内容(WebText)和特定的网络爬取内容(Common Crawl,这是2008年至今的一个网站抓取的大型数据集,数据包含原始网页、元数据和文本提取,它的文本来自不同语言、不同领域。),这就是典型的有质有量,叠加优秀的大模型,就可以发挥出很好的效果。
对于国内的生成式AI产业来说,有独特数据源的企业是值得关注的,也就是你有某个特定行业数据,这样,你的模型就是针对特定行业定制的,就是所谓的“一米宽一百米深”的逻辑,做垂直行业、细分行业的特定模型。
问题来了,你的数据从哪里来?
公开数据,嗯,这很好,但是要提一句,请注意数据的合规问题,不然就是“爬虫用的好,牢饭吃到饱”;
私有数据、内部数据,他们从哪里来呢?这就要看团队的积累了,可以说是团队过去多年“隐性资产”的变现能力:
比如,一个“AIGC+设计”的团队是来自于拥有海量图片、影音版权的平台,但是这个设计业务可能最终客户是在电商上销售产品的消费品品牌;
再比如,一个“AIGC+电商”的团队是来自阿里、京东等顶尖电商巨头,服务的可能是企业的电商客服或者选品、测款等步骤,最终目标是打造类SHEIN的小单快反等等。
【叁】规模
AIGC的第三个投资维度是规模。
规模——或者说是收入——一直是投资人最关注的指标,虽然规模并不意味着护城河,但是至少证明你是个值得重视的玩家。
事实上,生成式AI领域目前真正形成规模的项目是相当稀缺的,大部分项目依然处于早期阶段,而这些早期项目又开始陷入两个陷阱当中。
第一是项目制,做一单赚一单的钱,对于早期团队去做标杆案例、了解客户需求是有价值的,而且也会产生养活团队的现金流(我们暂时不考虑应收账款的问题)。这里的陷阱是,你如何证明你未来不是项目制,甚至从VC角度,当我们脑海里闪现出“项目制”三个字后,就是一件很麻烦的事情了。
更麻烦的是第二个陷阱,很多创业者说自己不是项目制,未来会走向订阅+按需付费,但是这种订阅本质上绝大多数是SaaS,无论你是如何用AI去赋能这个SaaS,你本质还是SaaS。
SaaS的问题有两点:
第一,国内针对小微企业的SaaS其实是相对伪命题,这点和美国市场有本质区别。而且,如果你真的是做SaaS的话,也请关注你的各类核心指标,例如CAC、LTV、ARPU、NDR等等,用这些指标来实时监控自己的发展。
第二,你的SaaS如果只是降本增效,那么十分抱歉,你基本收不到钱;只有增收——对,绝对不能仅仅是“增效”——才有可能从增量中抽佣,并且长期抽佣。
事实上,当你能做到增收的时候,你可能并不仅仅是个SaaS,而是切入业务、供应链的BaaS——这其实反过来对你的团队又有了新的要求。
最后总结一下,在AIGC领域的投资方面,模型看的是技术,目前投资窗口几乎已经关闭;数据看的是团队在过去的积累,有机会;而规模看的就是模式,一定要避免走偏。
“
《零售威观察》以全球视角,关注于新零售、新消费领域最新战略、战术与思考,对超级会员体系、国内外新零售案例有深入研究。平台创始人王子威,独立零售分析师