文/陈根
由ChatGPT所引发的人工智能大模型成为了资本市场最受关注的热点,各种各样的跟AI概念有关的公司都从不同的角度来试图包装自身的大模型技术,导致很多的投资者很难分辨一些包装背后到底隐藏着故事还是事故。
可以说,任何离开算力谈大模型的技术的都是大模型的事故,在没有生成式大语言模型技术之前,一些没有足够强大云算力的企业,本身的数据业务驱动都面临着不小的问题。
但生成式大语言模型,不仅在训练、使用的过程中的极具消耗与依赖算力。并且由于生成式大语言模型具有强大的数据生成能力,这就意味着大语言模型在与用户的交互使用过程中,会产生大量的文本数据,这些数据不仅占用空间,并且会进一步的依赖于算力。
我们先不谈一些企业是否具备模型算法的研发能力,也不谈他们是否有条件拥有高质量的训练数据,只要是没有强大算力的企业谈大模型技术领先性,基本上可以说是理论层面的先进性。
这种先进性跟曾经上海交通大学陈进所搞的芯片先进性差不多的模式,都是无法真正面对市场大规模使用的先进。因此,可以说,一切离开算力谈生成式大语言模型,基本都是耍流氓。