文/陈根
当地时间5月5日,OpenAI CEO山姆·奥特曼(Sam Altman)在接受美国消费者新闻与商业频道(CNBC)采访时表示,公司已经“有一段时间”没有使用付费客户的数据来训练像GPT这样的大语言模型了,“客户显然不希望我们训练他们的数据,所以我们改变了计划,不再这么做。”
OpenAI的这一声明与决定,将会无形的给类ChatGPT产品的训练增加门槛。也就是说OpenAI率先训练成功ChatGPT之后,就开始转向规范数据管理。而用户对于数据的管理,以及数据的隐私,是面前在人工智能产品中比较敏感与关注的事情。这就给后续的企业,比如亚马逊,阿里、百度、腾讯之类的,这些有云服务的企业带来了相当的压力,理论上来说,有云服务的企业就拥有比较庞大的数据。
如果擅自,或者说未经客户授权就私下调用与使用客户的云数据用于训练,这不仅对客户的数据隐私构成侵犯,甚至会严重影响企业的安全与信用声誉。但是如果不调取这些数据来进行训练,那么再庞大的云,对于训练类ChatGPT产品而言都是没有价值的。因此,率先训练出ChatGPT的OpenAI,做出了不使用客户数据进行训练的声明,无形之中就给训练类ChatGPT产品的数据获取设置了一道隐形的门槛。