文/陈根
今天和大家聊一个有趣的话题,就是人工智能这么聪明,它为什么还总是会出错?包括对于我们人类看起来似乎很简单的一些常识问题,人工智能掌握常识这件事远比想象的要难上许多。
这是为什么呢?如果我们能赋予计算机一个它们不具备的能力,那么首当其冲的就该是理解语言的能力。因为语言理解不仅能让计算机帮助我们安排日常的生活和工作,而且还能帮助人类去直面一下科研的挑战,比如对大量的科学文献进行提炼和总结。无论是谁,仅凭自己的力量,都不可能紧跟科学界的发展速度。
比如,在医学领域,每天都有数千篇论文发表。哪怕是在自己的专科领域内,目前也没有哪位医生或研究人员能将这些论文都读一个遍。但是如果不阅读这些论文,不阅读这些最新的研究成果,医生就无法将最新理论应用于实践,就会导致临床所使用的治疗方法陈旧。
在临床中,一些新的治疗手段无法得到应用,正是因为医生没时间去阅读相关内容,根本不知道有新手段的存在。如果有一个能对大量医学文献进行自动合成的AI程序,就会掀起一场真正的革命。
而ChatGPT之所以被认为具有颠覆性,其中最核心的原因就在于其具备了理解人类语言的能力,这在过去我们是无法想象的,我们几乎想象不到有一天基于硅基的智能能够真正被训练成功,能够理解我们人类的语言。
如果要想让机器具备我们人类一样的语言理解能力,当然最基本的是要让机器先拥有阅读的能力。机器需要具备信息合成能力,而非单纯的大数据归类与检索。从根本上说,现在的机器,也就是现在的一些大数据检索工具,所擅长的工作就是将事物按不同的类别进行分类,与理解真实世界的能力之间,还对不上号。也就是说在ChatGPT这种生成式语言大模型出现之前,我们所有的人工智能技术,从本质上来说还不是智能,只是基于深度学习与视觉识别的一些大数据检索而已。
那么ChatGPT是不是具备,或者说达到了我们人类的这样一种阅读与文字理解能力了呢?显然还没有,它的背后还是基于强大的算法,还是基于计算机对于0和1的编码为基础的一种运算识别机制。但是这种机制已经具备了相当的理解准确性与逻辑性,这也正是大语言模型让我们感到意外的地方,就是基于强大的算力,它已经具备了相当程度的理解能力和学习能力。
当我们给它提供一段文字,一篇文章的时候,它就能够从中非常快速的总结与提炼出要点,并且这些学习与理解的能力与速度,远超我们人类的能力。但是ChatGPT还是存在一些比较明显的问题,就是在它知识还没有覆盖,或者还没有理解的领域,它依然会表现出极大的自信,会一本正经的胡说八道。
但是不论如何,生成式语言大模型让我们看到,机器已经具备了学习我们人类知识的能力,也具备了我们人类的语言逻辑沟通能力,未来,机器将会给我们人类社会带来更多意想不到的惊喜。