曾经有一次和朋友不知怎么聊到这个话题,在他给我解答之前,说他要好好形容一下让我感受感受。
“ 你看看这个世界,它对刚出生的婴儿有什么意义呢?那它对一个机器人有什么意义呢?”
我:………
人工智能的发展有三个比较重点的阶段:运算智能,感知智能和认知智能。
这两年对于AI的研究主要在发展感知智能的阶段,语音识别啊,人脸技术啊等等。但对于人工智能来说,它们仍未能真正进行思考和理解。
这两个概念其实也有点模糊,有人认为感知智能也是认知智能的一部分。(我个人比较认同这种说法)
其他智能的前提都是在给计算机输入了大量的信息后,所计算出来的结果。但它又是死板的,比如它能感知到红苹果是苹果,可是如果拿来一个绿苹果,AI就不认识了。
而认知智能,作为一个门外汉我大概的理解是,认知智能意味着AI将会很少的信息里捕捉到最重要的点。红苹果,绿苹果,还是切开的苹果,甚至只是一个苹果核,AI都能将其分辨出来。
生物对世界都是有认知的,就像两三岁的孩子能准确指认出不同形象的小动物的名称。连我们家的狗,在教几次之后也能分清不同玩具的名字。
之前看到过一个跟我专业相关的例子举的挺好的。比如在一个医学影像的分析中,如果影像里两根血管靠的太近,根据目前的深度学习算法,就会把两根血管显示成一根。想让机器把它区分开,就需要它具备一个模仿人脑的推理逻辑。
让机器的行为和处理事件方式能更接近人类的思考,就是认知智能所要研究的范畴。
人工智能在模仿人类感官的“听,说,看”的感知智能领域,已经一定程度上超越了人类本身的极限。接下来需要加强的是与认知智能相关的外部知识,逻辑推理和领域迁移等方面。
认知智能虽然还处在发展阶段,但在一些领域已经有了初步的应用。
比如电商行业,在搜索和推荐算法方向的探索已经快要触摸到天花板了,这个时候就需要发掘新型的,从“用户需求“来驱动的推荐机制。
阿里为了完善这一方面,就开始着手建设大规模电商认知图谱(E-commerce ConceptNet),将用户的需求点与电商领域的商品,类目,通用领域等关联起来,对推荐算法进一步优化以及提供更多的可能性。
短视频行业,也是采取了类似的方式,AI通过提取的数据,根据视频内容进行理解,根据人物面貌的基本信息进行分析,以此研发出了各种识别系统,比如人脸识别,肢体识别等,也因此衍生出了逼真的AR玩法。
为了丰富AI的认知,这就需要为此创立一套知识图谱的认知体系,这可以称之为AI的“记忆”,以此将各种概念形象化。对同一时刻的音频,视频等多个维度综合分析,形成更为立体的认知,而不是简单的文本跟代码。
关于人工智能发展,还有另外一个重要技术NLP(natural language processing),又称自然语言处理。关于自然语言这个东西,我朋友的解释是“人类文化和语言的结晶“。
如何处理自然语言,是人工智能里最困难的问题之一。在有限的词汇表里对话时,AI可以表现的很好,但现实里每一个句子都有大量的表达形式,这个时候就会变得差错百出。最经典的就是Siri还有那些智能音箱所常见的:
“我不太清楚你在说什么”
所以NLP和知识图谱,是现阶段发展认知智能的基石,哪个企业能率先掌握这两种技术,就将在认知智能上取得强大的先机。
这次的KDD Cup将赛事的核心放在了如何推动认知智能上,也代表着AI界技术发展一个大的趋势方向。
写了这么多之后,再返回去看我朋友最开始说的话…
作者 | 馒头Moko