综合百科行业百科金融百科经济百科资源百科管理百科
管理百科
管理营销
资源百科
人力财务
经济百科
经济贸易
金融百科
金融证券
行业百科
物流咨询
综合百科
人物品牌

半监督学习

  	      	      	    	    	      	    

半监督学习(Semi-Supervised Learning,SSL)

目录

什么是半监督学习

  半监督学习机器学习(machine learning)中的一种训练方式/学习方式。介于监督学习和无监督学习之间。是监督学习与无监督学习相结合的一种学习方法,半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作

  对于半监督学习,其训练数据的一部分是有标签的,另一部分没有标签,而没标签数据的数量常常极大于有标签数据数量(这也是符合现实情况的)。隐藏在半监督学习下的基本规律在于:数据的分布必然不是完全随机的,通过一些有标签数据的局部特征,以及更多没标签数据的整体分布,就可以得到可以接受甚至是非常好的分类结果。[1]

半监督学习的分类

  半监督学习可进一步划分为纯(pure)半监督学习和直推学习(transductive learning),前者假定训练数据中的未标记样本并非待测的数据,而后者则假定学习过程中所考虑的未标记样本恰是待预测数据,学习的目的就是在这些未标记样本上获得最优泛化性能。

  直推学习(Transductive learning):没有标记的数据是测试数据,这个时候可以用test的数据进行训练。这里需要注意,这里只是用了test数据中的feature而没有用label,所以并不是一种欺骗的方法。

  归纳学习(Inductive learning):没有标签的数据不是测试集。 [2]

半监督学习与监督学习区别

  处在监督学习和无监督学习之间的是半监督学习。半监督学习使用的训练数据库,有一部分是标记过的,而大部分是没有标记的。因此和监督学习相比,半监督学习的成本较低,但又能达到较高的准确度

相关条目

参考文献