目录 |
个性化搜索主要是指按照用户个性化需求,将Web网络上获取的相关信息与用户检索的信息进行匹配,把相似度高的信息排列在前面供用户查询。具体地说,首先应该对用户的个性化特征进行识别,得到用户的个性化模式,然后利用已有的Web信息资源进行匹配,最后提供给用户满足其个性化需求的信息内容。
个性化搜索引擎的实质就是,对用户的检索词在传统算法的基础之上,结合个性化信息对搜索结果进行自动的扩展,这种扩展基于对不同用户模型因素的分析。个性化搜索的实现大致应该分为两个主要过程:
第一个过程,个性化搜索引擎应该是建立在基于排序算法的传统搜索引擎基础之上的,也就是说如果为用户提供的搜索结果,必须先要通过蜘蛛程序爬行和抓取、过滤、索引和排序等过程,获得大量的网页比建立索引库,当用户输人某个关键词查询信息时,搜索引擎会返回相关的内容,并根据相应的算法规则进行排序,从而展现给用户。
第二个过程,搜索引擎通过获取用户的历史搜索记录,进行分析并建立用户模型,当在用户搜索某些关键词的时候,就能返回与用户兴趣相符的搜索结果,从而提高用户搜索体验。
个性化搜索引擎就是从索引库中提取相关结果时,将用户的兴趣和偏好等信息包含参考进去,因此搜集用户的兴趣模型,并且将用户模型整合进搜索引擎当中,是个陛化搜索引擎研究的重要内容。个性化搜索的基本流程都分为四步:
1.根据用户检索,获得原有的搜索系统的检索结果集。
2.根据用户模型和检索结果集,在线的计算每个结果文档的个性化权值。其实质是用户模型和文档的相似度计算,将用户最希望得到的结果加权,这正是个性化搜索的核心。
3.与其它排序权值结合,对搜索结果进行重排。
4.展现搜索结果,并收集用户对搜索结果的反馈信息,为下一次用户搜索做准备。
(一)搜索引擎索引库的范围不同
传统搜索,是基于搜索引擎排序算法的搜索简称,传统搜索引擎获得的排序结果完全是通过蜘蛛程序的抓取大量的网页,建立统一的索引库,针对所有用户使用相同的索引库,而个性化搜索引擎在统一的搜索引擎索引库基础之上,增加了用户模型数据库,相当于对统一的索引库进行了个眭化的扩展。
(二)用户搜索行为之间的关系不同
用户传统搜索的每个搜索及点击行为之间都是独立的,在一定时间内用户搜索同一关键词所看到的搜索结果大致相同,即使一个用户搜索并点击同一搜索结果,其搜索行为也不会对他人搜索同样的结果会产生影响。而用户个性化搜索的每个搜索行为之间是相互联系的,用户个人的搜索行为@X~~-V-次的搜索排名或展现结果产生影响,因为搜索引擎会根据用户的以前的搜索记录提供个性化的结果。
(三)搜索结果的确定性和多变性
对于同一关键词,传统搜索对不同的人展现的搜索结果是大致相同的,而个性化的搜索结果会根据每个人的历史搜索记录及偏好等因素,重新对结果进行再排序,过滤掉不相关的搜索结果,将符合用户的搜索结果排到前面,而且不同的人搜索同样的内容,获得的搜索结果可能有很大的差异。
(四)搜索准确程度的不同
传统搜索引擎的搜索结果是适合大多数人的习惯和偏好,采用投票的形式对网站的重要性及受欢迎程度进行判断,排名结果符合大多数人,从而证明大多数人都点击的网站一定是新访问者所需要的结果;但是,个性化搜索引擎更加偏重于搜索者本身的喜好,其经常访问的网站对其本人来说就是比较重要的,当他搜索相关的关键词时,该网站就会相应的排在前面,提高了搜索的精确性。