|
题目:
雅宝题库答案:
****此区域为收费内容**** 需支付 1 知识币后可查看,1币=0.01元查看答案
雅宝题库解析:
Web2.0环境下用户在访问资源时除了像传统的方式一样通过输入检索词来获得自己想要的资源外,还可以对资源标注标签,对资源进行评价打分等,这些信息都反映了用户对资源的偏好以及用户对资源信息的概括,如能有效利用这些Web2.0的新特性,将在一定程度上提高信息检索的性能。 本文提出了一种适用于Web2.0环境下的信息检索框架WIRF(Web2.0 based Information Retrieval Framework),并重点研究了Web2.0环境下的标签对提升信息检索性能的作用:首先,本文根据标签对于用户及文档的语义特征,采用主题模型LDA(Latent Dirichlet Allocation)训练得到文档数据集的主题语义分布及每一个主题下的词语分布,将用户、用户检索词以及文档分别映射到主题语义空间上来,提出了基于标签的检索模型TagRank及基于标签的个性化检索模型PersonalTagRank;其次,本文基于文档在主题语义空间上的向量计算文档相似度并对文档进行聚类,从而对信息检索语言模型进行平滑,提出了一种改进的语言模型——主题语言模型TLMRank;再次,本文利用排序支持向量机RankingSVM融合特征TagRank、TLMRank及传统的TFIDF特征提出了一种综合各检索特征优势的社会化检索模型SocialRank;最后,本文根据用户与文档在主题语义空间上的相似度Sim(user, doc)结合SocialRank提出了一种个性化信息检索模型PersonalRank。 本文通过实验验证了WIRF信息检索框架中的检索模型TagRank、TLMRank、SocialRank及个性化检索模型PersonalTagRank和PersonalRank的有效性,并在Delicious数据集上设计和实现了面向Web2.0的信息检索系统。 |
上一篇:面向Web的中文地理信息检索系统的研究与实现下一篇:一类非线性预测滤波算法及其应用研究
|