|
题目:
雅宝题库答案:
****此区域为收费内容**** 需支付 1 知识币后可查看,1币=0.01元查看答案
雅宝题库解析:
随着计算机的普及与互联网的发展,网络在人们的工作生活中发挥着越来越重要的作用。近几年来,伴随社会网络SNS(Social Networking Services)的迅速发展,个人及其相关的社会关系信息已经在互联网上有了较为广泛的传播,如何查找、组织和利用这些关系,成为了一个关键题目。而面向社会关系的垂直搜索引擎,能将从网络上抽取获得相关信息,通过信息分析处理和分类存储,为构建社会网络提供更多的基础数据,同时也能够为进一步进行社会网络研究提供数据基础。 本文的工作主要是以基于特征的机器学习为基础,研究并实现了一种面向社会关系的搜索引擎。 首先,本文研究了当前用于关系抽取的若干模型和方法,决定采用基于特征的有监督的学习方法进行关系抽取。 接着,本文针对社会关系的特点,定义了引擎需要识别的关系类型,研究了网络爬虫的工作原理以及爬取策略,对门户网站的新闻网页进行爬取,获得了语料库的材料。将新闻材料进行初步处理后,制定了完善的语料标注规范,通过人工标注构建了基于社会关系的语料库。 然后,本文基于支持向量机理论,对社会关系语料库提取了人物实体上下文、人物实体上下文词性、语义、句法树以及其它特征,并通过对比这些特征在支持向量机算法上关系识别的效果,验证了关系抽取的有效性。 最后,本文实现了一种面向社会关系的搜索引擎,该引擎主要包括两个核心功能:1、系统引擎对社会关系的自动抓取,形成一个关系网络供用户查询和使用;2、用户通过系统实时搜索社会关系。系统主要包括功能模块:网页搜索模块、语料库构建模块、关系抽取模块和用户管理模块,本文通过实验验证了系统的功能可用性和有效性。 |
上一篇:泡沫铝结构动力学与撞击动力学仿真研究下一篇:武器装备RMS指标的经济可行性分析方法研究
|