|
题目:
雅宝题库答案:
****此区域为收费内容**** 需支付 1 知识币后可查看,1币=0.01元查看答案
雅宝题库解析:
互联网的飞速发展带来了海量的信息,出现了结构化、非结构化和半结构化等多种文本格式信息并存的局面,这给以文本信息为基础的信息应用技术带来了更大的挑战和机遇。人们使用元数据技术对各类异构信息资源或数据进行定义和描述,解决了异构数据的统一描述和表示题目,却无法让机器自动识别和理解这些信息的含义从而支撑高效的信息共享和机器智能协同。本体(Ontology)作为一种有效表现概念层次结构和语义的模型,被广泛应用到计算机科学的众多领域,是解决语义层次上信息共享和交互题目的希望之星。针对现阶段本体的人工构建方式需要耗费大量人力、物力、财力、时间以及难以维护和扩展等题目,本文基于已有的百万量级科技领域元数据,探索本体的自动构建和自动扩展方法,具体研究内容主要包括以下几个方面:(1)科技领域本体自动构建方案研究。在对元数据及本体的基本概念和作用进行全面调研分析的基础上,深入学习了本体自动构建技术,研究了本文中自动构建本体的组织结构和建设方案,确定了本体自动构建需要的信息资源,包括科技领域元数据、网络百科资源和中文常识知识库知网等。 (2)基于科技领域元数据的领域词汇自动抽取方法。该方法在传统信息熵技术的基础上,针对科技领域元数据的不同领域层次级别,使用领域层次权重计算方法并最终得出科技领域基本词汇。另外,对高质量、高语义含量、多用户参与的网络百科资源加以合理使用,使用基于领域特征的相似度计算方法从中获取了科技领域新概念。(3)科技领域概念关系自动抽取。提出了一种基于语义的本体概念关系抽取方法。该方法首先将所有科技领域概念按照语义描述关系形成若干语义簇,并计算出每个概念在语义簇中的权重,结合本文提出的语义吸引力计算公式,为领域新概念的加入提供途径。最终形成的语义簇为领域概念间的关系抽取提供参考范围。使用词性分析和词语共现的思想获取概念间关系标签,增加了本体概念的信息丰富程度,增强了概念的信息表达能力,提升了本体的使用价值。最后,本文基于以上几个步骤所构建而成的科技领域本体,设计实现了一个搜索引擎结果聚类系统。该系统根据概念的属性及概念间关系等信息对搜索引擎结果页面进行分类展示,改善了用户体验。 |
上一篇:菲涅耳带地震层析成像并行算法研究及辅助支撑工具实现下一篇:富氢/富氧燃气多喷嘴气-气喷注器数值仿真
|