|
题目:
雅宝题库答案:
****此区域为收费内容**** 需支付 1 知识币后可查看,1币=0.01元查看答案
雅宝题库解析:
异构数据库统一检索平台是面向学术搜索领域的专业垂直搜索引擎系统,该平台通过网络进行数据共享与检索。但是内、外异构现象的存在,使得数据库共享往往不能顺利实现。从数据库异构现象产生的根本原因出发,研究解决这个题目的方式与方法。垂直搜索引擎只专注于某一特定学科或领域的信息,以满足特定领域、特定学科或特定需求的检索为目标,对网络信息进行更加专注、深入和准确的提取与加工,使搜索更有针对性、目标更明确、查全率查准率更高。垂直搜索引擎在缩小搜索范围的前提下,可以快速地搜索出更准确更有价值的信息,但同时对垂直搜索引擎网页抓取的深度和网页元数据提取的精度较之综合搜索引擎也提出了更高的要求。该平台提出在网络数据库管理系统前端增加“跨库检索”和“重新组织”模块,以分别解决内部和外部异构带来的数据共享困难,并设计了相应的解决方案,进行了相应的实践。本文在异构数据库统一检索平台建设中主要工作包括:(1)设计实现各异构数据库元数据资源的抓取:面向不同厂家数字资源平台进行评估分析,以构建其抓取需求和爬虫抓取器的设计,制定抓取策略和方法,在Web信息提取方面,通过结合生成的正则表达式来查找匹配需要提取的主题元数据信息,并准确提取出符合要求的主题信息。(2)建立垂直搜索引擎所需的元数据仓储:将获取的各类文献元数据进行数据预处理,按各学科特性建立新的索引库,制定适宜的元数据聚合策略,将所有资源进行去重合并处理。(3)在上述工作的基础上,论文依托上面的研究工作,实现了一个完整的学术垂直搜索引擎。同时,本文所研究的异构数据库统一检索平台在国内部分图书馆数字资源建设项目中得到了应用,取得了很好的效果。 |
上一篇:基于DEA的系统综合评价扩展与集成研究下一篇:基于数据挖掘的火电机组多目标优化控制策略
|