大规模互联网络环境下的数据模型与操作理论和方法研究

[复制链接]
查看: 99|回复: 0

2万

主题

3万

帖子

7万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
73106
发表于 4 小时前 | 显示全部楼层 |阅读模式
目:


雅宝题库答案
****此区域为收费内容****    需支付 1 知识币后可查看,1币=0.01元查看答案


雅宝题库解析:
信息与通讯技术正在以前所未有、超乎人类想象的速度发展。互联网络,尤其是大规模互联网络,包括已经形成海量规模的因特网、万维网(World Wide Web)、各种P2P网络,还有正在飞速增长的传感网、卫星网络、RFID技术所形成的物联网相互融合,形成了一种新的网络空间形态。在这种新的网络空间环境下,数据管理面临着新的巨大挑战:第一,数据强演化性。在大规模互联网络环境下,例如web2.0中,数据在整个网络中快速传输与转换,使得数据,甚至数据模式不断地快速演化。第二,高度异构与自治性。在大规模互联网络环境下,数据随着网络的分布式特点,产生高度异构与自治性。例如P2P网络中数据管理以及个人数据管理等。第三,多层次数据不确定性。在大规模互联网络环境下,无论是信息采集和获取(例如传感网络的信息采集,深度web的信息抽取)、信息查询处理(模糊查询、信息检索排序),还是信息集成与整合都需要处理数据的不确定性题目。针对这些挑战,本论文在归纳总结前人研究的基础上,在数据模型和操作的理论、方法和技术方面开展了相应的研究,具体包括:第一,提出基于文法的数据模型(Grammar based Data Model,GDM),该模型能够统一地描述各种模型的数据,包括关系型数据、半结构化数据、XML数据甚至结构化文档和图数据等。在属性文法的基础上,定义GDM的查询规则,并给出了包括选择、投影、笛卡尔乘积、连接、分组、聚合等的GDM集合代数操作,为批量数据处理奠定了基础。为形式化地描述GDM数据操作,基于一目二阶逻辑(Monadic Second Order Logic)定义GDM数据操作逻辑,并给出GDM集合代数操作和GDM数据操作逻辑之间的对应关系,与此同时证明存在GDM数据操作的线性时间算法。第二,在基于文法的数据模型的基础上,将Web网页形式化为GDM的数据实例,将Web网页的数据抽取形式化为GDM的模式组合文法的推断。通过这种形式化处理,Web数据抽取题目转化为文法推断题目。与此同时,针对GDM数据模型,提出一种可计算的上下文无关文法的推断算法,实现Web数据抽取。第三,针对数据不确定性题目,以元组依赖性为核心,提出一种基于元组存在性的概率数据库模型。基于该模型,给出了选择、笛卡儿乘积和投影等概率关系代数操作,并在研究概率数据库查询的内涵和外延语义的基础上,提出了一种安全的、有效的概率数据查询算法。





上一篇:干线飞机概念设计的多目标优化
下一篇:农村剩余劳动力转移模式比较研究
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图