基于Gram-Schmidt变换的无导师变量筛选方法及其应用

[复制链接]
查看: 98|回复: 0

2万

主题

3万

帖子

7万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
73436
发表于 2 小时前 | 显示全部楼层 |阅读模式
目:


雅宝题库答案
****此区域为收费内容****    需支付 1 知识币后可查看,1币=0.01元查看答案


雅宝题库解析:
在科学技术日益发展的今日,很多应用领域所涉及到的变量数目往往都很庞大,数据降维能够克服由于变量数目激增所引发的维数灾难题目,帮助人们从纷繁的现象中认识事物的本质,因此受到广泛的关注。以往对数据降维技术的研究主要集中在有导师类题目,对于无导师类题目还研究甚少,方法也很有限,而在现实中却有很多的无导师类的降维题目亟待解决。例如在对系统进行描述、解析和评价时,如何构建简化的基础变量集合,以实现对系统进行适宜的概括,就是一个重要的课题。本文围绕构建“概括系统的简约变量集合”这一命题,力图解决如下题目:一、“概括系统的简约变量集合”(以下简称为“简约变量集合”)应具备哪些基本特点?二、如何解决变量集合的“全面性”与“独立性”之间的矛盾?三、如何在构建“简约变量集合”时较为合理地加入分析人员的主观经验?针对上述题目,本文利用Gram-Schmidt变换,提出主基底分析的无导师降维方法,以及基于主基底分析的一系列无导师变量筛选方法,用以构建适用于不同实际需求的“简约变量集合”。主要工作和结论如下:提出“简约变量集合”的概念和基本特点。“简约变量集合”是通过对分析人员构建的、尽可能完备的初始变量集合(文中称为“主观完备变量集合”)进行有效降维,得到的既能够全面反映系统各个方面的特征,又尽可能地去除重复信息和冗余变量的简化变量集合,是对系统更为合理的表述方式。“简约变量集合”应该具备“全面性”、“独立性”和“可解释性”这三个基本特点。阐明了经Gram-Schmidt变换所删除信息的含义。证明了每一个原始变量经过Gram-Schmidt变换后,所删除的信息量是该变量与前步骤得到的所有基底变量之间的相关系数平方和,亦即删除的信息是全部冗余信息。这是主基底分析方法的理论基础。利用Gram-Schmidt变换,提出了主基底分析方法,用以解决在构建“简约变量集合”时,“全面性”与“独立性”的矛盾,给出主基底分析的有关概念、构建方法及停止准则,并与主成分分析方法做出比较。首先,提出“净信息”和“净信息含量比”的概念,可以作为一种新的数据降维准则;给出“主基底”的概念,可以采用最大方差法等三种等价方法来构建主基底;提出主基底分析的冗余变量检验方法,通过检验两个随机变量的相关系数是否为0,来判断对应的Schmidt变量是否为冗余变量。同时,给出经验停止准则,当主基底变量的方差小于某个预先设定的阈值时,就可以认为保留的主基底变量已包含全部的“净信息”;通过仿真试验,说明主成分分析和主基底分析两种方法在信息分解和选择方式上的差异;并将构建的主基底用于世界人口统计数据的聚类分析中,以去除多重相关性的影响。提出基于主基底分析的变量筛选方法,利用主基底变量与原始变量一一对应的特点,从原始变量集合中选择变量,以加强变量集合的“可解释性”。综合考虑“净信息含量比”以及变量间相关性的限制,重新设定算法的停止准则。本文将该方法与主成分分析结合,应用于我国区域创新能力的综合评价,提出我国各省创新能力评价方法。结合实际需求,进一步改进基于主基底分析的变量筛选方法,提出两种可以结合分析人员主观经验的变量筛选方法:两阶段方法和数据引导型方法。针对分析人员必须保留某些“重要变量”的实际需求,提出两阶段方法。首先用“重要变量”构造初始超平面,再在“普通变量”集合中选择补充变量,从而构造“简约变量集合”,该方法被用于筛选我国长三角洲地区房地产投资潜力评估的初始变量;针对分析人员事先并不明晰应该保留哪些变量,而是需要根据变量之间的数量关系,在一定的范围内选择“相对重要”的变量的需求,提出数据引导型方法。通过设定合理的“容忍度”,实现在每一次选择中不机械地选取净信息最大的变量,而是选择分析人员主观认为比较重要的变量,从而增强变量集合的“可解释性”。本文还对“容忍度”的确定做出了相应的推导和说明。该方法同样被用于我国区域创新能力的综合评价。





上一篇:Google离线技术在财务系统上的应用与实现
下一篇:企业薪酬管理体系的设计与应用
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图