|
题目:
雅宝题库答案:
****此区域为收费内容**** 需支付 1 知识币后可查看,1币=0.01元查看答案
雅宝题库解析:
子空间聚类是传统聚类方法一个比较新的分支。它的目的在于检测那些具有潜在聚类性质的子空间和隐藏在这些子空间里面的聚类情况。自从1998 年首个子空间聚类算法出现以来,子空间聚类题目在研究领域就受到了特别关注,并且很多方法相继涌现。仅针对数值和类别的数据类型人们就设计并实现了四十余种子空间聚类算法。本研究试图比较现有的数值和类别数据的聚类算法,并提出一种新的相似度函数和基于此函数用于计算子空间聚类的新算法。本文讨论了37 种子空间聚类算法,并按照计算聚类的相似度度量对它们进行分类。对于每个算法,文中的对比包含了8 个方面的内容:算法流程,采用的相似度度量,对数据库遍历的次数,用户所需要调整的参数个数,运行时间复杂度,对于子空间维度计算的策略,算法对于极端值的策略,算法对设计要求的完成情况。基于新的相似度函数,我们提出了三种新的基于维度固有统计性质的用于计算子空间的聚类算法。我们命名这种新的相似度函数为维度数值分析(DNA)。DISC 算法计算一维的聚类并且基于所计算子空间中用于检测最终数据对象在子空间中聚类的维度权重来合并这些一维的聚类。K-子空间算法对每个维度进行数值分析,并且用K-均值方法来进行这些维度数值分析(DNA)。每一个DNA 聚类构成一个子空间。每个子空间的数据对象都运用K-均值算法进行聚类。第三种算法称为LESCA,它基于维度数值分析(DNA)和行数值分析(RNA)。我们可以通过数据集中行和列的选择来实现子空间聚类方法的近似计算。在这种近似中我们可以发现子空间的聚类。这些近似计算的子空间的相关的子空间聚类被合并为最终的子空间聚类。我们在实际的数据集上对提出的算法进行了测试。所有这三种算法在这些数据集上都得出了优秀的结果。 |
上一篇:路由交换设备QOS芯片的设计与实现下一篇:月面巡视探测器移动性能地面验证关键技术研究
|