子空间聚类方法采用自表达模型,将每个数据点表示为数据集中其他数据点的线性组合,提供了强大的无监督学习技术。然而,当处理大型数据集时,通过字典引用所有数据点来表示每个数据点的计算复杂性很高。为了缓解这一问题,我们引入了一种可并行的基于多子集的自表达模型(PMS),该模型通过组合多个子集来表示每个数据点,每个子集仅由一小部分样本组成。在子空间聚类(PMSSC)中采用PMS具有计算优势,因为在每个子集上分解的优化问题很小,并且可以高效地并行求解。此外,PMSSC能够将从子集中获得的多个自表达系数向量组合在一起,这有助于提高自我表达能力。在合成和真实世界数据集上进行的大量实验表明,与其他方法相比,我们的方法具有效率和有效性。
摘要
参考文献
致谢
作者信息
道德声明
搜索
导航
#####
下载原文档:https://link.springer.com/content/pdf/10.1007/s41095-022-0293-5.pdf