如何理解R语言聚类算法中的期望最大化聚类

期望最大化聚类(EM算法)是一种著名的聚类算法,由Dempster等人于1977年提出。 EM算法的基本思想是:对于一个待聚类的数据集,首先随机确定数据集中各个数据点属于哪个类别的概率,然后根据这些概率计算出每个类别的均值和方差,接着根据这些均值和方差来计算数据集中各个数据点属于哪个类别的概率,重复这个过程,直到收敛为止。

EM算法的优点是:

(1)可以解决高维问题。

(2)可以解决隐变量问题。

(3)不需要事先知道类的个数。

(4)可以解决噪声数据问题。

EM算法的缺点是:

(1)收敛慢。

(2)对初始值敏感。

(3)实现起来比较复杂。

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享