华南理工大学学报(自然科学版) ›› 2009, Vol. 37 ›› Issue (10): 101-107.

• 计算机科学与技术 • 上一篇    下一篇

基于惩罚距离的混合模型分量数自动估计算法

张大明1  符茂胜1  郭慧2  罗斌1   

  1. 1.安徽大学 计算机科学与技术学院, 安徽 合肥 230039; 2.新南威尔士大学, 澳大利亚 悉尼 NSW2052
  • 收稿日期:2008-11-20 修回日期:2009-03-25 出版日期:2009-10-25 发布日期:2009-10-25
  • 通信作者: 张大明(1976-),男,安徽建筑工业学院讲师,在职博士生,主要从事模式识别和图像处理研究. E-mail:zhang_daruing@yahoo.com.cn
  • 作者简介:张大明(1976-),男,安徽建筑工业学院讲师,在职博士生,主要从事模式识别和图像处理研究.
  • 基金资助:

    国家自然科学基金资助项目(60772122);高等学校博士学科点专项科研基金资助项目(20070357001);安徽省高等学校自然科学研究重点项目(KJ2007A045)

Automatic Estimation Algorithm Mixture Model Based on of Component Number of Penalized Distance

Zhang Da-ming1 Fu Mao-sheng1 Guo Hui2  Luo Bin1   

  1. 1.School of Computer Science and Technology, Anhui University, Hefei 230039, Anhui, China; 2. The University of New South Wales, Sydney NSW2052, Australia
  • Received:2008-11-20 Revised:2009-03-25 Online:2009-10-25 Published:2009-10-25
  • Contact: 张大明(1976-),男,安徽建筑工业学院讲师,在职博士生,主要从事模式识别和图像处理研究. E-mail:zhang_daruing@yahoo.com.cn
  • About author:张大明(1976-),男,安徽建筑工业学院讲师,在职博士生,主要从事模式识别和图像处理研究.
  • Supported by:

    国家自然科学基金资助项目(60772122);高等学校博士学科点专项科研基金资助项目(20070357001);安徽省高等学校自然科学研究重点项目(KJ2007A045)

摘要: 期望最大化(EM)算法是对有限混合模型进行参数估计的通用算法,然而标准EM算法中所需的混合模型分量数往往是未知的.文中研究了一种采用惩罚性最小匹配距离估计分量数的方法,并结合贪婪EM算法框架,提出了一种可以在进行参数估计的同时快速准确地自动估计高斯混合模型分量数的算法,最后通过一元和二元高斯混合模型的仿真实验验证了该算法的有效性.

关键词: 有限混合模型, 分量数, 惩罚性最小匹配距离, 贪婪EM Parzen窗, 带宽

Abstract:

The expectation-maximization (EM) algorithm is a popular approach to the parameter estimation of the finite mixture model (FMM). A drawback of this approach is that the number of components of the FMM is not known in advance. In this paper, a penalized minimum matching distance-guided EM algorithm is discussed. Then, under the framework of Greedy EM, an automatic algorithm with high speed and accuracy is proposed to esti- mate the component number of the Gaussian mixture model. The effectiveness of the proposed algorithm is finally verified by the simulations of univariate and bivariate Gaussian mixture models.

Key words: finite mixture model, component number, penalized minimum matching distance, Greedy EM, Parzen window, bandwidth