摘要: 为有效找出会议语音中的说话人角色个数及各角色的说话人语音,提出了一种多说话人角色聚类方法 . 首先定义说话人角色聚类的特征,然后采用测地距离度量特征的相似度,进而提出了一种利用类内距离来控制类间合并的多说话人角色聚类方法,最后采用 4 种不同类型的会议语音对该方法进行测试 . 结果表明:对手工分割和自动分割后的会议语音进行说话人角色聚类时,如果采用相同的聚类方法,则使用测地距离的性能优于使用传统距离的性能;如果采用相同的距离度量方法,则文中方法的性能优于传统层次聚类方法 .
中图分类号:
李威 贺前华 李艳雄. 一种多说话人角色聚类方法[J]. 华南理工大学学报(自然科学版), 2015, 43(1): 21-27,33.
Li Wei He Qian-hua Li Yan-xiong. A Clustering Method for Multiple Speaker Roles[J]. Journal of South China University of Technology (Natural Science Edition), 2015, 43(1): 21-27,33.