华南理工大学学报(自然科学版) ›› 2011, Vol. 39 ›› Issue (2): 20-25,31.doi: 10.3969/j.issn.1000-565X.2011.02.004
贺前华 李艳雄 李韬 张虹 杨继臣
He Qian-hua Li Yan-xiong Li Tao Zhang Hong Yang Ji-chen
摘要: 为了有效利用非文字音频事件进行会话语音的语义分析,在分析口语中频繁出现的音频事件特征差异的基础上,提出了一种基于两步判决的口语中非文字音频事件的检测方法.该方法利用音频事件的信号特征构造音频事件信号段,采用门限判决来检测长掌声(第一步判决),而用统计模型来检测其它音频事件(第二步判决).实验结果表明:该方法检测填音、笑声、掌声3种非文字音频事件的平均准确率、召回率和F1度量值分别为87.3%、93.8%和90.4%;与现有文献数据相比,F1度量值平均提高了7.5%,且文中方法能更精确地确定非文字音频事件的边界.