华南理工大学学报(自然科学版) ›› 2011, Vol. 39 ›› Issue (7): 146-149,155.doi: 10.3969/j.issn.1000-565X.2011.07.024
刘里 刘小明
Liu Li Liu Xiao-ming
摘要: 领域现象术语常常是复合型短语,很难根据局部上下文特征用传统的机器学习方法来抽取.为此,文中提出了一种领域现象术语的抽取方法.该方法首先用基于上下文的方法抽取得到分隔符集,然后结合分隔符集和上下文术语用改进的NC-value 算法进行候选领域现象术语抽取,最后在候选领域现象术语中过滤掉名词性术语,进而得到最终结果.实验表明,文中方法对领域现象术语的抽取效果优于基于词频的方法和基于分隔符的方法.