华南理工大学学报(自然科学版) ›› 2010, Vol. 38 ›› Issue (12): 45-49.doi: 10.3969/j.issn.1000-565X.2010.12.009
李南希 金连文
Li Nan-xi Jin Lian-wen
摘要: 自然书写的脱机中文文本行识别是当今字符识别领域的一个难题.为降低文本行识别中负样本的干扰,文中提出了一个概率模型,将负样本作为一种信息来源,与单字符的识别信息、文本行的几何信息等进行融合.简单地使用两个分类器,就可以实现上述概率模型.在多人手写真实文本数据库中进行的实验表明,当无语言模型和使用二元语言模型时,文中所提方法的正确识别率分别达到61.29%和72.73%,体现了该方法的有效性.