华南理工大学学报(自然科学版) ›› 2022, Vol. 50 ›› Issue (1): 80-90.doi: 10.12141/j.issn.1000-565X.210028
所属专题: 2022年计算机科学与技术
付鹏斌 董澳静 杨惠荣†
FU Pengbin DONG Aojing YANG Huirong
摘要: 针对手写中文文本交错、粘连、字内过分离等问题,提出一种基于贪吃蛇算法和部首识别的文本切分方法。首先,根据贪吃蛇算法建立文本原始切分轨迹,并依据多重规则优化切分路径;之后,基于粘连字符的轮廓和骨架提取候选粘连点,利用贪吃蛇算法进行二次切分;最后,对过切分字符,进行部首的笔段提取和识别,依据汉字结构确定合并方向,并结合几何置信度和识别置信度完成合并,得到最终正确的文本切分结果。以陕西省某高中试卷中1542行手写文本作为实验数据进行了算法验证,结果表明,该算法切分正确率可达到82.15%。
中图分类号: