蔡晓东 谭远浩
CAI Xiaodong TAN Yuanhao
摘要:
基于无监督对比学习的文本语义相似性模型中,现有方案多采用简单地将文本划分为正样本和负样本,同时模型学习过程仅围绕文本的整体特征展开。这一设计存在明显局限:一方面忽略了文本之间的细粒度排名特征,难以区分相似程度的梯度差异,另一方面模型在捕捉句间语义变化不敏感,导致无法准确捕捉文本之间的相似性。为了挖掘样本间细粒度关系,并增强模型的语义变化感知能力,本文提出了一种基于排名蒸馏与差异预测的文本语义相似模型。首先,从预训练的教师模型中提取粗粒度排名特征,并将这些信息蒸馏到学生模型中,从而使模型可以捕获到细粒度排名特征。其次,设计一个差异预测辅助网络,先对原始文本进行随机掩码处理得到掩码文本,再由生成器生成重构文本,最后由鉴别器预测哪些原始文本与重构文本的差异,从而使模型能够感知原始文本与掩码文本之间语义变化。实验结果表明,在文本语义相似性任务数据集STS12-STS16、STS-B、SICK-R上,Spearman相关系数相较于先进模型分别在Bert-base、Roberta-base基础之上平均提升1.16%、0.82%,证明了该模型的有效性。