基于多模型集成的语义文本相似性判断

doi:10.12141/j.issn.1000-565X.210427

华南理工大学学报(自然科学版) ›› 2022, Vol. 50 ›› Issue (4): 1-9.doi: 10.12141/j.issn.1000-565X.210427

所属专题： 2022年计算机科学与技术

基于多模型集成的语义文本相似性判断

苏锦钿¹洪晓斌²余珊珊³

1．华南理工大学计算机科学与工程学院，广东广州 510640; 2．华南理工大学机械与汽车工程学院，
广东广州 510640; 3．广东药科大学医药信息工程学院，广东广州 510006

收稿日期:2021-06-29 修回日期:2021-09-16 出版日期:2022-04-25 发布日期:2021-09-24
通信作者: 洪晓斌 (1979-)，男，博士，教授，主要从事网络化智能测控技术及应用等研究 E-mail: mexbhong@ scut. edu. cn
作者简介:苏锦钿 (1980-)，男，博士，副教授，主要从事自然语言处理、深度学习和程序语言设计等研究
基金资助:
广东省重点领域科技计划项目;国家自然科学基金

Semantic Textual Similarity Justification based on Multi-Model Ensemble

SU Jindian¹HONG Xiaobin²YU Shanshan³

1． School of Computer Science ＆ Engineering，South China University of Technology，Guangzhou 510640，Guangdong，China;
2． School of Mechanical ＆ Automotive Engineering，South China University of Technology，Guangzhou 510640，Guangdong，China;
3． College of Medical Information Engineering，Guangdong Pharmaceutical University，Guangzhou 510006，Guangdong，China

Received:2021-06-29 Revised:2021-09-16 Online:2022-04-25 Published:2021-09-24
Contact: 洪晓斌 (1979-)，男，博士，教授，主要从事网络化智能测控技术及应用等研究 E-mail: mexbhong@ scut. edu. cn
About author:苏锦钿 (1980-)，男，博士，副教授，主要从事自然语言处理、深度学习和程序语言设计等研究

摘要/Abstract

摘要： 作为目前自然语言处理及人工智能领域的主流方法，各种预训练语言模型由于在语言建模、特征表示、模型结构、训练目标及训练语料等方面存在差异，导致它们在下游任务中的表现各有优劣。为了更好地融合不同预训练语言模型中的知识及在下游任务中的学习能力，结合语义文本相似性判断任务的特点提出一种多模型集成方法MME-STS（Multi-Model Ensemble for Semantic Textual Similarity），给出相应的模型总体架构及相应的特征表示，并针对多模型的集成问题分别提出基于平均值、基于全连接层训练和基于Adaboost算法的三种不同的集成策略。实验结果表明，MMF-STS在国际语义评测SemEval 2014任务4的SICK和SemEval 2017 STS-B数据集上的Pearson共关系值和Spearman相关系数值均超过单个预训练语言模型方法。

关键词: 深度学习, 语义文本相似度, 自然语言处理, 预训练语言模型, 多模型集成

Abstract: As the mainstream and typical methods in current natural language processing and artificial intelligence, various pre-trained language models perform differently on the downstream tasks, due to their different language modeling, feature representation, model structure, training tasks and pre-training corpus, et al. In order to better ensemble the knowledge in different pre-trained language models and utilize their learning abilities on the downstream tasks, we propose a multi-model ensemble method MME-STS (Multi-Model Ensemble for Semantic Textual Similarity) for semantic textual similarity justification tasks. The model structure and the corresponding feature representations are presented, and three different ensemble strategies based on average values, full-connected layer training and Adaboost algorithm with respect to model ensemble are also proposed. Experimental results show that MME-STS outperforms significantly over single pre-trained language model-based approaches on the two benchmark datasets of SemEval 2014 task 4 SICK and SemEval 2017 STS-B corpus in terms of Pearson correlation coefficient and Spearman coefficient metrics.

Key words: Deep learning, Semantic Textual Similarity, Natural Language Processing, Pre-trained Language Model, Model Ensemble

苏锦钿洪晓斌余珊珊. 基于多模型集成的语义文本相似性判断[J]. 华南理工大学学报(自然科学版), 2022, 50(4): 1-9.

SU Jindian, HONG Xiaobin, YU Shanshan. Semantic Textual Similarity Justification based on Multi-Model Ensemble[J]. Journal of South China University of Technology(Natural Science Edition), 2022, 50(4): 1-9.

[1]	李方, 郭炜森, 张平, 等. 基于时空双细胞状态的轴承剩余使用寿命预测方法[J]. 华南理工大学学报(自然科学版), 2023, 51(9): 69-81.
[2]	苏锦钿, 余珊珊, 洪晓斌. 一种面向中文拼写纠错的自监督预训练方法[J]. 华南理工大学学报(自然科学版), 2023, 51(9): 90-98.
[3]	李家春, 李博文, 林伟伟. AdfNet：一种基于多样化特征的自适应深度伪造检测网络[J]. 华南理工大学学报(自然科学版), 2023, 51(9): 82-89.
[4]	郭恩强, 符锌砂. 基于特征相似性学习的抛洒物检测方法[J]. 华南理工大学学报(自然科学版), 2023, 51(6): 30-41.
[5]	赵建东, 焦岚馨, 赵志敏, 等. 考虑侧向车换道影响的理论和数据组合驱动的车辆跟驰模型[J]. 华南理工大学学报(自然科学版), 2023, 51(6): 10-19.
[6]	叶峰, 陈彪, 赖乙宗. 基于特征空间嵌入的对比知识蒸馏算法[J]. 华南理工大学学报(自然科学版), 2023, 51(5): 13-23.
[7]	侯力玮, 王恒升, 邹浩然. 基于深度学习的玻璃基板铲起过程作用力预测[J]. 华南理工大学学报(自然科学版), 2022, 50(8): 71-81.
[8]	莫建文, 朱彦桥, 袁华, 等. 基于神经元正则和资源释放的增量学习[J]. 华南理工大学学报(自然科学版), 2022, 50(6): 71-79,90.
[9]	陆璐, 钟文煜, 吴小坤. 基于多尺度视觉Transformer的图像篡改定位[J]. 华南理工大学学报(自然科学版), 2022, 50(6): 10-18.
[10]	张勤, 胡嘉辉, 任海林. 饲喂辅助机器人的智能推料方法与试验研究[J]. 华南理工大学学报(自然科学版), 2022, 50(6): 111-120.
[11]	杨春玲, 凌茜, 吕泽宇. 特征域多假设预测视频压缩感知重构神经网络[J]. 华南理工大学学报(自然科学版), 2022, 50(6): 80-90.
[12]	沃焱, 梁籍云, 韩国强. 基于度量学习的跨模态人脸检索方法[J]. 华南理工大学学报(自然科学版), 2022, 50(6): 1-9.
[13]	赵建东, 朱丹, 刘佳欣. 基于时间序列分解与门控循环单元的地铁换乘客流预测 [J]. 华南理工大学学报(自然科学版), 2022, 50(5): 22-31.
[14]	冯浩王年唐俊. 面向大规模图像检索的深度多尺度注意力哈希网络[J]. 华南理工大学学报(自然科学版), 2022, 50(4): 35-45.
[15]	郑娟毅, 慕金玉, 邢丽荣, 等. 基于深度压缩感知的波束空间信道估计算法[J]. 华南理工大学学报(自然科学版), 2022, 50(12): 101-108.

基于多模型集成的语义文本相似性判断

Semantic Textual Similarity Justification based on Multi-Model Ensemble

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价