华南理工大学学报(自然科学版) ›› 2017, Vol. 45 ›› Issue (3): 76-81.doi: 10.3969/j.issn.1000-565X.2017.03.011

• 计算机科学与技术 • 上一篇    下一篇

基于神经网络的微生物生长环境关系抽取方法

王健 李虹磊 林鸿飞 杨志豪 张绍武   

  1. 大连理工大学 计算机科学与技术学院,辽宁 大连 116024
  • 收稿日期:2016-11-18 出版日期:2017-03-25 发布日期:2017-02-02
  • 通信作者: 王健( 1967-) ,女,教授,博士生导师,主要从事信息检索、文本挖掘和自然语言处理研究. E-mail:wangjian@dlut.edu.cn
  • 作者简介:王健( 1967-) ,女,教授,博士生导师,主要从事信息检索、文本挖掘和自然语言处理研究.
  • 基金资助:
    国家自然科学基金资助项目( 61572098, 61572102, 61562080) ; 国家重点研发计划项目( 2016YFB1001103)

Bacteria Biotope Extraction on the Basis of Neural Network

WANG Jian LI Hong-lei LIN Hong-fei YANG Zhi-hao ZHANG Shao-wu   

  1. School of Computer Science and Technology,Dalian University of Technology,Dalian 116024,Liaoning,China
  • Received:2016-11-18 Online:2017-03-25 Published:2017-02-02
  • Contact: 王健( 1967-) ,女,教授,博士生导师,主要从事信息检索、文本挖掘和自然语言处理研究. E-mail:wangjian@dlut.edu.cn
  • About author:王健( 1967-) ,女,教授,博士生导师,主要从事信息检索、文本挖掘和自然语言处理研究.
  • Supported by:
    Supported by the National Natural Science Foundation of China( 61572098,61572102,61562080) and the National Key Research Development Program of China( 2016YFB1001103)

摘要: 提出一种基于神经网络的方法实现细菌和栖息地的关系抽取,充分利用神经网络的特性实现对隐含的深层特征的自动学习,以避免传统人工特征设计的复杂性和冗余性. 该方法利用单词以及实体属性的分布式向量丰富句法和语义信息,使用两个不同神经网络模型从不同角度进行关系抽取,并融合文档级别的分类结果,在生物医学自然语言处理BioNLP-ST 2016 共享任务的BB-event 语料上进行实验,取得了不错的F1值,表明该方法在微生物生长环境关系抽取上具有良好的性能.

关键词: 微生物生长环境关系抽取, 卷积神经网络, 长短时记忆神经网络, 分布式向量

Abstract: Proposed in this paper is a neural network-based method for extracting the relationship between bacteria and their habitats.In this method,implicit senior features are learnt automatically to avoid the complexity and redundancy of the traditional artificial design of features,and,distributed vector representation with rich syntactic and semantic knowledge for words and entities,two different neural network models,as well as integrated document- level extraction results,are comprehensively employed to make an evaluation on the BB-event corpus from BioNLP-ST 2016.Experimental results show that the proposed method achieves preferable F1 score,which means that it is effective in bacteria biotope extraction.

Key words: bacteria biotope extraction, convolutional neural network, long short-term memory neural network, distributed vector representation