国外生物医学文本语料库分类及特点研究
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家重点研发计划“精准医学文本知识网络构建”子课题“精准医学文本语料库构建”(项目编号:2016YFC0901902-2)。


Study on the Categories and Characteristics of Overseas Biomedical Text Corpuses
Author:
Affiliation:

Fund Project:

  • 摘要
  • 图/表
  • 访问统计
  • 参考文献
  • 相似文献
  • 引证文献
  • 资源附件
  • 文章评论
    摘要:

    通过梳理国外31个生物医学文本语料库标注内容,根据语料库标注实体类型,参照UMLS语义类型将其划分为6大类。总结语料库在语义类型、数据源等方面特点,阐述生物医学文本语料库构建流程及关键步骤,以期为我国生物医学文本语料库相关研究奠定基础。

    Abstract:

    The paper divides the corpus into six categories by analyzing annotated contents of the 31 overseas biomedical text corpuses and referring to UMLS semantic type according to the annotated entity types of the corpuses. It summarizes characteristics of the corpus in the aspects like semantic type and data source,expatiates on the building process and major steps of biomedical text corpus in the hope of laying down the foundation based on which related studies on China's biomedical text corpuses will be carried out.

    参考文献
    相似文献
    引证文献
引用本文

晏归来,安新颖,范少萍,等.国外生物医学文本语料库分类及特点研究[J].医学信息学杂志,2018,39(10):74-80

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2018-09-13
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2018-11-12
  • 出版日期:

扫码关注

官方微信