首页 | 本学科首页   官方微博 | 高级检索  
     

医疗材料光学字符识别要素提取数据集MedOCR
引用本文:刘利锋,常德杰,赵晓龙,王铁虎,杨锦新,郭龙杰,陈漠沙,汤步洲. 医疗材料光学字符识别要素提取数据集MedOCR[J]. 医学信息学杂志, 2022, 43(12): 28-31
作者姓名:刘利锋  常德杰  赵晓龙  王铁虎  杨锦新  郭龙杰  陈漠沙  汤步洲
作者单位:北京环球医疗救援 北京 100020;阿里巴巴 杭州 310000;哈尔滨工业大学深圳鹏城实验室 深圳 518055
摘    要:介绍医疗材料光学字符识别要素提取数据集MedOCR设计目的、标注过程及数据特点,详细阐述MedOCR数据集的数据来源、标注方法、材料示例,分析数据集测评结果及应用情况,指出研究人员可基于MedOCR开展医疗材料信息提取方向的研究。

关 键 词:医疗行业  人工智能  信息提取
修稿时间:2022-10-14

MedOCR:The Dataset for Extraction of Optical Character Recognition Elements for Medical Materials
LIU Lifeng,CHANG Dejie,ZHAO Xiaolong,WANG Tiehu,YANG Jinxin,GUO Longjie,CHEN Mosh,TANG Buzhou. MedOCR:The Dataset for Extraction of Optical Character Recognition Elements for Medical Materials[J]. Journal of Medical Informatics, 2022, 43(12): 28-31
Authors:LIU Lifeng  CHANG Dejie  ZHAO Xiaolong  WANG Tiehu  YANG Jinxin  GUO Longjie  CHEN Mosh  TANG Buzhou
Affiliation:Beijing Universal Medical Assistance,Beijing 100020,China;Alibaba Group,Hangzhou 310000,China; Peng Cheng Laboratory, Harbin Institute of Technology, Shenzhen 518055, China
Abstract:The paper introduces the design purpose, annotation process and data characteristics of MedOCR, an Optical Character Recognition(OCR) element extraction dataset for medical materials, elaborates the data sources, annotation methods, material examples of MedOCR dataset, and analyzes the evaluation results and application of the dataset. Researchers can carry out research in the direction of information extraction of medical materials based on MedOCR.
Keywords:
点击此处可从《医学信息学杂志》浏览原始摘要信息
点击此处可从《医学信息学杂志》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号