首页 | 本学科首页   官方微博 | 高级检索  
     

基于深度学习的中医古籍缺失文本修复研究
引用本文:盛 威,卢彦杰,刘 伟,胡 为,周 冲. 基于深度学习的中医古籍缺失文本修复研究[J]. 中华医学图书情报杂志, 2022, 31(8): 1-7
作者姓名:盛 威  卢彦杰  刘 伟  胡 为  周 冲
作者单位:湖南中医药大学信息科学与工程学院,湖南 长沙 410208
基金项目:湖南省教育厅科学研究项目“融合机器学习的中医古籍 智能分析和知识抽取研究”(20C1435);湖南省自然科学基金项 目“中医典籍复杂语义结构分析与知识发现研究” (2022JJ30438);湖南中医药大学研究生创新课题项目 “基于深度学习的中医古籍修复研究与应用” (2022CX121)
摘    要:目的:基于构建的高质量中医古籍文本语料库及深度学习语言模型,训练出可以应用于中医古籍缺失文本修复的模型,为中医古籍修复工作提供帮助。方法:分别训练和测试N-gram模型、LSTM模型、BiLSTM模型、RoBERTa模型,对比筛选出最优模型,并将筛选出的最优模型运用到文本修复场景中。结果:BiLSTM模型优于LSTM模型,LSTM模型明显优于N-gram模型,而RoBERTa模型效果最优,将RoBERTa模型运用到《黄帝内经》的修复中,达到了63.36%的hit@1,82.57%的hit@5。结论:将深度学习技术应用于中医古籍缺失文本修复中具有较好的效果,能够为中医古籍修复提供帮助。

关 键 词:中医古籍;语言模型;文本修复;深度学习;RoBERTa
收稿时间:2022-07-18

The restoration of missing texts in ancient books of Traditional Chinese Medicine based on deep learning
SHENG Wei,LU Yan-jie,LIU Wei,HU Wei,ZHOU Chong. The restoration of missing texts in ancient books of Traditional Chinese Medicine based on deep learning[J]. Chinese Journal of Medical Library and Information Science, 2022, 31(8): 1-7
Authors:SHENG Wei  LU Yan-jie  LIU Wei  HU Wei  ZHOU Chong
Affiliation:School of Informatics, Hunan University of Chinese Medicine, Changsha 410208, Hunan Province, China
Abstract:
Keywords:Ancient books of traditional Chinese medicine   Language model   Text Repairing   Deep learning   RoBERTa
点击此处可从《中华医学图书情报杂志》浏览原始摘要信息
点击此处可从《中华医学图书情报杂志》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号