中文医学文档分词及关键词提取研究

摘要

目的:分词和主题词提取,是中文自然语言处理的基础,本文通过对中文电子病历文档的分词和主题词提取研究,为电子病历结构化研究提供条件。rn 方法:从省内某三甲医院电子病历系统中导出的170份肾内科电子病历的现病史部分,约为59000个中文字。过程与方法:选择分词系统,利用ICTCLAS系统作为研究工具,通过加入医学专业词典以及一些必要的调整和人工干预,提高其在医学领域的分词准确率。rn 结果:采用本方法的处理,分词系统对现病史的分词准确率有了显著提高,达到90%。rn 结论:以170份的现病史做样本进行研究,结果基本达到预期,若扩大样本容量,其结果能达到或高于本研究的结果,有一定的推广意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号