中文“非多字词错误”自动校对方法研究

刘亮亮; 曹存根

首页> 中文期刊> 《计算机科学》 >中文“非多字词错误”自动校对方法研究

中文“非多字词错误”自动校对方法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对目前中文文本中的“非多字词错误”自动校对方法的不足,提出了一种模糊分词的“非多字词错误”自动查错和自动校对方法.首先利用精确匹配算法与中文串模糊相似度算法对中文文本进行精确切分和模糊全切分,建立词图;然后利用改进的语言模型对词图进行最短路径求解,得到分词结果,实现“非多字词错误”的自动发现和自动纠正.实验测试集是由2万行领域问答系统日志语料构成,共包含664处“非多字词错误”.实验表明,所提方法能有效发现“非多字词错误”,包括由于汉字替换、缺字、多字引起的“非多字词错误”,该方法的查错召回率达到75.9％,查错精度达到85％.所提方法是一种将查错与纠错融于一体的方法.

著录项

来源
《计算机科学》 |2016年第10期|200-205|共6页
作者
刘亮亮; 曹存根;
展开▼
作者单位

江苏科技大学计算机科学与工程学院镇江212003;

中国科学院计算技术研究所智能信息重点实验室北京100190;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
非词错误; 非多字词错误; 模糊匹配; 词图;

相似文献

中文文献
外文文献
专利

1. 面向油田领域的中文真词错误自动校对方法研究 [J] . 王辉 ,Marius.Petrescu ,潘俊辉 . 计算技术与自动化 . 2021,第001期
2. 基于局部上下文特征的组合的中文真词错误自动校对研究 [J] . 刘亮亮 ,曹存根 . 计算机科学 . 2016,第12期
3. 中文文本自动校对中的语法错误检查 [J] . 龚小谨 ,罗振声 ,骆卫华 . 计算机工程与应用 . 2003,第008期
4. 面向OCR文本识别词错误自动校对方法研究 [J] . 郝亚男 ,乔钢柱 ,谭瑛 . 计算机仿真 . 2020,第009期
5. 中文文本敏感信息自动校对方法研究 [J] . 龚永罡 ,汪昕宇 ,李玉莹 . 电脑与电信 . 2018,第012期
6. 中文自动查错与人机交互纠错系统的研究与实现—简介语料中文自动校对系统 [C] . 吴岩 ,蔺荪 . 全国第七届计算语言学联合学术会议 . 2003
7. 中文真词错误自动校对方法研究 [A] . 顾德之 . 2017

中文“非多字词错误”自动校对方法研究

摘要

著录项

相似文献

相关主题

期刊订阅