首页> 中文学位 >WEB网页文件的解析及翻译引擎的设计与实现
【6h】

WEB网页文件的解析及翻译引擎的设计与实现

代理获取

摘要

本文以网络机器翻译系统为研究背景,以HTML为研究对象,对面向网络机器翻译的文档解析处理方法进行了深入的研究和探讨。本文通过对HTML格式的分析,引入知识库机制,提出了基于自学习知识和规则相结合的解析方法。根据这一思路,设计和实现了HTML机器翻译系统。HTML机器翻译系统分为三个部分:HTML解析模块、翻译引擎模块、HTML还原模块。HTML解析模块把HTML文件解析成文本和标记,然后将文本提交给翻译引擎模块进行翻译,转换成译文,HTML还原模块将译文和标记进行组合,生成译文HTML。翻译引擎是HTML机器翻译系统的基础。翻译质量的好坏取决于翻译引擎的分析是否正确。本文根据典型的翻译引擎,描述了一个翻译引擎的处理流程。HTML机器翻译系统以知识库作为基础,HTML标记构成的知识库,不仅可以使系统模块化,增强系统的移植性,而且可以通过管理知识库,增强系统的性能。通过实践表明,知识库的引入提高了网络机器翻译的实用性和扩展性。经过对大规模的HTML文件不断的测试和完善,该系统达到了预期的效果,同时有效地证明了本文采用的WEB网页解析方法的正确性和实用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号