首页> 外国专利> METHOD AND APPARATUS FOR DETERMINING THE FREQUENCY OF WORDS IN A DOCUMENT WITHOUT DOCUMENT IMAGE DECODING

METHOD AND APPARATUS FOR DETERMINING THE FREQUENCY OF WORDS IN A DOCUMENT WITHOUT DOCUMENT IMAGE DECODING

机译:在没有文档图像解码的情况下确定文档中单词频率的方法和装置

摘要

A method and apparatus for determining wordfrequency from a document without first converting thedocument to character codes. The method includesmorphological image processing to determine word unitcharacteristics for placement into equivalence classes utilizingnon-content based information. Word shape representationsare preferably determined and compared to defineequivalent word units.
机译:确定单词的方法和装置来自文档的频率,而无需先转换文档到字符代码。该方法包括形态学图像处理确定词单位利用等价类的特征非基于内容的信息。字形表示最好确定并比较以定义等效单词单位。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号