【24h】

Automatic filtration of multiword units

机译:多语单位自动过滤

获取原文

摘要

This paper studies how to filtrate multiword units. We use normalized expectation (NE) to extract multiword unit candidates from patent corpus. Then the multiword unit candidates are filtrated using stop words, frequency, first stop words, last stop words, and contextual entropy. The experimental result shows that the precision rate of multiword units is improved by 8.7% after filtration.
机译:本文研究如何滤除多语单位。我们使用标准化期望(NE)从专利语料库中提取多字单元候选。然后使用停止单词,频率,第一个停止单词,最后停止单词和上下文熵过滤多字单元候选。实验结果表明,过滤后,多语单词的精密率提高了8.7%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号