首页> 外文期刊>Computers & geosciences >DGeoSegmenter: A dictionary-based Chinese word segmenter for the geoscience domain
【24h】

DGeoSegmenter: A dictionary-based Chinese word segmenter for the geoscience domain

机译:DGeoSegmenter:适用于地球科学领域的基于字典的中文分词器

获取原文
获取原文并翻译 | 示例
           

摘要

Larger numbers of geoscience reports create challenges and opportunities for data analysis and knowledge discovery. Segmenting texts into semantically and syntactically meaningful words is known as the Chinese word segmentation (CWS) problem because there is no space between words in the Chinese language. CWS is a crucial first step toward natural language processing (NLP). Although the available generic segmenters can process geoscience reports, their performance degrades dramatically without sufficient domain knowledge. Hence, developing effective segmenters remains a challenge and requires more work.
机译:大量的地球科学报告给数据分析和知识发现带来了挑战和机遇。将文本分割成具有语义和语法意义的单词被称为中文分词(CWS)问题,因为中文单词之间没有空格。 CWS是迈向自然语言处理(NLP)的关键的第一步。尽管可用的通用分段器可以处理地球科学报告,但是如果没有足够的领域知识,它们的性能就会大大降低。因此,开发有效的细分市场仍然是一个挑战,需要更多的工作。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号