The proliferation of text databases within large organizations and on the Internet makes it difficult for a person to know which databases to search. Given
This paper demonstrates that cooperation is not required. Instead, the database selection service can construct its own language models by sampling database contents via the normal process of running queries and retrieving documents. Although random sampling is not possible, it can be approximated with carefully selected queries. This
大型组织内部和Internet上的文本数据库的激增使人们很难知道要搜索哪些数据库。给定描述每个数据库内容的 本文表明不需要合作。相反,数据库选择服务可以通过运行查询和检索文档的常规过程对数据库内容进行采样来构建自己的语言模型。尽管不可能进行随机采样,但是可以通过精心选择的查询来近似得出。这种
机译:人类免疫缺陷病毒逆转录酶和蛋白酶序列数据库:扩展的数据模型,集成了自然语言文本和序列分析程序。
机译:将基于欺骗性语言的基于文本的自动检测应用于警察报告:从多步骤分类模型中提取行为模式,以了解我们对警察的谎言
机译:文本摘要以及从自然语言文本中发现框架和关系的研究方法
机译:自动发现文本数据库的语言模型
机译:从数据库自动发现重要事件。
机译:自然语言处理和自由文本的自动SNOMED编码:使用德语SNOMED II的解析工具对例行电子病历应用中的自由文本数据进行分析
机译:自动发现文本数据库的语言模型