首页> 中文会议>第十一届全国人机语音通讯学术会议 >一种基于二元背景模型的新词发现方法

一种基于二元背景模型的新词发现方法

页面导航

摘要
著录项
相似文献
相关主题

摘要

本研究提出了一种基于二元背景模型的新词发现方法。采用前、背景语料二元似然比挑选候选二元组（bigram）；然后根据频率、刚性、条件概率等基于前景语料的统计量，对二元组进行进一步筛选和扩展，以确定新词边界。用该方法提取出的词既包含新词特征，又可以成词。而且该方法充分利用现有背景生语料却无需分词等标注信息，不依赖词典、分词模型和规则，具有良好的扩展性。为了得到更好的发现效果，还讨论了各统计量阈值的选取策略和垃圾元素剔除策略。该方法在网络小说语料上验证了其有效性。

著录项

来源
《第十一届全国人机语音通讯学术会议》|2011年|1-4|共4页
会议地点西安
作者
吴悦; 燕鹏举; 翟鲁峰;
展开▼
作者单位

中国中文信息学会;

中国声学学会;

中国语音学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类数理语言学;
关键词
汉字处理; 新词发现; 二元组模型; 数理语言学;
入库时间 2022-08-17 11:13:11

相似文献

中文文献
外文文献
专利

1. 一种基于新词发现的Web文本表示方法 [J] . 吴春颖 ,王士同 ,蔡崇超 . 计算机应用 . 2008,第003期
2. 一种基于改进混合高斯背景模型的运动目标检测方法研究 [J] . 李战明 ,崔琳琳 . 工业仪表与自动化装置 . 2012,第004期
3. 一种基于双背景模型的遗留物检测方法 [J] . 范俊君 ,战荫伟 . 计算机系统应用 . 2012,第008期
4. 一种基于码本背景模型的运动目标检测方法 [J] . 赵占杰 ,林小竹 ,张金燕 . 北京石油化工学院学报 . 2010,第001期
5. 一种基于背景模型的自适应的目标检测方法 [J] . 范亚男 ,葛卫丽 . 科技资讯 . 2010,第032期
6. 一种基于阴影抑制和统计背景模型的运动目标检测方法 [C] . 王贵珠 ,李俊韬 ,范耀祖 . 2006北京地区高校研究生学术交流会 . 2006
7. 微博新词发现及新词情感极性判断方法 [A] . 王欣 . 2018

一种基于二元背景模型的新词发现方法

摘要

著录项

相似文献

相关主题

期刊订阅