基于文本挖掘的语词典研究

严建军; 彭雯

首页> 中文期刊> 《无线互联科技》 >基于文本挖掘的语词典研究

基于文本挖掘的语词典研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

在信息大爆炸、多元文化迅猛发展的时代,语言方面也随之出现了许多的未知领域.文章研究的是近年来数据挖掘领域的一个热门方向.所谓文本挖掘,就是从未知的文本和语言中寻找相似的特征,并加以探讨和研究.文章研究一类未知语言词典文本挖掘问题,该语词典由20个字母组成,现已获得由这20个字母组成的30段文本(单个文本长度为5000～8000),现需从中找到相似序列的片段(长度为15～21),且容错不能大于4.对此,文章以英文字母代表未知字母建立文本模型,以两段文本为例,划分并找到相似序列,编写算法,以实际例子加以验证.最后,分析文本模型和算法实例,对文本及算法加以改进,能够更快速而尽可能地找到符合要求的字母片段.

著录项

来源
《无线互联科技》 |2020年第11期|128-129|共2页
作者
严建军; 彭雯;
展开▼
作者单位

江西理工大学(南昌校区) 江西南昌 330013;

江西理工大学(南昌校区) 江西南昌 330013;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
文本挖掘; 倒排索引; 双向过滤; 字符串相似;

相似文献

中文文献
外文文献
专利

1. 从《突厥语大词典》看十一世纪新疆地区的皮肤病及其相关社会问题-对《突厥语大词典》中皮肤病资料的整理与研究 [J] . 刘戈 ,李虹 . 和田师范专科学校学报 . 2005,第004期
2. 基于重现的无词典分词方法在中文生物医学文本挖掘中的应用 [J] . 王军辉 ,胡铁军 ,李丹亚 . 医学信息学杂志 . 2009,第002期
3. 基于文本挖掘的搭配词典自动架构探讨 [J] . 张辉 ,薛贵荣 . 上海工程技术大学学报 . 2004,第004期
4. 学习词典研究助力外语教学与改革——评《二语习得与学习词典研究》 [J] . 程墨芳 . 语文建设 . 2018,第9X期
5. 西班牙语原版词典中西班牙语惯用搭配的分析——以《西班牙语学习词典》为例 [J] . 文慧 . 外国语文（四川外语学院学报） . 2020,第001期
6. 《现代维吾尔语语法信息词典》数据库建设的研究 [C] . Jiamila Hoxur ,加米拉·吾守尔 ,Wayit Abliz . 第十一届全国计算语言学学术会议 . 2011
7. 单语外向型学习词典插图配置对比研究——以《商务馆学汉语词典》和《朗文中阶英语词典》为例 [A] . 李书源 . 2020

基于文本挖掘的语词典研究

摘要

著录项

相似文献

相关主题

期刊订阅