汉字关联性量化方法及其在文本相似性分析中的应用

赵彦斌; 李庆华

首页> 中文期刊>计算机应用 >汉字关联性量化方法及其在文本相似性分析中的应用

汉字关联性量化方法及其在文本相似性分析中的应用

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文本相似性分析、聚类和分类多基于特征词,由于汉语词之间无分隔符,汉语分词及高维特征空间的处理等基础工作必然引起高计算费用问题.探索了一种在不使用特征词的条件下,使用汉字间的关系进行文本相似性分析的研究思路.首先定义了文本中汉字与汉字之间关系的量化方法,提出汉字关联度的概念,然后构造汉字关联度矩阵来表示汉语文本,并设计了一种基于汉字关联度矩阵的汉语文本相似性度量算法.实验结果表明,汉字关联度优于二字词词频、互信息、T检验等统计量.由于无需汉语分词,本算法适用于海量中文信息处理.

著录项

来源
《计算机应用》|2006年第6期|1396-1397,1400|共3页
作者
赵彦斌; 李庆华;
展开▼
作者单位

华中科技大学,计算机科学与技术学院,湖北,武汉,430074;

国家高性能计算中心,湖北,武汉,430074;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP311.13;
关键词
汉字关联度; 信息矩阵; 文本相似度算法;

相似文献

中文文献
外文文献
专利

1. 一种新的相似性度量及其在DNA序列相似性分析中的应用 [J] . 刘兵 ,柳菁筠 ,李大超 . 海南师范大学学报（自然科学版） . 2009,第001期
2. 用Turbo C实现应用系统软件中的汉字文本编辑器 [J] . 任清珍 . 计算机应用研究 . 1992,第005期
3. 分析数量化方法(Ⅰ)在花样游泳运动员选材中的应用 [J] . 高举英 . 文体用品与科技 . 2022,第2期
4. 高校绩效评估量化方法研究评价——论因子分析法在高校绩效评估中的应用 [J] . 张国玉 ,余斌 . 大学 . 2007,第012期
5. 量化方法与现代统计分析技术在东南亚华裔学生语言与文化背景调查研究中的应用 [J] . 方绍峰 ,王爱平 . 华侨大学学报（哲学社会科学版） . 2002,第003期
6. 文本汉字的约束关系在汉字识别中的应用 [C] . 张彩录 . 第三届中文信息处理国际会议 . 1992
7. 文本向量化方法对文本分类效果影响的改进研究 [A] . 赵政 . 2018

汉字关联性量化方法及其在文本相似性分析中的应用

摘要

著录项

相似文献

相关主题

期刊订阅