HNC理论
HNC理论的相关文献在1997年到2022年内共计108篇,主要集中在自动化技术、计算机技术、语言学、汉语
等领域,其中期刊论文60篇、会议论文48篇、专利文献5517篇;相关期刊36种,包括法国研究、云南师范大学学报(哲学社会科学版)、情报杂志等;
相关会议11种,包括第十一届全国计算语言学学术会议、中国科学院声学研究所第三届青年学术交流会、第七届中文信息处理国际会议等;HNC理论的相关文献由85位作者贡献,包括张全、池毓焕、缪建明等。
HNC理论
-研究学者
- 张全
- 池毓焕
- 缪建明
- 张克亮
- 李颖
- 张运良
- 吴晨
- 张玲
- 苗传江
- 郝惠宁
- 雒自清
- 刘智颖
- 王宇
- 韦向峰
- 黄曾阳
- 中国科学院声学研究所
- 吕晓莉
- 吴崇斌
- 周宏
- 唐兴全
- 张彦彦
- 晋耀红
- 李青
- 杜玲莉
- 杨继唐
- 王俐
- 王芳
- 王青海
- 田祖伟
- 纪再祥
- 肖升
- 董凌冲
- 赵星
- 邬郑
- 阳西述
- 马海慧
- 魏晓宁
- 黄金柱
- Chi Yuhuan
- Dong Lingchong
- Li Haiyan
- Li Ying
- Ma Haihui
- QI Qi
- Wang Qinghai
- ZHANG Keliang
- 中国科学院
- 中国科学院研究生院
- 伍力慧
- 何婷婷
-
-
王婷婷
-
-
摘要:
传统机器翻译系统存在的缺点,即译文质量不高,其准确率极限为70%。HNC理论是针对机器翻译系统存在的缺点进行深入研究,提出一种创新式思路,利用HNC理论中的最重要处理模块之一,即语义主辅变换来提升机器翻译系统性能。文章立足于语义主辅变换原理,阐述了语义块概念与分类,分析语义主辅变换原因,再以案例详细分析语义块主辅变换在HNC理论下机器翻译系统中的应用,利用嵌入一个并不复杂的主辅变换法则,从而使译文质量大幅度提升。
-
-
张彦彦;
张克亮
-
-
摘要:
在汉语分裂句中,焦点标记对象的范围和语义信息的确认,是句子理解分析的关键.相较于短语结构驱动的生成语法和形式—意义配对的构式语法,以HNC理论为指导,以句类和语义块为单位的"中间切入,上下结合"的分析方法,能够达到对焦点标记内容更为全面的确认和解读.
-
-
张彦彦;
张克亮
-
-
摘要:
在汉语分裂句中,焦点标记对象的范围和语义信息的确认,是句子理解分析的关键。相较于短语结构驱动的生成语法和形式—意义配对的构式语法,以HNC理论为指导,以句类和语义块为单位的“中间切入,上下结合”的分析方法,能够达到对焦点标记内容更为全面的确认和解读。
-
-
王宇;
王芳
-
-
摘要:
针对问答社区中意见型问题答案文本情感突出的情况,首先提出一种补全未收录词HNC符号的方式,然后利用HNC理论的相关规律进行情感词的定位和情感值计算,进而利用情感值对答案句子进行聚类,生成积极、消极和中性三类情感句子类簇,最后提出基于最佳答案模板的相似度排序算法,抽取出3类情感答案摘要。实验证明,本文提出的方法在实例中的应用与人工生成的最佳摘要更为接近,尤其在摘要可读性、逻辑性方面比其他方法更具优势。
-
-
-
李启可1
-
-
摘要:
在HNC理论中,是否判断句是一般判断句的一个子类,组成判断句的主语一般情况下是人或者社会组织来充当,组成判断句的动词一般都是能够表达人类思维的动词,而宾语一般是判断的内容。在机器翻译中,判断句是一个重要的处理对象,研究英语和汉语的判断句的组成形式,分析英语和汉语的判断句的语义块,有助于我们改善机器翻译系统的翻译结果,把翻译的质量提高一个档次。
-
-
王宇;
伍力慧
-
-
摘要:
Purpose/Significance] The lexical chain is a semantic chain connected with a series of words in the text. Building lexical chains helps readers to grasp the theme of the text, and has an important value on knowledge element building and automatic abstract gen-eration. [ Method/Process] Based on the HNC ( Hierarchical Network of Concepts) theory, this paper describes the lexical semantics for-mally, using the symbols and the same line priority criteria of the HNC, and the polysemy contextual information revealed by dependency syntax. [Result/Conclusion]Then the semantic relatedness of words is obtained by applying HNC semantic similarity calculation. On this basis, a lexical chain building algorithm is proposed, and the preferred lexical chain is achieved after optimization processing. Experiment results show that the proposed lexical chain building method is of a high acceptance degree.%[目的/意义]词汇链是文本中一系列词汇关联而成的语义链。构造词汇链有助于读者把握文本主题,对知识元构建、自动文摘生成等领域研究有重要价值。[方法/过程]借鉴HNC理论的概念层次原理对词汇语义进行形式化描述,利用HNC的符号和同行优先准则,及依存句法揭示的多义词上下文信息,对词语语义进行消歧处理,进而运用HNC语义相似度计算方法获得词语的语义关联性。[结果/结论]在此基础上,提出词汇链构建算法,并对词汇链进行优选处理,获得优选词汇链。实验结果表明,基于HNC理论和依存句法提出的词汇链构造方法的可接受度较高。
-
-
袁晓峰
-
-
摘要:
计算文本相似度常用基于向量空间计算夹角余弦的方法,该方法忽视了同一文本中词与词之间的语义相似度,因而造成了文本表示模型的高维性以及计算的高复杂性。为此,提出了一种文本相似度算法,利用HNC理论先计算特征词之间的语义相似度,进行必要的降维,进一步计算每个文本向量中的TF*IDF值,最后计算两个向量的空间夹角余弦值并将其作为两个文本之间的相似度。将实验结果与直接计算余弦值的结果比较发现,改进后的算法中VSM的维数明显比改进前小得多,改进后的算法提高了召回率和准确率。因此,改进后的算法是切实有效的。%The method to calculate text similarity based on VSM is widely used, which causes high dimension of VSM and complexity of calculation because it ignores the relationship between words in the same text. HNC theory is applied to calculate the weight of VSM and the similarity between texts. The practice shows that the dimension is smaller than before, the recall rate and precision of the algorithm have improved.
-
-
陆小鹿
-
-
摘要:
[Abstract]Machine Translation is indispensable to modern information era to overcome barriers of the language communication . HNC theory by using the method of primitives, hierarchical, network, formal, integrates the sentence structures with semantics, Based on the HNC theory, interprets the conversion of sentence category and patterns between English and Chinese and Contrast between English and Chinese.%机器翻译是现代信息时代克服语言交流障碍不可缺少的的手段。 HNC理论采用基元化、层次化、网络化、形式化的方法,通过句类精妙地把自然语言的表层结构和深层语义联系起来。通过机器翻译,对比研究英汉翻译中的句类句式转换的问题。
-
-
李颖;
韦向峰;
池毓焕
-
-
摘要:
针对目前搜索引擎难以按用户个性需求给出精确答案的现状,把概念层次网络理论的语义分析技术应用到搜索引擎中,在概念层次网络理论的基础上将自然语言的词、句和句群映射为概念符号、句类和概念框架,通过比较用户输入与网页文本的概念符号和概念框架,给出与用户输入语义上相同或相近的搜索结果,可以使搜索结果更加准确、更加符合用户意图,这有助于推动和促进下一代搜索引擎的个性化和智能化研究.
-
-
Wang Qinghai;
王青海;
Ma Haihui;
马海慧;
Chi Yuhuan;
池毓焕;
Li Ying;
李颖;
Dong Lingchong;
董凌冲
- 《第十一届全国计算语言学学术会议》
| 2011年
-
摘要:
汉语词语知识库是HNC知识库系统的重要组成部分,目前其结构设计简单,加大了对HNC符号解析的难度.本文在分析了HNC的编码特点的基础上,改进了汉语词语知识库模型,阐述了改进后汉语词语知识库实体属性的设计方法和知识库的填写原则,并用实例说明了改进后的词语知识库可以提高自然语言处理的效率.本文设计的HNC汉语词语知识库虽然增加了建库的复杂度,但增强了知识库的程序可读性,提高了HNC知识库的层次性、逻辑性。尤其将HNC符号分高、中、低三层写入知识库的办法,简化了HNC符号的读取,减小因读取HNC符号造成的处理误差,同时,便于简化接口程序和搜索算法,方便知识库的管理。填写HNC知识库的过程,是从词语的文字符号向HNC的概念表述符号映射的过程,要求填写者理解和掌握HNC的概念符号体系以及HNC的自然语言理解处理策略。所以,要建好这个资源,还需要大量跨接语言学和计算机科学的复合型专业人才。
-
-
Wang Qinghai;
王青海;
Ma Haihui;
马海慧;
Chi Yuhuan;
池毓焕;
Li Ying;
李颖;
Dong Lingchong;
董凌冲
- 《第十一届全国计算语言学学术会议》
| 2011年
-
摘要:
汉语词语知识库是HNC知识库系统的重要组成部分,目前其结构设计简单,加大了对HNC符号解析的难度.本文在分析了HNC的编码特点的基础上,改进了汉语词语知识库模型,阐述了改进后汉语词语知识库实体属性的设计方法和知识库的填写原则,并用实例说明了改进后的词语知识库可以提高自然语言处理的效率.本文设计的HNC汉语词语知识库虽然增加了建库的复杂度,但增强了知识库的程序可读性,提高了HNC知识库的层次性、逻辑性。尤其将HNC符号分高、中、低三层写入知识库的办法,简化了HNC符号的读取,减小因读取HNC符号造成的处理误差,同时,便于简化接口程序和搜索算法,方便知识库的管理。填写HNC知识库的过程,是从词语的文字符号向HNC的概念表述符号映射的过程,要求填写者理解和掌握HNC的概念符号体系以及HNC的自然语言理解处理策略。所以,要建好这个资源,还需要大量跨接语言学和计算机科学的复合型专业人才。
-
-
Wang Qinghai;
王青海;
Ma Haihui;
马海慧;
Chi Yuhuan;
池毓焕;
Li Ying;
李颖;
Dong Lingchong;
董凌冲
- 《第十一届全国计算语言学学术会议》
| 2011年
-
摘要:
汉语词语知识库是HNC知识库系统的重要组成部分,目前其结构设计简单,加大了对HNC符号解析的难度.本文在分析了HNC的编码特点的基础上,改进了汉语词语知识库模型,阐述了改进后汉语词语知识库实体属性的设计方法和知识库的填写原则,并用实例说明了改进后的词语知识库可以提高自然语言处理的效率.本文设计的HNC汉语词语知识库虽然增加了建库的复杂度,但增强了知识库的程序可读性,提高了HNC知识库的层次性、逻辑性。尤其将HNC符号分高、中、低三层写入知识库的办法,简化了HNC符号的读取,减小因读取HNC符号造成的处理误差,同时,便于简化接口程序和搜索算法,方便知识库的管理。填写HNC知识库的过程,是从词语的文字符号向HNC的概念表述符号映射的过程,要求填写者理解和掌握HNC的概念符号体系以及HNC的自然语言理解处理策略。所以,要建好这个资源,还需要大量跨接语言学和计算机科学的复合型专业人才。
-
-
Wang Qinghai;
王青海;
Ma Haihui;
马海慧;
Chi Yuhuan;
池毓焕;
Li Ying;
李颖;
Dong Lingchong;
董凌冲
- 《第十一届全国计算语言学学术会议》
| 2011年
-
摘要:
汉语词语知识库是HNC知识库系统的重要组成部分,目前其结构设计简单,加大了对HNC符号解析的难度.本文在分析了HNC的编码特点的基础上,改进了汉语词语知识库模型,阐述了改进后汉语词语知识库实体属性的设计方法和知识库的填写原则,并用实例说明了改进后的词语知识库可以提高自然语言处理的效率.本文设计的HNC汉语词语知识库虽然增加了建库的复杂度,但增强了知识库的程序可读性,提高了HNC知识库的层次性、逻辑性。尤其将HNC符号分高、中、低三层写入知识库的办法,简化了HNC符号的读取,减小因读取HNC符号造成的处理误差,同时,便于简化接口程序和搜索算法,方便知识库的管理。填写HNC知识库的过程,是从词语的文字符号向HNC的概念表述符号映射的过程,要求填写者理解和掌握HNC的概念符号体系以及HNC的自然语言理解处理策略。所以,要建好这个资源,还需要大量跨接语言学和计算机科学的复合型专业人才。
-
-
-
-
-
熊文;
张玲
- 《第七届中文信息处理国际会议》
| 2007年
-
摘要:
本文提出了一种新的基于规则的不依赖于分词的数量短语识别方法来实现中文数量短语的识别。首先对中文数量短语识别技术的现状进行了简要分析和概述,明确了中文数量短语识别的任务,然后,基于前人的工作提出了基于规则的方法及不作分词和词法分析,而根据数量短语的特征库直接进行提取和识别的方法。其基本思路是:通过识别器中的搜索器对句子进行搜索,得到一个具有特征的最大字符串,再通过内建的规则处理器对最大字符串进行中文数量短语构成模式的识别,在识别的过程中,使用数量短语特征库填充11类构成模式,并自动对识别出的数量短语进行类XML标注,由于特征库和构成模式可以方便地添加进系统,从而能加强系统的识别效果。我们在人民日报1998年1月份的未标注语料上进行了中文数量短语的识别实验,取得了召回率98.7%,精度90.9%的较好效果,由于采用了不分词的技术,与采用分词技术的识别过程相比,显著地提高了处理的效率。
-
-
熊文;
张玲
- 《第七届中文信息处理国际会议》
| 2007年
-
摘要:
本文提出了一种新的基于规则的不依赖于分词的数量短语识别方法来实现中文数量短语的识别。首先对中文数量短语识别技术的现状进行了简要分析和概述,明确了中文数量短语识别的任务,然后,基于前人的工作提出了基于规则的方法及不作分词和词法分析,而根据数量短语的特征库直接进行提取和识别的方法。其基本思路是:通过识别器中的搜索器对句子进行搜索,得到一个具有特征的最大字符串,再通过内建的规则处理器对最大字符串进行中文数量短语构成模式的识别,在识别的过程中,使用数量短语特征库填充11类构成模式,并自动对识别出的数量短语进行类XML标注,由于特征库和构成模式可以方便地添加进系统,从而能加强系统的识别效果。我们在人民日报1998年1月份的未标注语料上进行了中文数量短语的识别实验,取得了召回率98.7%,精度90.9%的较好效果,由于采用了不分词的技术,与采用分词技术的识别过程相比,显著地提高了处理的效率。
-
-
熊文;
张玲
- 《第七届中文信息处理国际会议》
| 2007年
-
摘要:
本文提出了一种新的基于规则的不依赖于分词的数量短语识别方法来实现中文数量短语的识别。首先对中文数量短语识别技术的现状进行了简要分析和概述,明确了中文数量短语识别的任务,然后,基于前人的工作提出了基于规则的方法及不作分词和词法分析,而根据数量短语的特征库直接进行提取和识别的方法。其基本思路是:通过识别器中的搜索器对句子进行搜索,得到一个具有特征的最大字符串,再通过内建的规则处理器对最大字符串进行中文数量短语构成模式的识别,在识别的过程中,使用数量短语特征库填充11类构成模式,并自动对识别出的数量短语进行类XML标注,由于特征库和构成模式可以方便地添加进系统,从而能加强系统的识别效果。我们在人民日报1998年1月份的未标注语料上进行了中文数量短语的识别实验,取得了召回率98.7%,精度90.9%的较好效果,由于采用了不分词的技术,与采用分词技术的识别过程相比,显著地提高了处理的效率。