消歧
消歧的相关文献在1997年到2023年内共计485篇,主要集中在自动化技术、计算机技术、常用外国语、语言学
等领域,其中期刊论文70篇、会议论文3篇、专利文献28683篇;相关期刊53种,包括学理论、绍兴文理学院学报、计算机工程等;
相关会议3种,包括第六届全国信息检索学术会议、2002年全国机器翻译研讨会、第五届中国人工智能联合学术会议等;消歧的相关文献由1035位作者贡献,包括鹿文鹏、李载炯、戴帅湘等。
消歧—发文量
专利文献>
论文:28683篇
占比:99.75%
总计:28756篇
消歧
-研究学者
- 鹿文鹏
- 李载炯
- 戴帅湘
- 袁志伟
- 徐忠源
- 权宁抚
- 周园春
- 杜一
- 余正涛
- 郭剑毅
- 乔子越
- M·阿布达拉
- 孟凡擎
- 张春祥
- B·M·舍纳
- G·W·达克斯
- J·E·巴杰
- M·S·布林
- P·W·莫尔
- P·米尔曼
- R·E·霍洛普
- R·J·穆伦
- S·D·米利根
- T·G·库珀
- 刘兵
- 线岩团
- E·克里默
- G·萨夫兰斯基
- I·蒙亚克
- J·多维克
- M·P·格伦坦尔
- 亚历山德鲁·马里乌斯·帕斯卡
- 刘睿
- 吕正东
- 宁致远
- 布鲁斯·W·墨菲
- 张维玉
- 成金勇
- 房小涵
- 拉兹万·康斯坦丁·布内斯库
- 文永华
- 曹涌
- 李琳娜
- 杜月寒
- 苗艳军
- 董昊
- 贾连印
- 陈玮
- 韩红旗
- 高雪瑶
-
-
籍佳伟
-
-
摘要:
围绕"差一点没VP"句式进行研究,从"差一点"词汇语义辖域跨语言比较的基础性问题出发,在大规模语料中抽取"差一点"相关语料进行归纳,重点探讨了汉英语中该词汇近义场各成员间词义的细微差异,以期为歧义消解、语言教学及机器翻译等领域提供参考。通过替换方式考察认为,以"差一点"为核心,依照词义关联度的逐级递减顺序,存在"差一点≈险些(不希望发生的情况)≈几乎≈差不多"这样的等级序列,而在英语中则首先明确该词汇的不同对译方式,进而对各对译方式的句法语义特点进行区分辨别。
-
-
江伟豪;
严丽;
屠要峰;
周祥生;
李忠良
-
-
摘要:
由于知识网络与互联网应用的高速发展,RDF(Resource Description Framework,资源描述框架)被广泛应用到关联数据的存储以及知识图谱的创建当中.基于自然语言处理的RDF问答系统是普通用户查询RDF数据的高效方法.在处理自然语言的过程中一般分为用户意图理解和查询验证两个阶段.而现存的研究方法是在用户意图理解阶段使用联合消歧的方式消除歧义,并且在查询验证阶段进行穷举验证,无效语句的运行延长了响应时间.本文基于N-gram模型建立语义概率模型,利用语义概率模型在用户意图理解阶段解决结构歧义与映射歧义的问题,且最终将查询意图转化为top-k个最优的查询语句进行查询并获取结果.通过与现存的方法在真实基准数据集中测试对比,本方法提高了在解决隐式关系问题方面的准确率,并且提升了查询性能.
-
-
王伟;
赵尔平;
崔志远;
孙浩
-
-
摘要:
针对目前词向量表示低频词质量差,表示的语义信息容易混淆,以及现有的消歧模型对多义词不能准确区分等问题,提出一种基于词向量融合表示的多特征融合消歧方法.该方法将使用知网(HowNet)义原表示的词向量与Word2vec生成的词向量进行融合来补全词的多义信息以及提高低频词的表示质量.首先计算待消歧实体与候选实体的余弦相似度来获得二者的相似度;其次使用聚类算法和知网知识库来获取实体类别特征相似度;然后利用改进的潜在狄利克雷分布(LDA)主题模型来抽取主题关键词以计算实体主题特征相似度,最后通过加权融合以上三类特征相似度实现多义词词义消歧.在西藏畜牧业领域测试集上进行的实验结果表明,所提方法的准确率(90.1%)比典型的图模型消歧方法提高了7.6个百分点.
-
-
麻广一
-
-
摘要:
自然语言处理是近些年来的热门话题,陆俭明先生提出了计算机PP〈被〉+VP1+VP2这类歧义格式的困境,詹卫东先生以此为题做了相应的研究。文章在詹卫东先生对PP〈被〉+VP1+VP2的歧义研究的基础上,做了进行进一步的延伸:一、挖掘带否定标记的VP与PP〈被〉组合所受的具体限制规则。二、对分化为a式和b式以后的进一步消歧及“我被他拦住不让走”问题和“我被砍头吓晕了”问题的思考。三、总结出该格式的消歧流程图。四、提出该格式消歧中仍待解决的问题。文章对上述进行了细化研究,并尝试提出解决方案,以期能对自然语言处理中的歧义句问题尽微薄之力。
-
-
易品;
刘振丙;
殷建华
-
-
摘要:
在偏标记学习问题中,每个样本都有一个对应的候选标签集,而其中只有一个标签是真实的标签,其余标签为伪标签,如何利用标签不确定的数据训练得到稳定的分类模型是偏标记学习的主要研究任务.为了解决偏标记学习领域标签信息未得到充分利用的问题,提出一种改进特征引导消歧的偏标记学习算法.通过最小二乘法计算特征之间的相似程度,利用样本与近邻样本标签的皮尔逊相关系数来确定样本之间的相似程度,并确定一个样本间的综合相似度完成消歧.在分类阶段采用bagging策略来构建分类决策树,实现对数据的分类.在UCI数据集和偏标记数据集上进行实验,并与现有算法进行对比分析得出,PL-FGD算法的分类效果得到了显著提升,表明本算法有较好的性能和表现.
-
-
征察;
吉立新;
高超;
李邵梅;
吴翼腾
-
-
摘要:
偏标记数据消歧是利用偏标记数据进行机器学习的基础.针对偏标记数据中广泛存在的数据不平衡问题,以及现有消歧算法对样本间约束信息利用不足的问题,本文提出一种基于成对约束的偏标记数据消歧算法.首先,基于低秩表示,推导出数据不平衡条件下样本低秩表示系数和样本相似度之间的关系;其次,基于推导结果,分别构建基于样本间正约束和负约束的图模型,通过最小化图模型的能量函数求解偏标记数据的标签.在5个公开数据集上的实验结果表明本文方法相对基准算法在消歧准确率上平均提高了2.9%~14.9%.
-
-
高永兵;
宋添树;
李江宇;
马占飞
-
-
摘要:
聚类相关度大的个人微博有助于快速了解博主的专业兴趣和经历,目前的短文本聚类方法缺乏对于语义和句子相关度的充分考虑,提出了一种基于知网的个人微博语义相关度的聚类方法.其要点如下:(1)利用Skip-gram训练大量微博文本生成词汇向量;(2)根据词汇义原进行句内词汇消除歧义;(3)分别计算个人微博之间词汇和句子的相似度并将其综合得到博文相关度;(4)根据博文相关度进行个人微博的聚类.实验表明,相较于层次聚类法、密度聚类法,本文算法的准确度有明显提高.
-
-
-
-
周斌斌;
张敏灵;
刘胥影
-
-
摘要:
偏标记学习是一类重要的弱监督学习框架,在该框架下,每个训练样本与一组候选标记相关联,在候选标记集合中有且仅有一个是其真实标记.很明显,候选标记数目越多,偏标记学习难度越大.为了减少候选标记数目以降低偏标记学习难度,提出了一种基于三元纠错输出码的偏标记学习算法(PL-TECOC),该算法将偏标记学习问题转换为多个二类学习问题,并对学到的多个二类分类器进行最终集成.在构建二类训练数据时采用编码"0"来忽略相应标记,仅依据非"0"编码标记进行正负类的构造,以达到减少候选标记数目的目的.实验表明,与多个流行的偏标记学习算法相比,PL-TECOC在人工数据集和真实数据集上均取得了较好的分类性能.