跨语言信息检索
跨语言信息检索的相关文献在2001年到2022年内共计128篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究
等领域,其中期刊论文106篇、会议论文14篇、专利文献334340篇;相关期刊56种,包括情报理论与实践、情报学报、情报杂志等;
相关会议13种,包括中国医学科学院/北京协和医学院医学信息研究所/图书馆2014年学术年会、第六届全国青年计算语言学会议、中华医学会第十七次全国医学信息学术会议等;跨语言信息检索的相关文献由227位作者贡献,包括吴丹、赵生辉、刘伟成等。
跨语言信息检索—发文量
专利文献>
论文:334340篇
占比:99.96%
总计:334460篇
跨语言信息检索
-研究学者
- 吴丹
- 赵生辉
- 刘伟成
- 王惠临
- 司莉
- 塔娜
- 姚建民
- 孙吉红
- 张玥杰
- 李小庆
- 林民
- 葛运东
- 黄名选
- 何大庆
- 吴立德
- 张俊林
- LIU Weicheng
- 亚历山德拉·科约乌霍夫
- 代六玲
- 任成梅
- 何冬蕾
- 余正涛
- 侯露露
- 刘刚
- 刘汪洋
- 吴琳
- 孙乐
- 孙常龙
- 宝美荣
- 张孝飞
- 张帆
- 张森南
- 张金柱
- 徐红姣
- 房璐
- 朱江
- 李岩
- 杨小敏
- 林嘉珊
- 檀慧
- 洪宇
- 王昊
- 王明文
- 王海峰
- 相艳
- 秦家豪
- 线岩团
- 胡昱临
- 莫琳·海曼斯
- 贾欢
-
-
葛运东;
陈洪梅;
姚建民
-
-
摘要:
[目的/意义]旨在探讨解决原英日文献检索分析中存在的不足,实现以中文为检索语言的中、英、日文献资源的统一检索。[方法/过程]介绍了一种通过机器翻译技术实现以中文为检索语言的中日英文献资源的统一检索系统。[结果/结论]该系统基于MASH-UP技术将检索结果整合进行统一的内容分析,帮助用户跨越语言的障碍,方便地查询和使用外文文献。
-
-
马爽
-
-
摘要:
中国少数民族文字信息处理技术还处于发展前期,标准化的工作尚未完成,目前许多网站所使用的文字编码互不相通,各网站之间不能兼容,网站开发水平参差不齐,页面代码不够规范等等,都使得少数民族文字搜索引擎的开发比汉文搜索引擎的开发更为困难,开发一个检索结果准确、全面的少数民族文字网络搜索引擎对少数民族文字互联网资源的检索以及民族问题舆情分析等方面的工作都有着重大意义.文章对少数民族文字网络搜索引擎难点问题与关键技术进行了梳理,并提出下一步需要开展的工作.
-
-
兰慧红
-
-
摘要:
针对传统跨语言查询扩展方法中存在的问题,提出一种基于用户兴趣模型的个性化跨语言查询扩展方法.该方法利用用户的历史浏览日志信息建立用户兴趣模型,在该模型基础上对初始检索结果进行分析,将初始检索结果文档中与用户兴趣相关度较大的文档作为查询扩展的依据,使扩展后得到的查询关键词更能表达用户的个性化需求.在真实用户搜索日志数据上的实验结果表明,本文算法能更好地满足用户的个性化需求,有效地改善和提高跨语言信息检索的准确率,与未经过个性化查询扩展的跨语言信息检索及现有算法比较,其实验结果的MAP、P@5、P@10值都得到了提高,提高幅度最大可达26.51%.
-
-
黄武锋;
何冬蕾;
黄名选
-
-
摘要:
针对跨语言信息检索中存在的查询主题漂移问题,提出一种基于完全加权关联规则后件扩展的越英跨语言信息检索模型,给出了模型结构及其各个功能模块,详细阐述了模型的关键技术及其算法.该模型将完全加权模式挖掘技术和用户相关反馈扩展融合应用于越英跨语言信息检索,将越南语查询通过机器翻译系统译为英文并检索为英文文档,提取前列初检文档构建用户相关反馈文档集,采用完全加权关联规则挖掘技术对用户相关反馈文档集挖掘与原查询相关的关联规则,将关联规则后件作为扩展词,并和原查询组合成新查询再次检索英文文档,得到最终检索结果.在NTCIR-5 CLIR数据集上的实验结果表明,该模型能减少越英跨语言检索中的查询漂移,提高和改善其检索性能.
-
-
余圆圆;
巢文涵;
何跃鹰;
李舟军
-
-
摘要:
跨语言知识链接是指在描述相同内容的不同语言的在线百科文章之间建立联系.跨语言知识链接可分为候选集选择和候选集排序两部分.首先,把候选集选择问题转换为跨语言信息检索问题,提出一种将标题与关键词相结合从而生成查询的方法,该方法将候选集选择的召回率大幅提高至93.8%;在候选集排序部分,提出一种融合双语主题模型及双语词向量的排序模型,实现了英文维基百科和中文百度百科之间军事领域的跨语言知识链接.实验结果表明,该模型取得了75% 的准确率,显著提高了跨语言知识链接的性能,并且提出的方法不依赖于语言特性和领域特性,因此可以很容易地扩展至其他语言和其他领域的跨语言知识链接.
-
-
赵生辉
-
-
摘要:
“多民族语言档案主题词表”是可以实现国家通用语言文字主题词和各少数民族语言文字主题词之间语义映射和关联关系的多语种档案主题词表,是民族地区档案机构在多语言环境下进行档案跨语言检索的基础工具.根据《多语种叙词表编制规则》,“多民族语言档案主题词表”总体上采用模块化结构设计.可在《中国档案主题词表》的基础上,增加若干个由国家通用语言文字向少数民族语言文字映射后形成的双语主题词子表,其各个子表可以独立运行,也可按照总表模式统一运行.编制“多民族语言档案主题词表”的关键任务是国家通用语言文字主题词向各少数民族语言主题词的映射,需要根据精确等义、部分等义、单词与多词等义、无等义词等情形,制定不同的语言映射规则.
-
-
赵生辉;
陈刚
-
-
摘要:
民族地区政务大厅多语言服务环境是指我国民族地区政府机关机为使用不同民族语言和具有不同语言文字应用能力的服务对象所特别设计的多语种信息辅助交流空间和动态协作服务体系.本文从信息生态学的视角,分析了民族地区政务大厅多语言信息生态系统的构成要素,构建了该系统的顶层架构模型并探讨了主要信息生态链多语言服务的实现方式,分析了构建多语言信息生态系统的四种基本策略.本文的研究结论有助于提高我国民族地区政务大厅公共服务创新,对我国各民族团结与交融的格局也将产生重要影响.
-
-
YUAN Man;
ZHANG Liwei;
PENG Wuzhuo
-
-
摘要:
为解决跨语言信息检索中多语言知识组织问题,根据本体术语学中概念具有独立于语言多样性的稳定性,不同语言或文化背景下的术语可表示同一个概念的核心观点,结合教育领域的需求,依据《教育主题词表》构建出支持多语言检索的标准化本体模型.将对术语的检索提升到概念层面,从而消除由不同语言相互转换所带来的歧义,很好地解决了教育领域跨语言语义信息检索问题.最后,利用Jena API实现对该本体的查询并构建出跨语种语义检索原型系统,结果证明了所提出的方案的可行性.
-
-
黄名选;
蒋曹清;
何冬蕾
-
-
摘要:
首先提出矩阵加权项集支持度计算方法,给出面向跨语言查询扩展的矩阵加权关联模式挖掘算法.然后提出基于矩阵加权关联规则挖掘的跨语言查询译后扩展算法.借助机器翻译进行首次跨语言检索,得到前列初检文档,并经用户相关性判断后得到相关反馈文档.通过计算支持度从相关反馈文档中挖掘含有原查询词的矩阵加权频繁项集,通过置信度-兴趣度评价框架从频繁项集中提取含有原查询词的关联规则,将规则的后件或前件作为扩展词,利用规则的置信度和兴趣度衡量扩展词的重要性,完成跨语言查询译后扩展.在NTCIR-5 CLIR标准测试集上的实验表明,文中算法可以有效提升跨语言查询扩展性能,有利于长查询的跨语言检索,译后后件扩展性能优于前件.
-
-
鲍玉来;
白淑霞;
飞龙;
王炜华
-
-
摘要:
[目的/意义]基于汉蒙间跨语言检索系统发展现状,设计并实现通过汉文、传统蒙古文关键词检索西里尔蒙古文文档的系统.[方法/过程]汉蒙跨语言检索系统包括机器翻译和文档检索.在机器翻译方面,实现了基于词典的汉文到西里尔蒙古文机器翻译,并实现了基于规则和统计的传统蒙古文到西里尔蒙古文转换;在文档检索方面,基于Lucene全文索引工具包对大量的西里尔蒙古文文档建立索引,并根据向量空间模型对查询和文档的相似度进行排序,得到与查询最为匹配的文档集.[结果/结论]本系统响应速度较快,准确率较高,达到可用水平.一方面促进中国与蒙古国之间的科技、文化、教育的交流;另一方面对我国西里尔蒙古文的研究有一定的促进作用.
-
-
-
-
-
- 《第四届全国信息检索与内容安全学术会议》
| 2008年
-
摘要:
目前的跨语言信息检索能够使用的方法有四种:查询词翻译的方法、文档翻译的方法、中间语言翻译方法和非翻译的方法.本文对这四种方法进行了简要介绍,提出它们的优缺点,并且提出了一种新的非翻译的方法——基于中间语义的方法.我们对提出来的方法进行了TREC跨语言语料库的试验,并且与单语言的信息检索模型进行了比较.试验证明我们的方法具有很好的性能和健壮性.
-
-
马路佳;
赵小兵;
赖文
- 《第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL 2018)》
| 2018年
-
摘要:
跨语言信息检索指用户以一种语言提问,检索出另一种或几种语言描述的信息资源的检索技术,是信息检索领域重要的研究方向之一.近年来,跨语言词向量为跨语言信息处理提供了良好的表示形式,受到很多学者的关注.该文利用跨语言词向量实现从汉文查询词到蒙古文查询词扩展和映射,并利用该文提出的串联式查询扩展、串联式查询扩展过滤、交叉验证过滤三种查询扩展方法在进行词向量映射时对候选的蒙古文查询词进行筛选和排序,选择符合上下文的蒙古文词语.实验结果表明:在蒙汉跨语言信息检索任务中引入交叉验证方法对检索结果有很大的提升.
-
-
LIU Weicheng;
刘伟成;
MISCHO William H.;
MISCHO William H.
- 《信息系统协会中国分会第七届学术年会》
| 2017年
-
摘要:
目的/意义:多语言翻译资源的缺乏是跨语言信息检索的主要障碍之一,随着社会化媒体和以用户为中心的网络模式的迅速发展,产生了大量用户自己创造的网络资源,本文旨在探讨社会化媒体在多语言翻译资源构建和跨语言信息检索中的应用.方法/过程:采用文献调查、比较研究、案例分析等方法,分别论述了社会化媒体在双语语料库、多语言词典、多语言本体和多语言大众分类系统等构建方面的应用,并基于维基百科的应用,开发了一个双语平行网页挖掘系统.结果/结论:无论是在理论上还是实践应用中,社会化媒体在跨语言信息检索和多语言翻译资源构建中均具有先进性;利用社会化媒体显著提高了自动构建多语言翻译资源的效率.
-
-
-
-