中文信息处理
中文信息处理的相关文献在1982年到2022年内共计1628篇,主要集中在自动化技术、计算机技术、汉语、语言学
等领域,其中期刊论文1463篇、会议论文160篇、专利文献1331059篇;相关期刊380种,包括现代图书情报技术、计算机工程、计算机工程与设计等;
相关会议70种,包括第五届全国青年计算语言学研讨会(YWCL 2010)、中国中文信息学会成立二十七周年学术会议(CIPS2008)、第九届全国计算语言学学术会议等;中文信息处理的相关文献由2167位作者贡献,包括刘挺、吴健、徐波等。
中文信息处理—发文量
专利文献>
论文:1331059篇
占比:99.88%
总计:1332682篇
中文信息处理
-研究学者
- 刘挺
- 吴健
- 徐波
- 孙茂松
- 俞士汶
- 郑家恒
- 马少平
- 孙乐
- 孙玉芳
- 张敏
- 朱巧明
- 李生
- 林鸿飞
- 王仁华
- 王斌
- 程学旗
- 陈小荷
- 刘汇丹
- 许嘉璐
- 黄萱菁
- 周国栋
- 周强
- 李培峰
- 许洪波
- 刘奕群
- 吴立德
- 张宇
- 张普
- 李斌
- 王永成
- 黄德根
- 何婷婷
- 刘群
- 朱靖波
- 蔡东风
- 赵军
- 车万翔
- 钱培德
- 陈群秀
- 于浩
- 冯志伟
- 吴云芳
- 由丽萍
- 胡郁
- 袁毓林
- (Missing)
- 亢世勇
- 冯元勇
- 吾守尔·斯拉木
- 施水才
-
-
-
-
-
摘要:
为调动我国从事中文信息处理技术研究的专家和学者的积极性,推动信息产业的发展,根据《钱伟长中文信息处理科学技术奖奖励条例》,现开展2022年度“钱伟长中文信息处理科学技术奖”(以下简称学会科学技术奖)评审奖励工作。
-
-
-
林青霞
-
-
摘要:
根据菲律宾华裔青少年的特点,研究中文信息处理的内容,设计相应的《中文信息处理》课程。通过教学内容的创新和教学模式的改革,结合学校的实验环境,对其实验课程进行了一系列教学改革和实践探索,取得较好的教学质量提升。
-
-
金彦亮;
谢晋飞;
吴迪嘉
-
-
摘要:
中文命名实体识别在中文信息处理中扮演着重要的角色.在中文信息文本中,许多命名实体内部包含着嵌套实体.然而,已有研究大多聚焦在非嵌套实体识别,无法充分捕获嵌套实体之间的边界信息.采用分层标注方式进行嵌套命名实体识别(nested named entity recognition,NNER),将每层的实体识别解析为一个单独的任务,并通过Gate过滤机制来促进层级之间的信息交换.利用公开的1998年《人民日报》NNER语料进行了多组实验,验证了模型的有效性.实验结果表明,在不使用外部资源词典信息的情况下,该方法在《人民日报》数据集上的F1值达到了91.41%,有效提高了中文嵌套命名实体识别的效果.
-
-
吴珍梅
-
-
摘要:
汉字是一种文字,更是一门灵动的艺术。它是中国文明的核心释放和中华文化的独特符号。汉字之美,不仅能够使人耳目一新而获得精神愉悦,更可以给人以美的熏陶而催发其蓬勃向上。因此,正确书写规范汉字,不仅对日常书写、中文信息处理有着至关重要的作用,而且对中华文化的精准传承将产生极其深远的影响。
-
-
陆俭明
-
-
摘要:
人工智能可以分为两大类:一类跟自然语言无关,如电脑下围棋、飞机无人驾驶等;另一类跟语言有关,突出的如机器翻译,还有如“聊天机器人”。以汉语为处理对象的自然语言处理即“中文信息处理”,无疑应为后一类人工智能所需要。我们从事语言研究的人更痴心地以为语言学会在人工智能研究中派上用场。然而,当今基于人工神经网络的“机器深度学习”的人工智能研究,与语言学不是结合得更加紧密,而是越来越疏远了。
-
-
姚睿琦;
张辉;
姚云洪
-
-
摘要:
[目的/意义]探讨运用社会网络分析方法研究小说中的人物影响力和关系变化特征,分析小说的写作意图与写作特点.[方法/过程]以金庸小说《射雕英雄传》和《神雕侠侣》为研究对象,基于中文信息处理与社会网络分析法,抽取小说中的人物关系网络,通过社区探测、k-核分解、中心性分析研究小说人物的重要程度,通过时间演化和人物关系网络结构测度分析人物影响力的演变.[结果/结论]人物关系网络具有"小世界效应",人物影响力与亲密关系的变化规律显著,能够揭示作者的写作风格.
-
-
无;
刘奕群;
王小川;
张敏;
陈炜鹏;
马少平;
许静芳;
毛佳昕;
王蟒;
马为
-
-
摘要:
随着互联网信息爆炸增长,搜索引擎已成为最重要的互联网应用之一,关系到社会信息处理水平与利用效率;当前绝大部分国家的搜索服务被跨国巨头垄断,拥有自主可控的搜索技术对国家信息安全意义重大。2006年至今,清华大学与搜狗公司通过紧密的校企合作建设了搜狗搜索引擎,致力于提供性能突出、自主可控、内容可信的搜索服务。
-
-
-
陈然
- 《第十三届现代数学和力学学术会议(MMM-XIII)暨钱伟长诞辰100周年纪念大会》
| 2012年
-
摘要:
钱伟长是促进中文信息处理发展和汉字电脑化、汉字现代化的先行者之一.他始终认为中文信息处理的现代化对中华民族教育和科学技术的振兴具有重要意义.推进汉字现代化研究和中文信息处理,"主要是为了弘扬我们汉字的无穷威力,为21世纪中华民族能在世界民族之林得到我们应有的地位."本文通过文献调研,阐述了钱伟长在中文信息处理发展进程中所做出的贡献,并指出钱伟长的科学精神是他在中文信息处理处理领域中作出突出贡献的法宝.
-
-
-
王晓明
- 《第七届全国语言文字应用学术研讨会》
| 2011年
-
摘要:
语言文字是信息的主要载体和处理对象,而汉字是中文信息的主要载体和处理对象.为了迎接信息时代的到来,我国台湾地区也开始思考语言文字工作的新思路.为迎接信息时代的到来,迎合信息时代的新特点,台湾打破了部门界限,对整个信息化工作做了全面的统筹规划,形成了产、学、研、政一体化的新的运作模式。由于组织结构完善,分工明确,避免了工作上的相互交叉、推诱及重复性劳动造成的浪费,从而确保了资金的合理运用,提高了工作效率,台湾在文字的搜集与整理,乃至整个中文信息处理工作上都取得了丰厚的成果。更重要的是:确保了各项成果的协调一致性,避免造成不必要的混乱。
-
-
汪梦翔;
饶琪;
顾澄;
王厚峰
- 《第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会》
| 2017年
-
摘要:
隐喻知识的表示和获取是进行隐喻计算的基础.本文把隐喻知识看做是本体和喻体的特征和属性之间的关联.我们主要通过惯用语导入和句法模式识别两种机制,来获取名词的隐喻知识.惯用语的隐喻比较固定和单一,我们从专门的词典释义中就能获取准确的隐喻特征和属性.而一般名词的隐喻知识比较复杂,我们主要依托语料库和搜索引擎,通过关键词和句法匹配来获取同一名词不同的隐喻特征及对应属性.该项工作的结果,对于隐喻句隐喻意义的获取和名词语义属性特征的描述体系具有一定的价值.
-
-
汪梦翔;
饶琪;
顾澄;
王厚峰
- 《第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会》
| 2017年
-
摘要:
隐喻知识的表示和获取是进行隐喻计算的基础.本文把隐喻知识看做是本体和喻体的特征和属性之间的关联.我们主要通过惯用语导入和句法模式识别两种机制,来获取名词的隐喻知识.惯用语的隐喻比较固定和单一,我们从专门的词典释义中就能获取准确的隐喻特征和属性.而一般名词的隐喻知识比较复杂,我们主要依托语料库和搜索引擎,通过关键词和句法匹配来获取同一名词不同的隐喻特征及对应属性.该项工作的结果,对于隐喻句隐喻意义的获取和名词语义属性特征的描述体系具有一定的价值.
-
-
汪梦翔;
饶琪;
顾澄;
王厚峰
- 《第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会》
| 2017年
-
摘要:
隐喻知识的表示和获取是进行隐喻计算的基础.本文把隐喻知识看做是本体和喻体的特征和属性之间的关联.我们主要通过惯用语导入和句法模式识别两种机制,来获取名词的隐喻知识.惯用语的隐喻比较固定和单一,我们从专门的词典释义中就能获取准确的隐喻特征和属性.而一般名词的隐喻知识比较复杂,我们主要依托语料库和搜索引擎,通过关键词和句法匹配来获取同一名词不同的隐喻特征及对应属性.该项工作的结果,对于隐喻句隐喻意义的获取和名词语义属性特征的描述体系具有一定的价值.
-
-
汪梦翔;
饶琪;
顾澄;
王厚峰
- 《第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会》
| 2017年
-
摘要:
隐喻知识的表示和获取是进行隐喻计算的基础.本文把隐喻知识看做是本体和喻体的特征和属性之间的关联.我们主要通过惯用语导入和句法模式识别两种机制,来获取名词的隐喻知识.惯用语的隐喻比较固定和单一,我们从专门的词典释义中就能获取准确的隐喻特征和属性.而一般名词的隐喻知识比较复杂,我们主要依托语料库和搜索引擎,通过关键词和句法匹配来获取同一名词不同的隐喻特征及对应属性.该项工作的结果,对于隐喻句隐喻意义的获取和名词语义属性特征的描述体系具有一定的价值.
-
-
YU Jiang-de;
于江德;
HU Shun-yi;
胡顺义;
YU Zheng-tao;
余正涛
- 《中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)》
| 2015年
-
摘要:
针对汉语词法分析中分词、词性标注、命名实体识别三项子任务分步处理时多类信息难以整合利用,且错误向上传递放大的不足,提出一种三位一体字标注的汉语词法分析方法,该方法将汉语词法分析过程看作字序列的标注过程,将每个字的词位、词性、命名实体三类信息融合到该字的标记中,采用最大熵模型经过一次标注实现汉语词法分析的三项任务.并在Bakeoff2007的PKU语料上进行了封闭测试,通过对该方法和传统分步处理的分词、词性标注、命名实体识别的性能进行大量对比实验,结果表明,三位一体字标注方法的分词、词性标注、命名实体识别的性能都有不同程度的提升,汉语分词的F值达到了96.4%,词性标注的标注精度达到了95.3%,命名实体识别的F值达到了90.3%,这说明三位一体字标注的汉语词法分析性能更优.
-
-
YU Jiang-de;
于江德;
HU Shun-yi;
胡顺义;
YU Zheng-tao;
余正涛
- 《中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)》
| 2015年
-
摘要:
针对汉语词法分析中分词、词性标注、命名实体识别三项子任务分步处理时多类信息难以整合利用,且错误向上传递放大的不足,提出一种三位一体字标注的汉语词法分析方法,该方法将汉语词法分析过程看作字序列的标注过程,将每个字的词位、词性、命名实体三类信息融合到该字的标记中,采用最大熵模型经过一次标注实现汉语词法分析的三项任务.并在Bakeoff2007的PKU语料上进行了封闭测试,通过对该方法和传统分步处理的分词、词性标注、命名实体识别的性能进行大量对比实验,结果表明,三位一体字标注方法的分词、词性标注、命名实体识别的性能都有不同程度的提升,汉语分词的F值达到了96.4%,词性标注的标注精度达到了95.3%,命名实体识别的F值达到了90.3%,这说明三位一体字标注的汉语词法分析性能更优.
-
-
YU Jiang-de;
于江德;
HU Shun-yi;
胡顺义;
YU Zheng-tao;
余正涛
- 《中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)》
| 2015年
-
摘要:
针对汉语词法分析中分词、词性标注、命名实体识别三项子任务分步处理时多类信息难以整合利用,且错误向上传递放大的不足,提出一种三位一体字标注的汉语词法分析方法,该方法将汉语词法分析过程看作字序列的标注过程,将每个字的词位、词性、命名实体三类信息融合到该字的标记中,采用最大熵模型经过一次标注实现汉语词法分析的三项任务.并在Bakeoff2007的PKU语料上进行了封闭测试,通过对该方法和传统分步处理的分词、词性标注、命名实体识别的性能进行大量对比实验,结果表明,三位一体字标注方法的分词、词性标注、命名实体识别的性能都有不同程度的提升,汉语分词的F值达到了96.4%,词性标注的标注精度达到了95.3%,命名实体识别的F值达到了90.3%,这说明三位一体字标注的汉语词法分析性能更优.
-
-
-
-
-
-
-
-
-
-
- 刘君度
- 陈昌英
- 刘冰彬
- 公开公告日期:2001-04-11
-
摘要:
本发明是一种可用于移动通讯领域的中文信息处理汉字数字化编码技术。该方法提供了一种新颖的汉字数字化规范编码输入技术。它基于人们已有的知识储备,将国标GB2312-80的一、二级汉字及数万条词汇按声、形两部分进行数字编码,通过科学地选取基本码元和有规律的组合,使所需的记忆量降到最低限度。在进一步扩充字词库容量的基础上,降低重码率、减少击键次数,有效地解决移动通讯设备汉字、词汇以及整句输入困难的问题,给人们提供一种可用于数字键盘的既规范、又简易便捷、能即学即用的汉字数字化编码快速输入技术。
-