文字信息处理属于《中国图书分类法》中的六级类目,该分类相关的期刊文献有11370篇,会议文献有2086篇,学位文献有5388篇等,文字信息处理的主要作者有王志军、蔡东风、吕学强,文字信息处理的主要机构有新疆大学信息科学与工程学院、昆明理工大学信息工程与自动化学院、苏州大学计算机科学与技术学院等。
统计的文献类型来源于 期刊论文、 学位论文、 会议论文
1.[期刊]
摘要: 近年来,法律领域的智能化引起了学界的广泛关注。选取法律领域中十分重要的法律判决预测任务作为研究重点,法律判决预测包含推荐相关法条、定罪和刑期预测等三个子任务。...
2.[期刊]
摘要: 命名实体识别和关系抽取是自然语言处理和知识图谱构建中两个十分重要的子任务。针对关系抽取过程中容易出现的错误传递和实体共享的缺陷,提出了一种融合自注意力机制的实...
3.[期刊]
摘要: 针对HRRP识别研究中面临的噪声污染问题,提出了一种基于卷积自编码器(convolutional auto encoder,CAE)的HRRP识别方法。此方法...
4.[期刊]
摘要: 为全面实现歧义消解,对知识库自然语言中歧义字段自动识别系统设计。利用互信息进行歧义字段特征识别,采用正向与逆向相结合的提取方式,将字段特征集合描述为二维向量,...
5.[期刊]
摘要: 针对大数据时代的高维数据重复检测的去重问题,通过借助聚类的特性,采用一种聚类更为紧凑的NSKSA构建R-树,使空间索引结构更优,降低了访问空间节点的次数。采用...
6.[期刊]
摘要: 实体消歧作为知识库构建、信息检索等应用的重要支撑技术,在自然语言处理领域有着重要的作用。然而在短文本环境中,对实体的上下文特征进行建模的传统消歧方式很难提取到...
7.[期刊]
摘要: 为了达到节省船舶领域对比工作消耗的时间与人力资源成本,文中对常用的文本分类算法进行分析比较,有针对性地对分类算法做出在船舶领域的创新。改进传统特征提取算法(T...
8.[期刊]
摘要: 近几年,随着国内IT技术的迅猛发展,语音识别技术已经成为最热门的应用领域之一,广泛应用于金融、教育、医疗、车载、机器人等领域。因此本设计在STM32F7单片机...
9.[期刊]
摘要: 事件结构性语法特征与事件语义特征各有优势,二者融合利于准确表征事件触发词,进而有利于完成事件触发词抽取任务。现有的基于特征、基于结构及基于神经网络模型等的抽取...
10.[期刊]
摘要: 针对电机领域命名实体识别困难、精度不高的问题,提出了一种基于BERT和多窗口门控CNN的电机领域命名实体识别模型。该模型首先利用BERT预训练模型生成句子的字...
11.[期刊]
摘要: 针对车间生产物料有效流动与资源匹配问题,研究了供应物流资源快速准确配置方法。基于PFEP(Plan For Every Part)中大量产品已有的物流资源配置...
12.[期刊]
摘要: 招标领域中各单位对物料数据的书写方法各不相同,通过对物料数据的实体识别能够实现对物料数据的标准化,为后续的物料查询及分析提供基础。传统的物料命名实体识别方法存...
13.[期刊]
摘要: 边缘智能设备、网关和云端在智能协同计算的过程中,存在隐私泄露、计算能力有限等问题。提高联邦学习可以大大提高智能协同计算的训练效率,但也会暴露边缘智能终端的训练...
14.[期刊]
摘要: 针对传统深度文本聚类方法仅利用中间层的文本语义表示进行聚类,没有考虑到不同层次的神经网络学习到的不同文本语义表示以及中间层低维表示的特征稠密难以有效区分类簇的...
15.[期刊]
摘要: 由于中文文本缺少天然分隔符,中文嵌套命名实体识别(Chinese Nested Named Entity Recognition,CNNER)任务极具挑战性,...
16.[期刊]
摘要: 主题模型能够从海量文本数据中挖掘语义丰富的主题词,在文本分析的相关任务中发挥着重要作用。传统LDA主题模型在使用词袋模型表示文本时,无法建模词语之间的语义和序...
17.[期刊]
摘要: 在进行文本挖掘时,通常根据关键词分析文本,这种方式容易忽略词语之间的关联性,影响文本挖掘的准确性。TextRank算法是提取关键词或者摘要的主要方法,该算法基...
18.[期刊]
摘要: 以产科专业叙词表、临床路径和诊疗规范等为数据来源构建了中文产科知识图谱(Chinese obstetric knowledge graph,COKG)。以产科...
19.[期刊]
基于Word2vec和K-Means算法的勘探开发成果文档聚类研究
摘要: 根据渤海油田七年行动计划部署,现阶段勘探开发研究成果数量激增.目前,渤海油田勘探开发研究成果入库前分类工作主要依靠传统手动方式,效率低下且无法满足成果文档及时...
20.[期刊]
摘要: [目的/意义]在计算化学中,化学键能是重要的化学领域科学数据,目前化学键能数据抽取工作主要是由领域专家手动抽取,效率低下,大多数化学键能科学数据被湮没于海量文...
1.[会议]
摘要: 该文主要研究针对中文金融文本领域的命名实体识别.从汉字自身特点出发,设计了结合字形特征、迭代学习以及双向长短时记忆网络和条件随机场的神经网络模型.该模型完全端...
2.[会议]
摘要: 篇章分析是自然语言处理领域研究的热点和重点.作为篇章分析的任务之一,篇章主次关系研究篇章的主要和次要内容,从而更好地理解和把握篇章的核心内容.本文重点研究宏观...
3.[会议]
摘要: 动词语义角色一直是国内外语言学界研究的重点和难点.在自然语言处理领域,相关的语言资源也在逐步构建.于汉语而言,国内大部分工作集中在语义角色标注上.该文创造性地...
4.[会议]
摘要: 基于“编码-解码”结构的生成式对话模型所生成的回复多样性差、信息量少,这很大程度上阻碍了对话的进一步扩展和深入.而知识图谱作为一种高度结构化的知识,能够为对话...
5.[会议]
摘要: 中国古典诗歌是中国古典文学的代表之一,是中华传统文化的宝藏,源远流长.中国古典诗歌的研究是自然语言处理方向的一项重要且富有意义的工作.随着人工智能的发展,人工...
6.[会议]
摘要: 真实人类对话数据量不足已经成为限制数据驱动的对话生成系统性能提升的主要因素,尤其是汉语语料.为了获得丰富的日常会话语料,可以利用字幕时间戳信息把英语电视剧的英...
7.[会议]
摘要: 事件同指消解是自然语言处理中一个具有挑战性的任务,它在事件抽取、问答系统和阅读理解中有着重要的作用.针对事件的语义信息主要由触发词和论元表示这一个特点,本文将...
8.[会议]
摘要: 正确理解文本矛盾是自然语言理解的一项基础性问题.目前的研究大多针对矛盾识别任务,深入文本内部探究矛盾产生原因的工作较少,且缺乏专门的中文矛盾数据集.该文在前人...
9.[会议]
摘要: 该文提出了一种基于成对比较的众包标注方法,该方法可以通过非专业人士的简单判断获取标准统一的句子难度标注结果.基于该方法,构建了基于语文教材的汉语句子难度语料库...
10.[会议]
摘要: 汉语缺乏词形变化,语法信息需通过词语搭配关系获得,且在语言生活中词语通常在搭配中发挥交际作用.因此无论是在语言学本体,还是在自然语言处理的各项任务中,词语搭配...
11.[会议]
摘要: 词向量在自然语言处理研究的各个领域发挥着重要作用.该文从语言学角度出发,讨论了词向量技术与语言学理论的关系;根据词向量的特征,提出利用藏文词向量构建语义相似词...
12.[会议]
CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法
摘要: 由于汉语语义表达的多样性和复杂性,中文错别字自动纠正目前存在很多挑战.现有的错别字纠正算法的性能普遍不够理想,而且需要大量高质量的语料进行训练.本文提出一种基...
13.[会议]
摘要: 近年来,基于注意力(attention)机制的循环神经网络在文本分类中表现出显著的性能.然而,当训练集数据有限时,测试集数据中许多领域实体指称项在训练集中处于...
14.[会议]
摘要: 虚词具有丰富的语法意义,对句子理解起着不可或缺的作用.虚词的语言学研究成果丰富,但缺乏形式化表示,无法直接被计算机利用.为了表示虚词的句法语义信息,首先在抽象...
15.[会议]
摘要: 本文提出了一套精细化的中文词性标注评测体系.本文的工作重点在于确立其中的评测项目以及每个项目所对应的词例,提出了比对、归类、合取的方法;依此,本文初步建立了规...
16.[会议]
摘要: 构式作为组成成分与实际意义不能完全对应的结构,与常规句子差异较大,对句法和语义分析器的影响较大,构式的自动分析则更是困难.因此,需要研究构式的内部结构标注与语...
17.[会议]
摘要: 现代汉语构式成分自动标注作为文本自动标注任务之一,其最大的困难在于,当不存在标注语料作为训练数据时,如何从生语料中挖掘不同类型的构式成分相关的知识并进行标注,...
18.[会议]
摘要: 汉语未登录词的知识表示与预测,包括词性、构词结构、词义等项目,是计算语言学领域中的基础性问题.该文依据“平行周遍”原则,从现有的语义构词知识中提取“平行条件”...
19.[会议]
摘要: 该文收集了自晚清到21世纪间长达144年的连续历时报刊语料,通过统计分析和词语分布式表示两个方面展开研究,计算并辅助识别汉语词语的词义历时演变现象.采用TF-...
20.[会议]
摘要: 本文从网络视频资源的侵权识别问题出发,结合NER和XGBoost机器学习分类算法,提出了一种基于网络资源文本描述信息的侵权识别模型.
1.[学位]
摘要: 随着互联网、信息通讯以及其他人工智能技术的普及和发展,各种人机交互产品层出不穷。而基于人机对话的人机交互方式是一种与计算设备交流的新型方式,它被广泛用于日常工...
2.[学位]
摘要: 建议是自然语言处理中广泛存在的一种复杂语言现象,其中往往蕴含着丰富有用的信息。在文本中对建议进行挖掘,将其自动识别并抽取关键信息,极大提高了所获信息的价值。目...
3.[学位]
摘要: 新闻行业及短评文章需要大量标题型摘要,不仅对新闻编辑人才提出需求,还在很大程度上影响受众的用户体验,限制新闻媒体行业智能化发展。因此,标题摘要技术对于新闻媒体...
4.[学位]
摘要: 方面级情感分类旨在识别一个句子关于给定方面表达出来的情感极性,目前,实现该任务的主流方法之一是基于深度学习的方面级情感分类模型。本论文在对现有基于深度学习的方...
5.[学位]
摘要: 词的表示是自然语言处理中的基础任务之一,传统的词表示方法通常使用基于向量空间的独热表示,该方法虽然简单有效但是存在数据稀疏、无法获取词语之间的语义相关性等问题...
6.[学位]
摘要: 近年来,随着互联网的快速发展,信息呈爆炸式增长。现代人快节奏的生活催生了快速阅读。用户如何从大量的文本信息中更精准快捷地获取信息是信息学科研究的热点。自动摘要...
7.[学位]
摘要: 在一些应用场景下异常的偏离大多数数据的数据(异常点)被认为是有价值的信息,这些数据可以提供重要的价值,比如异常点检测技术已经广泛地应用在金融欺诈、医学辅助筛查...