自然语言
自然语言的相关文献在1979年到2023年内共计3329篇,主要集中在自动化技术、计算机技术、信息与知识传播、语言学
等领域,其中期刊论文1457篇、会议论文87篇、专利文献25929篇;相关期刊829种,包括江汉论坛、情报理论与实践、情报杂志等;
相关会议80种,包括CCF2014-2015中国计算机科学技术发展报告会、中国商业会计学会2014年学术年会、第三届信息化创新克拉玛依国际学术论坛等;自然语言的相关文献由5877位作者贡献,包括戴帅湘、张国峰、袁志伟等。
自然语言—发文量
专利文献>
论文:25929篇
占比:94.38%
总计:27473篇
自然语言
-研究学者
- 戴帅湘
- 张国峰
- 袁志伟
- 陈刚
- 张琨
- 李俊
- 邹崇理
- 陈恩红
- 龙毅
- M·肯尼威克
- R·萨里卡亚
- 不公告发明人
- 刘淇
- 吕广奕
- 吴乐
- 温丽芳
- 黄伟才
- P·迪克里斯托
- 冯志伟
- 向凌云
- 张传锋
- 张琪玉
- 张翎
- 杨林
- 王楠
- 陈珂
- 黄亚东
- L·E·阿姆斯特隆
- T·弗里曼
- 任文捷
- 侯汉清
- 刘宇鹏
- 刘武
- 刘海涛
- 孙久文
- 孙文彦
- 张勇
- 张贺
- 朱华玲
- 李国华
- 李晋
- 李鹏华
- 李龙飞
- 梁家卿
- 王巍
- 王建新
- 王振宇
- 王欣
- 王江
- 王野翊
-
-
魏剑;
张海洋
-
-
摘要:
人类的自然语言几乎都是民族语言,语言与民族有着密不可分的联系,从语言的“万花筒”中能够看到民族的各方面特点。民族学家看语言,往往会超越语言的内部结构,从人类学、社会学等角度关注语言生活。本期跨界谈邀请了3位民族学者,向读者奉献他们关于语言的思考。
-
-
兰红;
陈子怡;
刘秦邑
-
-
摘要:
为方便非专业用户修图,提出一种基于Transformer的图像编辑模型TMGAN,使用户可通过自然语言描述自动修改图像属性。TMGAN整体框架采用生成对抗网络,生成器采用Transformer编码器结构提取全局上下文信息,解决生成图像不够真实的问题;判别器包含基于Transformer的多尺度判别器和词级判别器两部分,给生成器细粒度的反馈,生成符合文本描述的目标图像且保留原始图像中与文本描述无关的内容。实验表明,该模型在CUB Bird数据集上,IS(inception score)、FID(Fréchet inception distance)以及MP(manipulation precision)度量指标分别达到了9.07、8.64和0.081。提出的TMGAN模型对比现有模型效果更好,生成图像既满足了给定文本的属性要求又具有高语义性。
-
-
黄思远;
赵宇海;
梁燚铭
-
-
摘要:
源代码检索任务是指将自然语言作为查询语句,从代码库中搜索相关代码片段。在代码检索任务中,大多数代码检索算法只考虑代码片段的文本序列信息而未考虑代码的结构信息,导致不能充分捕获代码片段包含的语义和语法信息。为了提高对程序语言的理解,提出了注意力机制和图嵌入相结合的代码检索算法(GraphCS)。在特征提取部分,以LSTM提取文本特征向量表示,以Graph2Vec提取图的向量特征表示。在特征融合部分中引入注意力机制,更好地为每一个特征分配相应的权重,从而提升程序的理解。考虑源代码和自然语言为异构数据,将代码片段特征和自然语言特征映射到同一个向量空间,以排名损失来保证语义相似的点在特征空间拥有较近的距离。为了验证算法的高效性,与目前最好的算法CODEnn进行对比。实验结果表明,在Precision@1/5/10、SuccessRate@1/5/10以及MRR上均有一定的提升。
-
-
赵晶晶
-
-
摘要:
1音乐歌词中的听觉审美和水文化的应用,众所周知,音乐的审美是一种精神的心理表达。而音乐歌词在音乐的审美中发挥了重要的作用。如果说,音乐旋律是精神的表达,那么歌词就是内心语言的表达。两者在音乐的听觉审美中相辅相成。随着时代的发展,水元素在音乐中的应用越来越频繁。如果说音乐歌词是人类语言,那么水元素就是自然语言。“高山流水觅知音”,《高山流水》这首乐曲,在自然流水的辅助下,变得更具有静雅的魅力。水元素在这首曲子中就是一种自然语言,更是一种作者心境的表达。
-
-
刘钝
-
-
摘要:
语言与数学密不可分。任何自然语言都有关于数的词语,有各自的进位系统;而且,数学作为一切科学的基础(达尔文语),定义精准,推理严密,对语言表述(尤其是学术语言)和思维有深刻的影响。本期专栏邀请了4位数学史家,从不同的角度讨论数学与语言的关系。
-
-
李白咏
-
-
摘要:
基于人工智能(AI)的聊天机器人是计算科学领域一个重要的应用方向,有望帮助用户更高效地获取并处理互联网上的海量信息。此类应用的开发目前尚处于初级阶段,还无法通过自然语言与人类正常、高效地沟通交流。美国知名媒体《连线》(Wired)近期在其网站发布了一篇题为“谷歌计划阻止其AI说脏话粗话”(Google Has a Plan to Stop Its New AI From Being Dirty and Rude)的文章,给这一问题提供了一个前沿的视角。如果能够找到“驯服”AI聊天机器人的方法,未来人类或许可以通过机器人来高效地“阅读”整个互联网并规划自己的行动。
-
-
林婧雯;
李建敦;
王赢胜;
丁嘉华;
罗啸驰
-
-
摘要:
在线商品评论是促进电子商务健康发展的重要内容,然而虚假评论的存在严重扰乱了公平、公正的市场竞争秩序。因此,评论的真伪鉴别是亟需解决的重要问题。本文在采集含标签评论集的基础上,通过文本嵌入进行特征提取,训练了一个长短期记忆神经网络模型。测试结果显示,此分类器能够有效地识别虚假评论。
-
-
刘尚武
-
-
摘要:
文章将通过对新媒体传播模式形成的分析,对新媒体传播技术以及发展形势两部分内容展开深入性探讨,通过对新媒体传播技术形式与特点的研究,为新媒体传播今后的发展策略提供一些建议,旨在提升新媒体传播技术应用效果,推动新媒体传播稳定性发展。
-
-
戴益斌
-
-
摘要:
人工智能是否会成为类人的行动者?从语言理解的角度出发,答案是否定的。虽然人工智能语音产品大多都能体现出语音识别和语言对话的能力,但这并不意味着人工智能可以理解自然语言。第一,人工智能对符号的处理无法使符号具备语义和涵义内容,因而无法理解自然语言的语义层和涵义层。第二,在交流过程中,人工智能无法理解说话者的意图。基于唐纳德·戴维森和查尔斯·泰勒对语言的分析,人工智能不能理解语言会导致一个重要推论,即人工智能无论如何也不会成为类人的行动者。
-
-
杨伟;
张献敏
-
-
摘要:
2022年4月,《义务教育信息科技课程标准(2022年版)》颁布,其在“身边的算法”和“过程与控制”内容中的要求是:“学生能熟悉一些常用的算法描述风格与方式,理解算法执行的流程;能利用自然语言、流程图等方式,描述求解简单问题的算法,并对算法的正确性和执行效率进行讨论和辨析。”
-
-
Lu Liu;
刘璐;
Shiya Peng;
彭诗雅;
Chen Yu;
玉郴;
Dong Yu;
于东
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》
| 2018年
-
摘要:
自然语言中包含很多显式命题,正确理解这些命题是理解文本信息的关键.正确识别显式命题并解析其中的关键成分有助于理清语言中的逻辑关系、辅助自然语言理解.该文基于百度百科数据构建了自然语言显式命题标注数据集,并提出两个研究任务:自然语言显式命题自动识别和命题关键成分解析.其中,显式命题自动识别任务判断一个自然语言句子是否是命题;命题解析任务从已获取的命题中解析出支撑该命题成立的重要成分.针对任务一,构建基于BERT的二分类模型;针对任务二,构建基于BERT-BiLSTM-CRF的序列标注模型.实验结果表明,模型在任务一的正确率达到74.90%,超过基线模型15.25%;在任务二的F值达到90.74%,超过基线模型17.69%.该文为下一步研究提供了可靠的标注数据集和基线方法.
-
-
-
SUN Fan;
孙凡
- 《中国商业会计学会2014年学术年会》
| 2014年
-
摘要:
出于提高XBRL技术品质、拓展XBRL应用范围的目的,提出了面向自然语言扩展XBRL技术体系结构的研究课题,介绍了国内外的研究动态,分析了开展该项课题研究的转换生成语言学基本理论、生成语义学理论、格语法理论等理论基础,指出了研究所需解决自然语言的语法形式化标记方法,自然语言的语义形式化标记方法等关键问题,预期了研究成果将服务于XBRL的软件开发商和会计信息化或者计算机应用的教学与科研。
-
-
朱平
- 《第三届信息化创新克拉玛依国际学术论坛》
| 2014年
-
摘要:
数据问题是智慧城市建设过程中的基础性问题.熊璋教授提出的"数据活化"理论描述了对数据的一致性处理思想,就是针对这一基础问题的解决;本文讨论的自然语言数据访问方式问题是在活化思想基础上的数据应用形式的研究.本文提出了自然语言数据访问命令提取的语义模型,并给出了标准受限搜索语言的形式化描述.提出了针对语义模型的知识库建设方法、自然语言与形式化描述的映射、和SQL生成算法.最后,给出结论和下一步的工作设想.
-
-
杨柏洁;
贾积有;
王忠贤;
王迪
- 《第十七届全球华人计算机教育应用大会(GCCCE2013)》
| 2013年
-
摘要:
在学科教学中,一个具有自然语言理解能力的基于自动推理的专家系统可以减轻教师的工作负担,并为学生学习提供及时而恰当的反馈.本文针对一门文学课程的内容,设计了一个基于国际互联网的专家系统“武侠人物猜猜猜”.该系统综合运用了自然语言理解和知识工程的最新研究成果,包括:Prolog推理机、ICTCLAS汉语分词系统和Stanford Parser语法解析系统.其特色在于学生可以使用汉语自然语言的形式向系统提问,系统同样可以使用自然语言的形式回答学生的问题.
-
-
-
CCF中文信息技术专委会
- 《CCF2014-2015中国计算机科学技术发展报告会》
| 2015年
-
摘要:
期待未来有一天计算机能够像人类一样会写作,能够撰写出高质量的自然语言文本.文本自动生成就是实现这一目的的关键技术.按照不同的输入划分,文本自动生成可包括文本到文本的生成、意义到文本的生成、数据到文本的生成以及图像到文本的生成等.上述每项技术均极具挑战性,在自然语言处理与人工智能领域均有相当多的前沿研究,近几年业界也产生了若干具有国际影响力的成果与应用.本文对上述前沿技术的国内外研究现状进行了全面总结,并对发展趋势进行了展望.
-
-
WU ZHENHUA;
吴振华;
YU LEI;
余雷;
MA WENJING;
马文静;
LONG GUOPING;
龙国平;
LI YUCHENG;
李玉成
- 《2014全国高性能计算学术年会》
| 2014年
-
摘要:
在用机器学习方法解决自然语言处理领域的问题,将词或符号表示成向量是一项基本工作.Google的开源工具word2vec利用深度学习模型得到的分布式词向量,能粗略表示词与词之间的距离,甚至词与词之间的向量运算能与语义对应,是近年来获得词向量的主流方法.在GPU上训练得到词向量,实现了CBOW和Skip_gram两种模型,每种模型又包含了层次Softmax和负取样两种算法.其中在层次Softmax算法中使用了满二叉树代替哈夫曼树,在GPU上更容易实现;对线程的配置和学习速率等一些参数巧妙地设置能提高效率和词向量的质量.在NVIDIA TeslaC2050的GPU上,相对于CPU单线程获得了14-28倍的加速比,相对于CPU多线程获得了2-7倍的加速比,而且词向量的精度要略高于CPU得到的词向量精度.
-
-