特征词
特征词的相关文献在1990年到2022年内共计304篇,主要集中在自动化技术、计算机技术、汉语、语言学
等领域,其中期刊论文210篇、会议论文17篇、专利文献65267篇;相关期刊152种,包括青春岁月、情报杂志、嘉应学院学报等;
相关会议16种,包括中国计算机用户协会信息系统分会2012年第二十二届信息交流大会、第27次全国计算机安全学术交流会、全国第五次情报检索语言发展方向研讨会等;特征词的相关文献由585位作者贡献,包括黄名选、刘二中、商胜等。
特征词—发文量
专利文献>
论文:65267篇
占比:99.65%
总计:65494篇
特征词
-研究学者
- 黄名选
- 刘二中
- 商胜
- 赵红
- 陶晨
- 刘明绪
- 刘金岭
- 李如龙
- 杨晓红
- 樊孝忠
- 王彬
- 王春磊
- 贺鏇璇
- 邓擘
- 陈睿婷
- 马倩宜
- 于亮
- 余虎
- 刘云1
- 刘冰冰
- 刘建荣
- 刘晓梅
- 刘梦娟
- 刘玮
- 刘翔
- 史忠植
- 吴成龙
- 周步恋
- 周绪刚
- 周艳玲
- 姚飞
- 孟二利
- 孟园
- 宋燕燕
- 屠守中
- 岳威
- 岳小莉
- 岳翔
- 崔宪坤
- 康松林
- 张凌宇
- 张宇峰
- 张弛
- 张桂平
- 张贯虹
- 张郭强
- 徐小良
- 施荣华
- 曹存根
- 曹馨宇
-
-
张文轩
-
-
摘要:
方言是一种语言的地方变异形式,其中词汇的变化可谓日新月异。方言词语可作为共时方言词库中的一个组成部分。本文从《陇西方言词语汇释》中筛选出了162条词语,称其为“区别于兰州方言的陇西方言特征词”,审视陇西方言与兰州方言的共性和个性,得出“表示名物的词语变化最为明显,最能体现方言间的共时词汇差异”“兰州方言和陇西方言在语法层面来说,基本没有区别性,是一致的”的结论。
-
-
陶晨;
王晨露;
白琳琳;
金姝
-
-
摘要:
文化活力评估可为文化治理提供依据和反馈,从社会物理学视角进行文化活力的解析,形成文化活力的度量方案,并付诸实际应用.首先,利用类比推理法从物理学活力概念导出文化活力的表达式,将文化活力度量问题归结为对内在文化要素的解析;其次,在文化大数据中,从特征词抵达文化要素,通过词量统计和词流分析,计算要素体量和互动频率,从而量化表述文化活力;最后,将该方案应用于丝绸文化的评估,揭示了2011年至2020年十年间丝绸文化活力螺旋上升的轨迹并导出其结构治理路径.
-
-
马妍
-
-
摘要:
西安市近年来已成为各大网络平台上的网红城市,西安市旅发委正在修改完善《关于加快民宿发展的三年行动计划》,明确支持民宿业发展。本文从统计学角度出发,采用文本挖掘方法进一步分析数据,将评论特征作为民宿业评价指标体系的二级指标,整理得到相应4个一级指标,同时对特征词进行同义词合并,归纳得到相应的三级指标,创新了指标的选取来源,构建的民宿业评价指标体系更具合理性和完整性。
-
-
晏丞骁
-
-
摘要:
产品评论对产品制造商和潜在消费人群都具有很高的研究价值。除了了解产品评论外,产品制造商还需要获得对其竞争对手产品性能的评论。潜在消费者则可以通过现有评论获得购买建议。因此,研究产品评论特征词、观点词识别技术非常有必要。本文针对中文产品评论,利用自然语言处理(Natural Language Processing,NLP)技术对产品评论中的特征词和观点词进行识别和分析。
-
-
朱恒民;
钱莉;
杨欣谊;
魏静
-
-
摘要:
[研究目的]研究舆情话题的漂移路径,以期描述舆情事件发展过程中话题之间的来龙去脉。[研究方法]以“新冠肺炎”疫情事件为例,通过词特征分析得出从特征词的微观视角研究话题漂移的可行性;基于LDA话题模型对不同时间片中的微博文档进行话题抽取并结合词热度特征计算漂移概率,进而描绘出话题在时间片上的漂移路径。通过设计对比实验,验证方法的有效性。[研究结论]在话题漂移的过程中,尽管两个话题的内容有较大差异,但往往包含着一些相同的特征词,且共有特征词在不同话题上的热度呈现出不同的变化趋势。
-
-
马遂莲
-
-
摘要:
“方言词”和“方源词”的区分问题早在二十世纪八十年代就引起学界的关注,将二者区分开来实有必要。作为词汇学术语,应该满足术语的基本要求,即一个术语指称一个概念。“方言词”与“普通话词”是平行关系,二者一起构成现代汉语词汇;“方源词”与“普通话词”则是上下位关系,“方源词”是“普通话词”的组成部分。在明确“方言词”“方源词”所指内容的基础上,进一步论述了“方言词”的分布区域和“方源词”的来源区域。将相关术语予以明确并一致使用,对汉语词汇的教学和研究都不无裨益。
-
-
申雪
-
-
摘要:
山西临汾方言特征词“拦蒿”属于言说类动词,义域宽泛。从字源学角度对“拦蒿”一词进行形音义的探究,并通过共时层面的句法和语用研究,归纳出“拦蒿”的五个义项,其中“胡说”义为最常用义项。在各义项的对比研究中,探寻词义演变的路径,即“拦蒿”一词的感情色彩由贬义色彩延伸到了中性色彩。
-
-
简梓炜;
于娟
-
-
摘要:
[目的/意义]提出一种适用于德语文本处理的文本相似度计算方法,填补了国内外德语文本聚类研究的空缺。[方法/过程]通过词语提取和特征词选择将每个德语文本表示为一个特征词的集合,寻找集合间配对的特征词对,由特征词对的匹配度得到文本间的相似度。[结果/结论]基于多个德语数据集的实验结果表明,相比于已有方法,本文提出的基于特征词配对的德语文本聚类方法提升了约5%的NMI值和约6%的Purity值。基于特征词配对的相似度计算方法能够保留更多的文本信息,从而进一步提升德语文本聚类的性能。
-
-
陶晨;
白琳琳;
金姝;
杨剑平
-
-
摘要:
丝绸文化是浙江地区优秀传统文化的典型代表,"一带一路"倡议的推行赋予丝绸文化新的时代内涵,探究丝绸文化在新时代背景下的演变与进化,是优秀传统文化自我扬弃的内在要求.本研究利用主题爬虫技术从互联网采集形成丝绸文化的大数据,对文本大数据进行分词和过滤得到特征词序列,对特征词进行评估和归类得到物质型、社会型和精神型三类文化特征,对特征词词频进行计算与汇总得到文化特征的频率分布.通过近十年间丝绸文化特征分布模式的变化,折射了丝绸文化内部秩序与结构的重组,通过各类文化特征在近十年中比重的变化,透视了文化形态主导方式的转变.本文以大数据实证方式,从宏观上呈现了"一带一路"倡议影响下丝绸文化的结构重组和形态跃迁,可为浙江文化治理与决策提供参考.
-
-
张亦芳;
李立;
刘光帅
-
-
摘要:
为解决目前点云精简算法适应性差的问题,提出一种基于特征显著性的自适应精简算法.通过对点云FPFH(fast point feature histograms)特征聚类生成特征单词;在考虑单词间差异的基础上,融合单词内部的特征分散程度,形成显著性词典,由词典软编码单点特征,得到点云特征显著性;在均匀网格基础上,若网格内的特征显著性越强,则配置越高的采样率,由此实现点云的自适应精简.实验结果表明,所提算法能够区分出点云中的特征明显区域,在精简不同尺寸、形状点云时具有适应性.
-
-
ZHOU Jing;
周静;
HUANG Dupei;
黄都培;
YANG Xiaoping;
杨小平;
ZHU Jianlin;
朱建林;
LI Yao;
李尧
- 《中国计算机用户协会信息系统分会2012年第二十二届信息交流大会》
| 2012年
-
摘要:
在现实生活中,常常遇到一些法律问题,如何从对法律事件的文字描述,自动地找到与之对应的相关法律条款是一个既实用又复杂的问题.为了解决这一问题,设计了一种基于特征词的法律文本法条分类方法.首先以法律判决文书为训练语料,建立法条与特征词之间的对应关系;因为判决文书中能准确地抽取出相关的法条,又可以通过TF-IDF等方式计算出文书的特征词,所以很容易建立法条与特征词间的对应关系.然后,设计了一种基于特征词的法律文本法条分类算法,该算法可以将多种法律文本(以法律新闻为例)抽取特征词后,经过计算分类到与之对应的法条.实验表明,该算法对法律文本的法条分类效果良好.
-
-
-
-
刘俐李
- 《首届海外汉语方言国际研讨会》
| 2008年
-
摘要:
东干族是清朝末年陕甘回族起义者移居现址的后裔,主要分布于吉尔吉斯斯坦、哈萨克斯坦和乌兹别克斯坦。东干语有两个分支:陕西支和甘肃支。陕西籍东干族多聚居于哈萨克斯坦,其中江布尔州的新渠和营盘是最大的两个村,两村东于族人口均近万,分别占各村总人口的95%和89%。2005年6月,初步调查了这两个村来中国求学的留学生。2006年7月又前往新渠和营盘,住在当地农民家里进行了实地系列调查。本文讨论东干语陕西支(下文简称“东干语”)特征词的年龄分布和衰变理论。东干语陕西支源自130年前的陕西关中话。130年来,东干语远离“母方言”,在与汉语“绝缘”的环境中独自发展。其语言系统的变化是关注的焦点。特征词是方言独有词汇,反映方言的个性,最先被列人考察重点。分20岁、40岁、50岁、60岁和70岁5个年龄段考查,每一年龄段间隔大体10岁。只有40岁和20岁间隔20岁,因为这几个年龄段的差异不大。调查词表选用关中话特征词,其中一级特征词107个,二级特征词141个,合计248个。一级特征词是关中话独有词汇(含个别熟语类短语),二级特征词是关中话与周边方言共有而普通话没有的词汇,二者均含个别熟语类短语。
-
-
- 《第四届全国信息检索与内容安全学术会议》
| 2008年
-
摘要:
网络查询分类对提高搜索引擎的搜索质量有重要的意义.本文通过真实用户查询日志的分析和标注,发现四种特征词(称之为"VASE"特征词)对查询分类起决定性作用.我们提取特征词并构造了一个特征词倒排索引,用于对查询进行主题分类.在此基础之上,提出了基于网络扩展和加权特征词的方法改善分类的效果.实验结果显示,基于此分类方法的正确率和召回率分别达到78.2%和77.3%.
-
-
-
于凤;
郑德权;
哈尔滨工业大学;
赵铁军;
李生
- 《第十六届中国神经网络大会(CNNC2006)暨首届中国人工免疫系统专题会议(CAISC06)》
| 2006年
-
摘要:
提出一种基于上下文多元信息实现文档相似度计算的方法,该方法首先抽取文档的特征词,对具有相同(或相近)意义特征词的文档,分别获得特征词在上下文中同现词的词性、语义信息、位置关系、平均同现概率等多元信息,以量化形式描述成一个相似函数;然后分别从两两文档的相似函数中得到文档的相似度评价值,作为衡量文档相似程度的重要依据.利用该评价方法,使用NTCIR-3中的跨语言信息检索数据集中的中文文档,对初始检索文档的顺序重新排列,实验结果表明,该方法分别将前10个最佳召回文档和前100个最佳召回文档的平均精确度提高了15.45%~18.49%和11.96%~15.35%在另一组有关相同网页信息的实验中,几组不同类别文档相似度F1-measure平均值均在95%以上。
-
-
彭渊;
赵铁军;
郑德权;
于浩
- 《全国第八届计算语言学联合学术会议》
| 2005年
-
摘要:
去除重复网页一直是信息检索领域的一个待解决的问题.本文基于双语文章的内容,提出了一种抽取特征词和特征句,判别跨语言重复网页的方法.并将其运用到了跨语言的重复网页的识别上.实验结果表明:该方法对双语重复网页的识别准确率在86%以上,对单语重复网页的识别准确率在97.5%以上,达到了实用的程度,同时,该方法对于双语平行语料的自动挖掘也有一定的帮助.
-
-