词频统计
词频统计的相关文献在1985年到2022年内共计327篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究
等领域,其中期刊论文307篇、会议论文14篇、专利文献16926篇;相关期刊230种,包括农业图书情报学刊、情报探索、情报学报等;
相关会议14种,包括中华中医药学会第五次科技成果峰会暨2015年度科技成果、优秀人才奖励大会、第四届两岸华文教师论坛、第四届中国计算机网络与信息安全学术会议(CCNIS2011)等;词频统计的相关文献由534位作者贡献,包括汤建民、余丰民、刘浩等。
词频统计—发文量
专利文献>
论文:16926篇
占比:98.14%
总计:17247篇
词频统计
-研究学者
- 汤建民
- 余丰民
- 刘浩
- 宋燕燕
- 张林
- 朱一红
- 杨建林
- 袁良平
- 万理
- 任国盛
- 冯微峰
- 刘子夜
- 刘尚莲
- 刘晓波
- 吉日木图
- 吕坤
- 吴林芝
- 周春林
- 张得旭
- 张忠友
- 张情韵
- 张新兴
- 张欣
- 张琪佩
- 张皓
- 张红燕
- 张艳
- 张英杰
- 张超峰
- 彭婧
- 曹芳东
- 朱小娟
- 朱明
- 杨波
- 梁晓华
- 王丽培
- 王晓宁
- 王景安
- 王梅
- 王湘龙
- 王铭玉
- 田时中
- 程玲
- 罗燕
- 胡昌振
- 胡晓勤
- 苏小波
- 苏海峰
- 苗向阳
- 荀雪莲
-
-
郝凤霞;
吴赟
-
-
摘要:
现阶段我国各地方人才政策的竞争有愈演愈烈之势,这一现象是否会与区域协调发展战略产生矛盾成为亟待回答的问题。为此,分别构建理论模型和实证模型,结合机器学习和词频统计方法测度人才政策力度,检验地区间人才政策力度差异对人力资本结构差距的影响。研究发现,随着人才政策力度不断加强,高、低收入地区之间的人力资本结构差距将呈现先缩小后扩大的U型曲线,且政策影响时滞为两年。另据测算,当前人才政策力度差异导致人力资本结构差距扩大的现象主要发生在四大板块中的东部地区。根据这一结论,就东部及全国其他地区提出了相应政策建议,以期推动各地方人才政策更好融入区域协调发展战略。
-
-
刘鸣筝;
芦猛
-
-
摘要:
“躺平”作为2021年“十大网络热词”之一,引发了大量的关注和讨论。本文以新浪微博中有关“躺平”和“内卷”的内容为研究数据,基于词频统计和LDA主题模型提取主题,从文本特征透视青年亚文化的情绪表达。通过对文本数据进行分析发现,“躺平”的微博内容主要呈现出青年的“躺平原因”“内心情感”“寻求寄托”“享受生活”四个主题;而“内卷”的微博内容主要呈现出青年人视角下“内卷严重”“生活压力”“反抗内卷”“教育内卷”四个主题。“躺平”和“内卷”的话语表达折射出了当代青年人的生活现状和内心情感。对文本内容进行分析之后,本文探析了“躺平”和“内卷”流行的成因以及青年亚文化表征,并对青年亚文化的情绪表达进行思考。
-
-
王佳莉
-
-
摘要:
笔者所在学校在2020年下半年建立了人工智能实验室,在其畅言AI实验平台中,学生对自然语言处理中的四大名著分词颇有兴趣,并产生了疑问:中文分词和词频统计的核心算法是什么?针对这种情况,笔者利用Python编程,帮助学生掌握词频统计中的枚举算法。
-
-
文禹衡;
于琳
-
-
摘要:
文章运用词频统计分析法分析《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)文本的主题分布规律,借助社会网络分析软件对核心词与法条之间的关系进行可视化分析。研究发现,《个人信息保护法》初步建立了完整的个人信息法律保护框架,个人信息热点问题的立法回应还较为模糊,与其他法律欠缺法秩序的一致性。未来,需要对《个人信息保护法》作出精细化调整,并加快出台《个人信息保护法实施条例》等配套法律法规,为执法提供指导依据。
-
-
陈秀春
-
-
摘要:
将语料库应用于英语词汇教学是近些年来学者们关注的焦点话题。鉴于以往研究的不足,从词频统计、词语搭配、语境共现以及语义韵四个方面来探讨语料库在大学英语词汇教学中的积极作用,旨在进一步丰富和推荐语料库在英语词汇教学应用方面的研究,并为词汇教学的积极探索提供有益启示。
-
-
林佳依;
赵涔辰;
陈凯
-
-
摘要:
采用教育数据挖掘法,利用NLPIR软件对《义务教育化学课程标准(2022年版)》进行文本挖掘。结果发现新课标中最关注与化学学科特色相关词,注重中学知识内容的衔接:“学习主题”“学习任务”“学业质量”的内容发生变化,学习方式从“探究”逐步向“实践”转变,其中“跨学科实践”是改革的亮点;与此同时,体现了化学课程的社会性与个体性的统一。从词频筛选结果也可发现多维度的学科素养相互联系,其中大概念引导化学观念建构,科学思维和科学探究与实践相互促进,科学态度与责任素养需要在教学情境中潜移默化。
-
-
刘桂珍
-
-
摘要:
财政部印发的会计改革与发展“十三五”和“十四五”规划纲要,是指导会计行业改革发展的纲领性文件。利用词频统计对两个文件的重要词汇及位序进行解读,可以看出,参与国际治理、加强审计工作、强化注册会计师管理、加快数字化转型等工作,将作为“十四五”期间的主要工作严格落实。
-
-
李晨曦;
王冰竹;
李兆辉
-
-
摘要:
本文通过python的网络爬虫技术,使用BeautifulSoup库,对知乎社交平台上对BIM话题的讨论内容进行爬取,利用jieba库进行分词,同时进行430份问卷调查,用SPSS进行分析,对现阶段欲进入BIM行业和BIM行业的工作人员进行聚类划分,并用结构方程模型进行BIM技术推广的障碍分析。用可视化图表的方式分析现阶段BIM技术的发展现状,并对未来其发展进行统计分析建模,分析其影响,并对如何更好的推广BIM技术提出建议。
-
-
马钰淇
-
-
摘要:
《人民警察法》(修订草案稿)是我国警察法律体系中的重要组成部分,它以立法形式明确了警察制度的改革方向,对公安事业的未来发展具有重大指导意义。词频统计作为文献计量学中的科学研究方法,注重对各类知识载体的定量分析。通过词频统计与数据挖掘可知,《人民警察法》(修订草案稿)所昭示的警务工作当代内核具体包括:警务宗旨与定位层面上的人民性,警察职权方面的综合性,警务管理体制方面的科学化,警事保障方面的全面性和人本性,法律责任方面的权责统一性,这无疑契合了国家从严治警、从优待警、改革强警的时代号召。
-
-
王道杰;
刘力豪
-
-
摘要:
国际奥委会的改革性文件《奥林匹克2020议程》(以下简称《2020议程》)对奥林匹克运动的改革与发展具有重要的指导意义,对国际体育事业的发展影响重大.以《2020议程》文本词汇为基础数据,以《奥林匹克2020议程:奥运会新规范》《奥林匹克2020议程:改革推进计划》等系列文件为参考,在确定《2020议程》改革理念的题域及筛选原则的基础上,运用词频统计法统计了可持续性、遗产、参与、合作等关键词,依此归纳了5条具有代表性的改革理念:可持续发展理念、以人为本理念、文化教育理念、降低成本理念、协同合作理念.《2020议程》改革理念对于北京2022年冬奥会具有重要的指导意义,结合国际奥林匹克运动要求与北京举办2022年冬奥会的现实,北京冬奥会筹办应持续推进遗产传承与生态文明,着重关注运动员发展与全民共建,稳步建构奥林匹克文化的全媒体传播,践行公平与效率的筹办原则,变革协同治理与开拓创新环境.
-
-
-
李玉婷;
冷静
- 《第22届全球华人计算机教育应用大会》
| 2018年
-
摘要:
随着科学领域的发展以及人们对社会科学认识的发展,交叉学科领域的科学研究特别是像教育科学这样对人力资源储备具有战略意义的领域的研究越来越重要.本文用内容分析方法对2006-2016年NSF项目涉及的所有项目和成果其进行整理与归纳,并利用python做数据分析,得出近10年的研究热点关键词趋势图.本研究为我国目前需要进行的将教育科学研究纳入国家自然科学基金的政策制定带来有价值的参考.本文根据研究问题关键词检索以及词频统计和可视化处理,得到2006-2016年美国NSF教育科学领域的研究热点趋势图,从热点趋势图中可以看出近10年来,NSF在教育科学领域的研究资助热点的变化情况。
-
-
常智明;
张帅丛;
张浩;
侯艳君
- 《2018年中国电影电视技术学会广播融媒技术专委会年会》
| 2018年
-
摘要:
标题党新闻识别算法是自然语言处理研究的重点方向,随着互联网技术的发展,在信息爆炸的时代背景下,该类问题已经成为当前读者面临的比较头疼的一个方向,河南广播网和手机APP内容面临的此类问题尤为突出.本文从自然语言处理的角度研究和探讨了基于主题提取分析的标题党识别算法和基于统计计算的标题党识别算法,提出了统计计算和潜在语义相融合的标题党识别算法,改进了标题党识别的正确率.标题党识别算法主要是包括基于词频统计的加权技术和基于潜在语义索引的两类算法.前者利用统计的手段方法,通过评估新闻标题中每个词汇在新闻正文和所有语料库中所占比例的大小来实现标题党识别.研究结果随着该词汇在文章中出现的次数和在整篇文章中所占的比例成正比例的增加,但同时会随着它在所有文档的语料库出现的频率成反比例减小,因此通过标题中词语占新闻中的重要程度判断该新闻是否是标题党新闻.后者通过提取与新闻标题相似的主题的句子和段落的比例的值,判断标题和新闻正文之间的相关性,通过和标题相似的句子的数量和该句子所在段落的数量来判断该文章是否为标题党.该结果随着与标题相似的句子和与标题相似句子的段落数的增加而成正比例增长,反之,随着在文章中相似的句子的数量减少和段落数的减少而减少.针对基于词汇统计计算TF-IDF值算法值的稀疏性和基于LSA潜在语义的句子段落算法值的难划分性,本文提出一种基于词频统计、LSA潜在语义分析相融合的一种方法,采用机器学习方式,通过将正文和标题的向量的计算结果作为特征工程的特征值及成为决策树算法的属性来进行标题党的识别,在准确率和召回率上都有了很大的提升,最终算法结果以准确率91%和召回率92%的值进行数据的识别.为进一步实现上述几种标题党识别算法存在的弊端、优点和缺点,本文以大量的标题党和非标题党新闻数据进行实验和展示,并对其进行分析和总结.
-
-
翟颖华
- 《第四届两岸华文教师论坛》
| 2014年
-
摘要:
2010年,两岸同时推出了汉语教学词表《华语教学基础词库》(以下简称《基础词库》)和《汉语国际教育用音节和汉字词汇等级划分》(以下简称《等级划分》),本研究在对《基础词库》和《等级划分》初级词表研制理念和收词比较的基础上,发现问题,借鉴思路,探寻初级汉语词表研制的相关问题.词表研制应该以词频作为选词的主要依据,然而,词频统计会受到语料库的影响而表现出一定的差异。词表的质量,以及随之而来的可信度,很大程度上取决于语料库的文本和代表性。因此认为,语体和情境是构建符合初级阶段汉语学习目标的语料库的关键因素。因为初级汉语教学涉及的情境是有限的,应该选取日常生活领域的高频词语,而不是整个汉语中的高频词。
-
-
-
-
赵琳瑛;
赵捧未
- 《第五届中国管理科学与工程论坛》
| 2007年
-
摘要:
本文提出了一种基于海量智能分词的中文自动分词新算法,该算法不依赖于现有词库,通过文本过滤和词频统计的方法进行中文自动分词,可以发现不限长度和不限领域的新词。自编软件进行的测试结果表明该方法有助于提高中文自动分词的准确度。
-
-
刘婷;
闫涵
- 《华北五省市(区)环境科学学会第二十届学术年会》
| 2017年
-
摘要:
本研究基于excel数据统计功能,采用文献计量分析方法对多规合一相关研究从文章发表时间、发表期刊、主要研究机构、主要研究学科及关键词等五个方面进行了分析,并对关键词进行了共词分析,通过研究指出了目前多规合一研究的发展趋势、其主要研究机构及热点研究问题等.
-
-
刘婷;
闫涵
- 《华北五省市(区)环境科学学会第二十届学术年会》
| 2017年
-
摘要:
本研究基于excel数据统计功能,采用文献计量分析方法对多规合一相关研究从文章发表时间、发表期刊、主要研究机构、主要研究学科及关键词等五个方面进行了分析,并对关键词进行了共词分析,通过研究指出了目前多规合一研究的发展趋势、其主要研究机构及热点研究问题等.
-
-
刘婷;
闫涵
- 《华北五省市(区)环境科学学会第二十届学术年会》
| 2017年
-
摘要:
本研究基于excel数据统计功能,采用文献计量分析方法对多规合一相关研究从文章发表时间、发表期刊、主要研究机构、主要研究学科及关键词等五个方面进行了分析,并对关键词进行了共词分析,通过研究指出了目前多规合一研究的发展趋势、其主要研究机构及热点研究问题等.