词库
词库的相关文献在1981年到2022年内共计748篇,主要集中在自动化技术、计算机技术、汉语、语言学
等领域,其中期刊论文306篇、会议论文3篇、专利文献439篇;相关期刊168种,包括现代图书情报技术、科技智囊、电脑迷等;
相关会议3种,包括2008年电力行业信息化年会、中国中文信息学会汉字编码专业委员会第八届年会、2002年全国机器翻译研讨会等;词库的相关文献由1085位作者贡献,包括费腾、邱全成、张扬等。
词库
-研究学者
- 费腾
- 邱全成
- 张扬
- 杨磊
- 张会鹏
- 黄景明
- 张军
- 王志军
- 孙润元
- 杨波
- 王闪闪
- 蔡胜
- 陈贞翔
- 付立群
- 涂畅
- 邵晓慧
- 庄莉
- 彭立志
- 李金奎
- 查文
- 王砚峰
- 罗勇
- 肖镜辉
- 荆山
- 谌贻荣
- 陈丽菲
- 陈明东
- 陈正
- 黄越
- 刘庆
- 刘辉
- 史伟
- 周晓锋
- 孙伟松
- 孙小兵
- 常乐
- 徐晓燕
- 李斌
- 杨辉
- 林丽华
- 潘福成
- 王天一
- 王秋琳
- 苏少炜
- 郭成贺
- 陈孝良
- 陈炳辉
- 马睿
- 高原
- 高精鍊
-
-
刘早
-
-
摘要:
文章以在国际上拥有广泛用户群体的《NAVER词典》App为例,介绍了该App在媒体融合背景下的发展历程,并从多种词库融合、多种检索方式融合、多媒体融合、多语种融合四个方面对该App的融合功能进行探析,从而为我国词典App的设计与开发提供参考性建议。
-
-
吴宇仑
-
-
摘要:
邓思颖(2010)认为现代汉语中宾语和补语同时出现时唯一合法的语序是“先宾后补”,这与传统语法的结论相违背。句法变换的形式证据说明,属于一个复合词的宾语前的动补结构本质上不是一个词项,而是一个短语结构。当代生成语法中简化句法规则同时扩充词库的词汇主义观点过于发达,导致词库的生成能力过于强大。从理论上来说这不符合生物语言学的事实,从实践上来说不能充分地对具体语言的语法进行描写。所以,在简化句法运算规则的同时,应当注意尽量限制词库的生成能力。
-
-
-
冬瓜面包树
-
-
摘要:
什么叫皮肤控?特指隐藏在输入法中的另类皮肤,可暴露当代青年不为人知的小癖好。别看有些人表面上高冷傲娇,背地里却将输入法皮肤设置成不可描述的图片……随着网络社交的不斷发展,如今的年轻人是线上聊得火热,线下冷漠如冰。如若统计大家在网络和现实中各说了多少话,想必一定是令人眼前一亮的对比——现实聊天中的词汇就像80后的发际线,而网上聊骚的词库就像00后的发量多。
-
-
缠利叶
-
-
摘要:
乔姆斯基的词库理论贯穿于转换生成语法发展的各个时期.乔姆斯基认为,词库和转换规则相互作用,具有替代短语结构规则的意义,在X-杠理论中词库形成投射,帮助人们更加清楚地理解句子,原则参数理论中词库被进一步划分使得句子意义理解更加明确,在最简方案中词库使得句法结构进一步经济化.乔姆斯基基于人类大脑语言生成过程分析,通过揭示句子结构构成中词库的作用,实现词库与转换规则有效结合,祛除了语法规则的冗余性,促使转换生成语法不断演变完善,具有积极的语言学意义.
-
-
杨凡;
薛佳奇
-
-
摘要:
针对微博文本内容的即时性、随意性、碎片性,本文提出将网络流行语词库、微博表情词词库、网络流行词词库加入到结巴分词词库中,以确保Word2vec模型对文本准确词向量化;针对上下文语义关联的微博文本特征以及双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)难收敛、训练时间长的问题,采用BiGRU(Bidirectional,Gated Recurrent Unit)神经网络学习微博文本的深层特征;针对当下流行的注意力机制(AttentionMechanism),调整情感词权重,但同时忽略微博内部序列关系的问题。该文使用自注意力机制(Self-Attention)综合微博文本内部关键特征对情感词进行定位,调整情感词的概率权重;然后用softmax函数进行分类。实验证明,本文方法比现有方法的准确率提高了5.34%。
-
-
杨凡;
薛佳奇
-
-
摘要:
针对微博文本内容的即时性、随意性、碎片性,本文提出将网络流行语词库、微博表情词词库、网络流行词词库加入到结巴分词词库中,以确保Word2vec模型对文本准确词向量化;针对上下文语义关联的微博文本特征以及双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)难收敛、训练时间长的问题,采用BiGRU(Bidirectional,Gated Recurrent Unit)神经网络学习微博文本的深层特征;针对当下流行的注意力机制(AttentionMechanism),调整情感词权重,但同时忽略微博内部序列关系的问题.该文使用自注意力机制(Self-Attention)综合微博文本内部关键特征对情感词进行定位,调整情感词的概率权重;然后用softmax函数进行分类.实验证明,本文方法比现有方法的准确率提高了5.34%.
-
-
-
-
-
吴克河;
何霞;
李廷顺
- 《2008年电力行业信息化年会》
| 2008年
-
摘要:
以电力企业的业务系统为背景,以设计实现一个适用于电力企业搜索引擎的分析器为目的,提出了一种基于词库实现的分词算法.该分析器基于电力专业词典完成,解决了现有分析器分词效果不尽人意的问题.同时,采用了构建词语树的方法,加载词库时,在内存中构建一棵词语树,分词时只需要遍历树即可分出相应的词语.这解决了常用最大匹配算法的必须设定一个最大词长的限制,并且在分词效率上也有了很大的提高,避免了无意义的匹配算法.最后对该分析器和Lucene两个内置的分析器进行了比较,结果证明,对于电力企业的应用系统,该分析器无论在时间还是分词效果上都优于Lucene内置的分析器.这表明该分析器已经能很好的满足构建电力企业搜索引擎的要求.
-
-
沈不沉
- 《中国中文信息学会汉字编码专业委员会第八届年会》
| 2002年
-
摘要:
不论以何种名义命名的输入法,都要向用户提供一个该输入法赖以依存的词库;某一输入法的重码率,与其所提供的词库的词条总量成正比,由于中文输入以词组为主,故统计单字的重码率毫无意义.由Windows9X提供的"输入法生成器",有可能建立具有个性化特征的输入法;编制个人词库时,应尽可能包含经常用到的GBK字库.
-
-
-
-
-
-