掌桥科研
一站式科研服务平台
科技查新
收录引用
专题文献检索
外文数据库(机构版)
更多产品
首页
成为会员
我要充值
退出
我的积分:
中文会员
开通
中文文献批量获取
外文会员
开通
外文文献批量获取
我的订单
会员中心
我的包量
我的余额
登录/注册
文献导航
中文期刊
>
中文会议
>
中文学位
>
中国专利
>
外文期刊
>
外文会议
>
外文学位
>
外国专利
>
外文OA文献
>
外文科技报告
>
中文图书
>
外文图书
>
工业技术
基础科学
医药卫生
农业科学
教科文艺
经济财政
社会科学
哲学政法
其他
工业技术
基础科学
医药卫生
农业科学
教科文艺
经济财政
社会科学
哲学政法
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
马克思主义、列宁主义、毛泽东思想、邓小平理论
哲学、宗教
社会科学总论
政治、法律
军事
经济
文化、科学、教育、体育
语言、文字
文学
艺术
历史、地理
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
交通运输
航空、航天
环境科学、安全科学
综合性图书
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
美国国防部AD报告
美国能源部DE报告
美国航空航天局NASA报告
美国商务部PB报告
外军国防科技报告
美国国防部
美国参联会主席指示
美国海军
美国空军
美国陆军
美国海军陆战队
美国国防技术信息中心(DTIC)
美军标
美国航空航天局(NASA)
战略与国际研究中心
美国国土安全数字图书馆
美国科学研究出版社
兰德公司
美国政府问责局
香港科技大学图书馆
美国海军研究生院图书馆
OALIB数据库
在线学术档案数据库
数字空间系统
剑桥大学机构知识库
欧洲核子研究中心机构库
美国密西根大学论文库
美国政府出版局(GPO)
加利福尼亚大学数字图书馆
美国国家学术出版社
美国国防大学出版社
美国能源部文献库
美国国防高级研究计划局
美国陆军协会
美国陆军研究实验室
英国空军
美国国家科学基金会
美国战略与国际研究中心-导弹威胁网
美国科学与国际安全研究所
法国国际关系战略研究院
法国国际关系研究所
国际宇航联合会
美国防务日报
国会研究处
美国海运司令部
北约
盟军快速反应部队
北约浅水行动卓越中心
北约盟军地面部队司令部
北约通信信息局
北约稳定政策卓越中心
美国国会研究服务处
美国国防预算办公室
美国陆军技术手册
一般OA
科技期刊论文
科技会议论文
图书
科技报告
科技专著
标准
其它
美国卫生研究院文献
分子生物学
神经科学
药学
外科
临床神经病学
肿瘤学
细胞生物学
遗传学
公共卫生&环境&职业病
应用微生物学
全科医学
免疫学
动物学
精神病学
兽医学
心血管
放射&核医学&医学影像学
儿科
医学进展
微生物学
护理学
生物学
牙科&口腔外科
毒理学
生理学
医院管理
妇产科学
病理学
生化技术
胃肠&肝脏病学
运动科学
心理学
营养学
血液学
泌尿科学&肾病学
生物医学工程
感染病
生物物理学
矫形
外周血管病
药物化学
皮肤病学
康复学
眼科学
行为科学
呼吸学
进化生物学
老年医学
耳鼻喉科学
发育生物学
寄生虫学
病毒学
医学实验室检查技术
生殖生物学
风湿病学
麻醉学
危重病护理
生物材料
移植
医学情报
其他学科
人类生活必需品
作业;运输
化学;冶金
纺织;造纸
固定建筑物
机械工程;照明;加热;武器;爆破
物理
电学
人类生活必需品
作业;运输
化学;冶金
纺织;造纸
固定建筑物
机械工程;照明;加热;武器;爆破
物理
电学
马克思主义、列宁主义、毛泽东思想、邓小平理论
哲学、宗教
社会科学总论
政治、法律
军事
经济
文化、科学、教育、体育
语言、文字
文学
艺术
历史、地理
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
交通运输
航空、航天
环境科学、安全科学
综合性图书
主题
主题
题名
作者
关键词
摘要
高级搜索 >
外文期刊
外文会议
外文学位
外国专利
外文图书
外文OA文献
中文期刊
中文会议
中文学位
中国专利
中文图书
外文科技报告
清除
历史搜索
清空历史
首页
>
中文会议
>
工业技术
>
自动化技术与计算机技术
>
第三届CCF国际自然语言处理与中文计算会议
第三届CCF国际自然语言处理与中文计算会议
召开年:
2014
召开地:
深圳
出版时间:
2014-12-05
主办单位:
中国计算机学会
会议文集:
第三届CCF国际自然语言处理与中文计算会议论文集
会议论文
热门论文
全部论文
相关中文期刊
计算机与数字工程
数码先锋
通讯和计算机
数字化用户(互联网生活)
微型机与应用
首都信息化
办公自动化(综合版)
音响改装技术
课堂内外·中学生电脑
机器人技术与应用
更多>>
相关外文期刊
IEEE Transactions on Knowledge and Data Engineering
International journal of synthetic emotions
Parallel and Distributed Systems, IEEE Transactions on
International journal of ad hoc and ubiquitous computing
Asian Journal of Control
Learning & Leading with Technology
Journal of network and computer applications
IEEE transactions on information forensics and security
International Journal of Computer Aided Engineering and Technology
Inside knowledge
更多>>
相关中文会议
第四届全国教育游戏与虚拟现实学术会议
第八届中国智慧城市建设技术研讨会
2005全国网络与信息安全技术研讨会
全国光学遥感载荷与信息处理技术2013年学术会议
第21届中国过程控制会议
第十一届全国化学传感器学术会议
2008国际知识技术论坛(IFKT2008)
中国系统工程学会决策科学专业委员会第四届年会
2011年南京市科协年会——提高高端智能装备水平 推进机械工程创新发展专题高层论坛
第十一届全国VXI总线与故障诊断技术研讨会
更多>>
相关外文会议
Computational intelligence : Theory and applications
International Conference on Computational Science and Its Applications - ICCSA 2003 Pt.1 May 18-21, 2003 Montreal, Canada
ACM(Association for Computing Machinery) SIGPLAN(Special Interest Group on Programming Languages) International Conference on Functional Programming; 20030825-20030829; Uppsala; SE
International Workshop on Intelligent Media Technology for Communicative Intelligence(IMTCI 2004); 20040913-14; Warsaw(PL)
New aspects of automatic control, modelling & simulation
International Workshop on Golbal Optimization and Constraint Satisfaction(COCOS 2003); 20031118-21; Lausanne(CH)
2nd international workshop on search-driven development-users, infrastructure, tools and evaluation 2010
14th European Conference on Machine Learning; Sep 22-26, 2003; Cavtat-Dubrovnik, Croatia
Transactions on petri nets and other models of concurrency III
The 9th World Multi-Conference on Systemics, Cybernetics and Informatics(WMSCI 2005) vol.9
更多>>
热门会议
2015第十届全国体育科学大会
2019年中国城市规划年会
2018中国城市规划年会
中国工程热物理学会2014年年会
第三届世界灾害护理大会
第30届中国气象学会年会
2017年中国地球科学联合学术年会(CGU2017)
中华医学会第十八次全国儿科学术会议
2006中国科协年会
2011年第二十八届中国气象学会年会
更多>>
最新会议
2005中国首届国际铜板带研讨会
全国小儿病毒性肝炎学术会议
模糊系统及其应用成果学术交流会
中国金属学会高温合金中微量元素的控制及其作用鉴定会
中国有色金属学会冶金设备学术委员会第一届年会
2003年全国理论计算机科学学术年会
2015年齐鲁高教论坛
中国石油学会油品应用技术交流会
中国化工学会第一届流体流动传热传质及燃烧技术会
中国金属学会第四界炭素材料年会
更多>>
全选(
0
)
清除
导出
1.
语料库语言学视角下的台湾汉字简化研究
WANG Boli
;
王博立
;
SHI Xiaodong
;
史晓东
;
CHEN Yidong
;
陈毅东
;
REN Wenyao
;
任文瑶
;
YAN Siyao
;
阎思瑶
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
采用语料库语言学的研究方法,论证台湾存在汉字简化的现象,并分析台湾汉字简化的特点和影响因素.首先,通过爬取台湾的新闻媒体、政府网站和博客,建立台湾汉语语料库.然后,借助语料库统计数据,论证台湾民间存在对简笔俗字的使用偏好,即台湾存在汉字简化的现象,并进一步分析台湾汉字简化的若干特点.最后,讨论台湾汉字简化的影响因素,包括大陆简体字、汉字编码、中文输入法等.
汉字简化;
使用偏好;
汉语语料库;
文化交流;
2.
唐诗题材自动分类研究
HU Renfen
;
胡韧奋
;
ZHU Yuchen
;
诸雨辰
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
将文本分类技术引入唐诗研究.首先将唐诗按照题材分为爱情婚姻、边塞战争、交游送别、羁旅思乡、山水田园、咏史怀古和其他7类,并据此提出唐诗题材自动分类模型.所选500首诗歌样本以《唐诗三百首》为基础,并有所补充.采用向量空间模型(VSM)将唐诗文本转换为向量,通过卡方检验进行词语特征选择,最后基于朴素贝叶斯和支持向量机算法构造文本分类器,取得较好的题材分类效果.此外,还验证了作者关于题目、体制、作者等变量对题材分类产生影响的假设,为相关诗歌本体研究提供了科学依据。
唐诗;
题材分类;
向量空间模型;
计算机技术;
3.
基于MFCCG-PCA的语音情感识别
CHEN Weiliang
;
陈炜亮
;
SUN Xiao
;
孙晓
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
针对语音情感值维度大、难处理的问题,结合MFCC改进算法和PCA模型,进行二次优化,提出一种新的语音情感值提取模型MFCCG-PCA.多组实验表明,相比一般的MFCC模型,MFCCG-PCA模型在语音情感识别方面的性能有较大提高.
语音识别;
情感值;
Mel频率倒谱系数;
PCA模型;
4.
基于自动编码器的短文本特征提取及聚类研究
LIU Kan
;
刘勘
;
YUAN Yunying
;
袁蕴英
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
针对短文本的特点,提出一种基于深层噪音自动编码器的特征提取及聚类算法.该算法利用深度学习网络,将高维、稀疏的短文本空间向量变换到新的低维、本质特征空间.首先在自动编码器的基础上,引入L1范式惩罚项来避免模型过分拟合,然后添加噪音项以提高算法的鲁棒性.实验结果表明,将提取的文本特征应用于短文本聚类,显著提高了聚类的效果,有效地解决了短文本空间向量的高维、稀疏问题.
网络短文本;
特征提取;
聚类算法;
自动编码器;
5.
基于自动编码特征的汉语解释性意见句识别
HE Yu
;
贺宇
;
PAN Da
;
潘达
;
FUGuohong
;
付国宏
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
提出一种基于自动编码特征的汉语解释性意见句识别的分类方法.首先从汽车和手机两个领域的产品评论中构造一个解释性意见语料库,然后采用分类的方法进行解释性意见句识别.特别地,采用自动编码技术表示和学习解释性意见句分类的词向量特征.最后,在支持向量机框架下通过实验优选解释性词向量维度,并与一些传统特征表示方法进行比较.实验结果表明,与传统的卡方、信息增益和TF-IDF及其组合方法相比,自动编码特征的引入能有效提升汉语解释性意见句识别性能。
解释性意见句;
文字识别;
自动编码技术;
词向量特征;
6.
面向书写教学的手写汉字图像笔画还原
XUN Endong
;
荀恩东
;
Lü Xiaochen
;
吕晓晨
;
AN Weihua
;
安维华
;
SUN Yannan
;
孙燕南
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
为了实现智能化汉字书写教学,提出一种手写汉字图像的笔画还原方法.首先提取手写汉字图像的骨架;然后从知识工程的角度出发,利用字形中稳定的拓扑信息,消除骨架中的歧义变形;最后利用A*算法建立并求解手写汉字与相应模板汉字的字形相似度模型,从而分割出手写汉字图像中的各个笔画,并输出它们与模板汉字中各个笔画的对应关系.此方法的笔画还原结果可以应用于手写汉字规范性的自动化评判等场合.
手写汉字图像;
笔画还原;
相似度模型;
书写教学理论;
7.
中文文本中评价对象省略识别方法
ZHU Zhu
;
朱珠
;
WANG Rong
;
汪蓉
;
LI Shoushant
;
李寿山
;
ZHOU Guodong
;
周国栋
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
为了研究中文情感文本中评价对象省略现象的识别方法,将评价对象省略识别建模为一个二元分类问题,利用机器学习算法进行自动学习.探讨当前句位置无关特征、当前句位置相关特征和上下文相关特征对评价对象省略识别的作用.3个不同领域的实验结果表明,新提出的基于机器学习的评价对象省略识别方法能够获得较好的识别效果.
中文情感文本;
评价对象;
省略识别;
机器学习算法;
8.
面向词性标注的多资源转化研究
GAO Enting
;
高恩婷
;
CHAO Jiayuan
;
巢佳媛
;
LI Zhenghua
;
李正华
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
利用多资源转化方法进行词性标注研究,旨在将源端资源的标注进行转化,以符合目标端标注规范,进而将转化后的资源与目标资源合并,增大训练数据规模.做了两方面创新:在转化过程中,额外利用指导特征的置信度信息;在转化后的资源中,用模糊标注表示方法减少错误标注.实验表明,利用置信度信息能有效帮助转化,而模糊标注表示方法的影响不大.
汉语词性标注;
多资源转化;
置信度信息;
指导特征理论;
9.
使用源语言复述知识改善统计机器翻译性能
SU Chen
;
苏晨
;
ZHANG Yujie
;
张玉洁
;
GUO Zhen
;
郭振
;
XU Jinan
;
徐金安
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
为了缓解双语语料不足导致的翻译知识欠缺问题,提出基于复述技术的翻译框架.此框架利用第三种语言获取带有概率的复述知识表,以Lattice表示输入句子的多种复述形式,扩展解码器使之可以对Lattice形式的输入进行解码,将复述知识作为特征加入到对数线性模型的目标函数中.在保持原始翻译知识表不变的情况下,此框架不仅可以增大短语翻译表对源语言现象的覆盖率,也能够增加候选译文表现形式的多样性.在3个不同规模训练集上的对比实验结果表明,在训练语料规模最小的情况下(10 K句对),系统性能有明显提升(BLEU+1.4%);在训练语料规模最大的情况下(1M句对),系统性能也取得一定提升(BLEU+0.32%).
源语言句子;
统计机器翻译;
复述技术;
解码器;
10.
版面相似中文表单的分类方法研究
WANG Simeng
;
王思萌
;
GAO Liangcai
;
高良才
;
WANG Yuehan
;
王悦涵
;
LI Pingli
;
李平立
;
TANG Zhi
;
汤帜
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
针对具有相似版面的中文表单,提出一种简单有效的基于距离度量的表单分类方法,该方法对表单的用户填写信息、布局信息和位置偏移分别进行距离度量,并通过3种权重有效地降低用户填写信息的随机性、版面相似表单的布局一致性和位置抖动性对表单分类的影响.实验表明,所提方法在多个中文表单图像库上的分类准确率达到90%以上,比目前最新的表单分类方法有明显提高.
中文表单;
分类算法;
距离度量理论;
版面设计;
11.
流式文档到固定版式文档的可逆转换方法研究
LINing
;
李宁
;
LIU Yin
;
刘寅
;
LIANG Qi
;
梁琦
;
FENG Xue
;
冯雪
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
分析以往流式文档和固定版式文档一体化处理方法的局限,提出一种可逆转换方法,即将文档的转换信息记录于目标文档中,以便用于源文档的重构.论述了可逆转换的原理、关键技术、实验结果以及技术优势.选择标文通(UOF)作为流式文档格式,CEBX作为固定版式文档格式,利用该方法成功地实现标文通文档到CEBX文档的可逆转换,实验结果表明,该方法取得较好的效果.
文档处理;
选择标文通;
公共电子文档;
可逆转换法;
12.
基于类别层次结构的多层文本分类样本扩展策略
LI Baoli
;
李保利
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
针对大规模多层文本分类训练样本获取代价高、类别分布不均衡等问题,提出并比较几种基于类别层次结构的大规模多层文本分类样本扩展策略,即利用类别层次体系中蕴含的类别名称、描述以及类别间的层次结构关系,从内涵和外延两方面人手构造或扩展类别训练样本.在首次大规模中文新闻信息多层分类评测数据集上,基于外延的局部样本扩展策略取得较好的性能.参测系统在第一级类别和第二级类别上宏平均Fl分别为0.8413和0.7139,在10个参赛系统中位列第二.
多层文本;
分类样本;
扩展策略;
类别层次结构;
13.
古典诗词动画自动生成研究
YAN Siyao
;
阎思瑶
;
ZHENG Xuling
;
郑旭玲
;
SHI Xiaodong
;
史晓东
;
ZHENG Fakui
;
郑发魁
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
以中国古典诗词为研究对象,首次尝试将自然语言处理、计算诗学和计算机动画等相关研究成果相结合来解决古典诗词的动画自动生成.首先使用基于SVM和协同学习的分类器对古诗风格、题材以及时间进行自动判定.随后在使用Flash Actionscript 3.0脚本实现动画自动生成的基础上,利用共现关系对生成的动画进行动画元件的补充,并提出古诗场景划分方法.实验表明,提出的方法初步解决了古典诗词的动画自动生成问题,也为后继的相关研究提供了理论依据和实验基础.
汉语古典诗词;
动画生成;
分类器;
计算机技术;
14.
多策略同义词获取方法研究
SONG Wenjie
;
宋文杰
;
GU Yanhui
;
顾彦慧
;
ZHOU Junsheng
;
周俊生
;
SUN Yujie
;
孙玉杰
;
YAN Jie
;
严杰
;
QU Weiguang
;
曲维光
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
提出一种多策略同义词获取方法,一方面利用《同义词词林》、《中文概念词典》等现有语义词典中蕴含的同义关系获取同义词,另一方面根据百度百科信息框(Bdbk)中特征词和汉典网(Zdic)中HTML标记获取同义词,同时采用DIPRE自动获取模式的方法,从百度百科文本中发现置信度较高的模式和同义关系.实验结果表明,所提方法在NLP&CC 2012同义词评测数据集中取得较好结果.利用该方法,以《现代汉语语法信息词典》名词部分为目标,构建一部同义词词典并进行人工校对,为《现代汉语语法信息词典》构建较为完善的语义关系体系做出尝试.
汉语词典;
同义词;
语义关系;
多策略获取法;
15.
基于句法语义规则系统的比较句自动识别
BAI Linnan
;
白林楠
;
HU Renfen
;
胡韧奋
;
LIU Zhiying
;
刘智颖
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
针对汉语比较句的自动识别,提出一种基于句法语义规则的方法.将比较标记和比较结果做为识别比较句的关键因素,归纳汉语比较句的类别,书写比较句识别规则,同时设计4个模型进行分类识别.实验结果表明,规则系统可以有效地实现汉语比较句的句法分析和自动识别,为比较关系的抽取打下良好的基础.
汉语比较句;
自动识别;
句法语义规则系统;
概念层次网络理论;
16.
一种基于查询加权的用户建模方法
HU Juan
;
胡娟
;
BAI Yu
;
白宇
;
CAI Dongfeng
;
蔡东风
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
通过分析用户的查询日志,模拟用户与搜索引擎之间的交互过程,提出一种基于查询加权的用户建模方法.首先,对查询日志进行会话分割;然后,利用会话中用户查询出现的次数、持续时间及所点击的URL排名等行为信息,计算查询权重;最后,采用兴趣投票的方式,完成用户模型的构建.在AOL(美国在线)查询日志数据集上的测试结果表明,基于查询加权的用户建模方法在用户兴趣预测上取得较好的效果.
查询日志;
数据挖掘;
用户建模;
查询加权理念;
17.
基于随机森林分类的微博机器用户识别研究
LIU Kan
;
刘勘
;
YUAN Yunying
;
袁蕴英
;
LIU Ping
;
刘萍
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
针对网络上机器用户大量散布谣言,发布虚假信息,误导网民舆论,严重影响网络环境的问题,以微博中的机器用户为研究对象,结合其自动化程度高、伪装能力强、信息发布有针对性的特点,从行为模式、微博内容、用户关系和发布平台4个维度分析机器用户的特征指标,利用信息熵、内容重复率等8个指标构建微博用户的特征向量,通过随机森林算法设计微博中机器用户的识别模型.最后,在真实的新浪微博数据集上进行验证,结果表明本模型识别机器用户的准确度达到96.7%,可以有效地区分微博中的机器用户和普通用户.
信息识别;
微博平台;
机器用户;
特征向量;
随机森林算法;
18.
一个中文实体链接语料库的建设
SHU Jiagen
;
舒佳根
;
HUI Haotian
;
惠浩添
;
QIAN Longhua
;
钱龙华
;
ZHU Qiaoming
;
朱巧明
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
鉴于现有中文实体链接基准语料库的缺乏,在ACE2005中文语料库和中文维基百科的基础上,通过自动构造和人工标注的方法,构建一个中文实体链接语料库及其相关的中文知识库.与传统的英文实体链接语料库不同,构造的中文实体链接语料库是基于实体而非单个实体指称(Mention).中文实体链接语料库的构建,将为中文实体链接研究提供一个可用的基准平台.
中文语料库;
实体链接;
基准系统;
19.
基于双语合成语义的翻译相似度模型
WANG Chaochao
;
王超超
;
XIONG Deyi
;
熊德意
;
ZHANG Min
;
张民
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
提出基于双语合成语义的翻译相似度模型,通过在翻译过程中引入双语语义相似度特征提高翻译性能.首先利用分布式方法分别在源端和目标端获取短语的单语合成语义向量,然后利用神经网络将它们映射到同一语义空间,获得双语合成语义向量.在该语义空间,计算源语言短语和对应的目标语言短语之间基于合成语义向量的翻译相似度,将其作为一个新特征加入解码器.在汉英翻译NIST06和NIST08测试数据集上,相较于基准系统,基于双语合成语义的翻译相似度模型获得0.56和0.42 BLEU值的显著性提高.
语言短语;
机器翻译;
相似度模型;
双语合成语义理论;
20.
汉语篇章连接词识别与分类
LI Yancui
;
李艳翠
;
SUN Jing
;
孙静
;
ZHOU Guodong
;
周国栋
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
基于自建的汉语篇章结构语料库以及语料库中连接词和连接词关系类别的标注,抽取自动句法树和标准句法树的句法、词法和位置特征,利用有监督的方法进行连接词识别和分类.实验结果表明,连接词识别的F1值为69.2%,连接词自动识别并分类的总正确率为89.1%.
汉语篇章;
连接词;
自动识别;
分类管理;
21.
利用URL-Key进行查询分类
LI Xuewei
;
李雪伟
;
Lü Xueqiang
;
吕学强
;
DONG Zhian
;
董志安
;
LIU Kehui
;
刘克会
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
针对查询分类问题,借助互联网中人工组织的分类网站领域URL,利用URL-key在各个类别中使用的频度,提出基于方差的领域URL-key识别方法,利用机器翻译、拼音翻译和搜索结果反馈等技术对URL-key进行过滤,构建领域URL-key.然后结合伪相关反馈技术,选取URL-key为特征,构建URL-key向量,利用SVM对查询串进行分类.实验结果表明,该方法不仅F值比对比方法提高7%,而且资源的使用也远远小于对比方法,提高了系统的时效性.
统一资源定位符;
信息提取;
查询系统;
分类管理;
22.
语义知识库构建中的异常数据发现
HE Binbin
;
贺彬彬
;
ZOU Lei
;
邹磊
;
ZHAO Dongyan
;
赵东岩
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
为了提高RDF知识库的数据质量,提出RDF图数据的异常检测及其自动修复的方法.首先,原创性地定义了基于图的条件函数依赖(GCFD),能够将属性值和语义结构的依赖关系统一表示;然后,提出有效的算法框架以及优化策略,挖掘RDF数据中的GCFD,并给出异常数据的自动修复流程;最后,在真实的数据集上,通过大量实验确认解决方案的可行性和优越性.
知识库;
数据挖掘;
资源描述框架;
条件函数依赖;
23.
面向中文专利SAO结构抽取的文本特征比较研究
RAO Qi
;
饶齐
;
WANG Peiyan
;
王裴岩
;
ZHANG Guiping
;
张桂平
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
针对中文专利文本中SAO结构实体关系抽取问题,使用支持向量机的机器学习方法进行关系抽取实验,分别对基本词法信息、实体间距离信息、最短路径闭包树句法信息以及词向量信息等特征的有效性进行验证分析.实验结果表明,基本的词法信息能够明显提高关系抽取性能,而句法信息没有显著提高关系抽取效果.此外,也验证了词向量在SAO结构关系抽取中的可行性.
中文专利文本;
SAO结构;
实体关系;
特征提取;
24.
一种结合有监督学习的动态主题模型
JIANG Zhuoren
;
蒋卓人
;
CHEN Yan
;
陈燕
;
GAO Liangcai
;
高良才
;
TANG Zhi
;
汤帜
;
LIU Xiaozhong
;
刘晓钟
《第三届CCF国际自然语言处理与中文计算会议》
|
2014年
摘要:
针对传统主题模型存在的不足,提出一种新的结合有监督学习的动态主题模型(Supervised Dynamic Topic Model,S-DTM).该模型不仅能够随时间的变化对语言进行动态建模,而且结合有监督学习技术,在主题变分推理中加入标签约束,从而建立主题与标签之间的映射关系,提高主题的表达解释能力.通过在一个跨越25年"以自然语言处理领域的中文期刊论文为主导"的中文语料库上的实验,证明该模型相较于静态的有监督主题模型和无监督的动态主题模型,具有更好的语义解释概括能力,能更准确地反映文档的主题结构,更精确地捕捉主题-词汇概率分布的动态演化.
中文语料库;
动态主题模型;
监督学习技术;
标签约束;
意见反馈
回到顶部
回到首页