语义标注
语义标注的相关文献在1990年到2022年内共计477篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究
等领域,其中期刊论文278篇、会议论文44篇、专利文献15691篇;相关期刊140种,包括情报理论与实践、情报学报、现代图书情报技术等;
相关会议28种,包括第十四届全国软件与应用学术会议、第十四届全国遥感遥测遥控学术研讨会、第四届全国知识组织与知识链接学术交流会等;语义标注的相关文献由1099位作者贡献,包括孔德慧、王立春、刘勇等。
语义标注—发文量
专利文献>
论文:15691篇
占比:97.99%
总计:16013篇
语义标注
-研究学者
- 孔德慧
- 王立春
- 刘勇
- 栾悉道
- 谢毓湘
- 何克清
- 姬东鸿
- 王少帆
- 田枫
- 于俊清
- 何云峰
- 冯志勇
- 吴玲达
- 尹宝才
- 崔红
- 张斌
- 曾诚
- 李兵
- 李敬华
- 杜军平
- 杜向阳
- 段会龙
- 段宇锋
- 王义真
- 王昊
- 王玉萍
- 陈世展
- 余丽
- 吕晨
- 周凯
- 周明全
- 姜志国
- 张亚非
- 张浩鹏
- 朱永玲
- 李向阳
- 李平
- 杜小勇
- 杨俊俐
- 杨蕾
- 杨静
- 沈旭昆
- 满君丰
- 王倩
- 王强
- 王赠凯
- 田东平
- 耿国华
- 胡占义
- 董永权
-
-
田宣宣
-
-
摘要:
语义分析是当前计算语言学研究的一个重要任务,也是促进自然语言处理迈向新的阶段的主要挑战。在彝语言文字信息处理中,对彝语语句的语义标注是亟须解决的问题之一。研究选用特征结构理论框架,以彝语主谓谓语句的语义标注为切入点进行初步探索,用形式化手段表示彝语主谓谓语句的十一种语义关系类型,并归纳整理出彝语主谓谓语句的特征结构模型。研究表明,特征结构理论标注效率和标注精度较高,可以比较全面的描述彝语的复杂语义信息,为探索适合彝语语言事实的语义标注策略提供了一个可参考的解决方案。
-
-
丁培;
叶兰
-
-
摘要:
[目的/意义]科研用户需要学术图表助力精准知识发现服务.图表标注是学术图表融入学术知识发现体系需要解决的核心问题.[方法/过程]定义学术图表标注范畴,以历史研究为脉络,梳理学术图表发现研究及实践发展阶段,重点研究图表标注的两个核心问题:图表标注组织和图表标注实现.[结果/结论]总结现存研究问题,指出基于本体的学术图表自动语义标注是支撑未来大规模学术图表精准语义发现的图表标注形态.未来还需要在学术图表本体构建、 学术图表异构信息抽取等方面深入开展研究.
-
-
王东波
-
-
摘要:
正所谓工欲善其事必先利其器,深度学习以其模型结构的深度性、特征获取的自动性,在非结构化文本的自动分词、词性标注、组块识别、句法分析、语义标注、分类与聚类、关联知识发现等知识组织与挖掘研究任务上取得了优异的成绩或在一定程度上实现了质的飞跃,从而得到了迅速和广泛的应用和推广。而对于深度学习来说,数据特别精加工的数据是其根本,脱离数据而谈深度学习无异于追求镜中花、水中月,终无所成。
-
-
黄文彬;
王越千;
步一;
车尚锟
-
-
摘要:
学术论文语义结构的解析可以广泛应用于信息抽取、论文检索等多个问题.本文通过机器学习的方法,自动标注论文全文中每个子句的语义类型,以实现对论文语义结构的识别.本文使用了论文的宏观篇章结构,以及每个子句的语法、词汇信息作为特征,训练了支持向量机、条件随机场、随机森林、梯度提升分类器和随机梯度下降分类器5种机器学习模型,并将其中效果较好的支持向量机、条件随机场、梯度提升分类器3个模型进行集成,最终得到适用于学术论文全文本子句语义类型标注的集成模型.实验证明,无论在论文全文还是仅包含"结果"的章节中,与对照模型相比,集成模型的子句语义类型标注准确度和F-score均有提升.此外,本文通过主题聚类实验验证了集成模型在识别论文主题等文本挖掘领域能实现较好的效果.
-
-
刘继明;
孙成;
袁野
-
-
摘要:
为进一步提高客户语音问句实体信息抽取的准确性,增强智能问答系统知识图谱中信息抽取技术的整体效果,首先对语义标注进行优化,随后在BiLSTM-CRF(bidirectional long short-term memory conditional random filed)基础上加入BERT(bidi-rectional encoder representation from transformers)模型对句子进行实体抽取学习.在具体实验中,以语音问句事件文本为数据来源,对其进行语义标注和实体抽取实验.结果 表明,在语义标注优化的基础上同时加入BERT改进模型,信息抽取结果均高于BiLSTM-CRF方法,且改进模型的调和平均值达到91.53%,即可为增强事件实体信息抽取提供实践意义.
-
-
吕元智
-
-
摘要:
视频档案资源是语义最为丰富的档案资源,对其进行语义标注是视频档案资源能被有效利用的基础和前提.本文在对国内外相关研究成果梳理分析的基础上,结合视频档案资源特性,提出多层级语义标注的理念,阐释对视频档案资源多层级语义标注的意义,进而设计了视频档案资源多层级语义标注框架、多维语义信息提取模板和视频档案语义标注本体模型等.最后基于实例分析,从视频档案资源语义描述预处理、视频档案主题词汇集的完善以及如何引导用户参与语义标注工作等方面给出具体的应用建议.
-
-
林斌;
徐亦萍;
王燕;
叶金飞;
陈晓蓉
-
-
摘要:
现阶段标准比对工作大多需要专业技术人员从海量的标准文献资源中查找相关的、有差异的标准信息,工作量较大、工作效率低下.本文在标准文献数据库基础上,通过标准全文可检索化→标准指标碎片化→产品指标结构化的实施路径,探索构建标准指标数据智能比对分析系统.通过标准指标数据比对,引导行业、企业瞄准国内外先进标准水平,制定严于国家行业标准、看齐国际国外标准的先进标准,充分发挥先进标准引领质量提升的作用.
-
-
-
-
徐兵;
石少青;
陈超
-
-
摘要:
针对当前在电力中文地址匹配中存在部分地址歧义的问题,结合自然语言处理的基本原理,提出一种基于贝叶斯算法的中文地址精确匹配方法.为实现该方法,采用贝叶斯算法对中文字符串要素进行切分,以提高地址匹配的精度;采用句法分析,完成对中文地址的层级排序;采用语义标注,完成中文地址的匹配.最后,以上海电力局的部分中文地址数据为样本,采用上述方法进行划分,得到完整和准确的中文地址,并且在不同规模语料库下,本方法得到的分类正确率都在80%以上,具有较高的匹配精度.
-
-
Fu Zhu;
傅柱;
Wang Yuefen;
王曰芬
- 《第四届全国知识组织与知识链接学术交流会》
| 2013年
-
摘要:
语义网的提出为网络资源提供了新的知识组织方式,语义网的实现依赖于大量的、与各种形式化知识相关联的web内容元数据.当前语义网的发展迫切需要特定的、明确的和容易理解的语义元数据的创建和使用,也就是需要对当前的网络资源进行广泛可用的语义标注.本文按照时间顺序,概述了语义标注的起源和发展历程;在国内外学者对语义标注内涵描述的基础上,对语义标注的内涵和特征进行深入的探索,论述了语义标注与网络标注的差异,分析了语义标注的主要特点;通过文献计量分析法分别针对文献的年代分布、类型分布、期刊来源分布、关键词分布四个方面的统计结果进行语义标注的研究现状分析,进而发现当前语义标注研究的侧重点;最后提出语义标注未来研究的发展趋势。
-
-
-
-
-
Yin Li;
李吟
- 《第十四届全国软件与应用学术会议》
| 2015年
-
摘要:
Web服务具有对外只提供接口文档、技术规范复杂和运行时态瞬时多变等特性,如何有效地自动化生成测试数据仍旧是个难题.目前,针对有状态Web服务操作序列的测试研究较少,现有的方法对服务的行为信息和操作之间的数据依赖关系考虑不足,且缺乏有效的测试自动化手段,进而导致测试代价较高以及生成的测试数据缺乏针对性.对此,本文提出一种结合有限状态机(EFSM)模型和操作接口契约的测试数据生成方法.该方法根据标准WSDL文档建立操作模型,形式化描述操作之间的交互关系,并对其进行语义标注,基于EFSM模型生成操作序列测试路径,随后采用操作接口契约关系获取测试路径中的测试数据.通过案例表明,这种有状态Web服务的用例生成方法能够高效地生成合理的测试数据,并在错误检测能力以及用例有效性方面优于现有的方法.
-
-
王强;
华泽军;
王民
- 《第十四届全国遥感遥测遥控学术研讨会》
| 2014年
-
摘要:
为了提高遥感图像特征分析技术在众多领域中的应用效能,分析了遥感特征应用的大数据特点,设计了面向用户反馈和案例支持的特征分析框架,提出了可映射的图像特征层次模型,在底层视觉特征之上抽象出对象场景特征和行为事件特征;构建面向应用的领域本体,同时将用户反馈和案例作为特征分析的重要依据,提出了顾及反馈的聚类算法,实现不同层次特征的分类;引入粗糙集中的约减方法,实现面向应用的特征约减;基于案例对图像特征进行语义标注建立影像特征的语义映射机制,从而辅助进行影像的解译与分析.
-
-
-
-