首页> 中文会议>第15届全国软件与应用学术会议(NASAC2016) >面向软件问答文档的开发任务标签提取方法

面向软件问答文档的开发任务标签提取方法

摘要

StackOverflow等著名问答网站上的软件问答文档都带有标签,但现有标签对文档的描述过于笼统(局限于编程语言,相关项目的名字等),具有相同标签的文档个数很多,不利于开发者进行快速的文档定位和浏览.为此,本文面向开发者需要解决的开发任务,提出了一种抽取软件问答文档中描述开发任务的动宾短语作为文档标签的万法.该方法首先对软件问答文档做解析与预处理;然后提取文档中的动宾短语,最后尝试使用基于词频,基于词嵌入,基于机器学习的三种方法从动宾短语中选取该文档的开发任务.基于该方法,设计并实现了一个面向软件问答文档的开发任务标签提取工具.本文对63个软件问答文档进行了开发任务标签的提取,其准确率可以达到使用现有自动摘要生成工具准确率的15倍,并可以在软件问答文档检索过程中有效地优化检索结果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号