首页> 外文期刊>IEEE Transactions on Software Engineering >Automatically Categorizing Software Technologies
【24h】

Automatically Categorizing Software Technologies

机译:自动分类软件技术

获取原文
获取原文并翻译 | 示例

摘要

Informal language and the absence of a standard taxonomy for software technologies make it difficult to reliably analyze technology trends on discussion forums and other on-line venues. We propose an automated approach called $mathrm{Witt}$ Witt for the categorization of software technologies (an expanded version of the hypernym discovery problem). $mathrm{Witt}$ Witt takes as input a phrase describing a software technology or concept and returns a general category that describes it (e.g., integrated development environment), along with attributes that further qualify it (commercial, php, etc.). By extension, the approach enables the dynamic creation of lists of all technologies of a given type (e.g., web application frameworks). Our approach relies on Stack Overflow and Wikipedia, and involves numerous original domain adaptations and a new solution to the problem of normalizing automatically-detected hypernyms. We compared $mathrm{Witt}$ Witt with six independent taxonomy tools and found that, when applied to software terms, $mathrm{Witt}$ Witt demonstrated better coverage than all evaluated alternative solutions, without a corresponding degradation in false positive rate.
机译:非正式语言和软件技术的标准分类法的缺乏使得难以在讨论论坛和其他在线场所上可靠地分析技术趋势。我们提出了一种自动化方法,称为$ mathrm {Witt} $ Witt,用于软件技术的分类(上位音发现问题的扩展版本)。 $ mathrm {Witt} $ Witt将描述软件技术或概念的短语作为输入,并返回描述它的一般类别(例如,集成开发环境),以及进一步限定它的属性(商业,php等)。 。通过扩展,该方法能够动态创建给定类型的所有技术的列表(例如,Web应用程序框架)。我们的方法依赖于Stack Overflow和Wikipedia,并且涉及许多原始域的改编以及针对规范化自动检测到的上位词问题的新解决方案。我们将$ mathrm {Witt} $ Witt与六个独立的分类法工具进行了比较,发现,将$ mathrm {Witt} $ Witt应用于软件术语时,其覆盖范围比所有评估的替代解决方案都要好,且假阳性率不会相应降低。 。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号