首页> 外文期刊>電子情報通信学会技術研究報告 >トピック抽出に基づく開発者の活動に着目したリポジトリ可視化手法
【24h】

トピック抽出に基づく開発者の活動に着目したリポジトリ可視化手法

机译:基于主题提取的以开发人员活动为中心的存储库可视化方法

获取原文
获取原文并翻译 | 示例
       

摘要

During a software development, the activity of an individual developer is considered to affect software quality. Process improvement should be performed on not only a project but also an individual developer. However, it is difficult to keep the record of the activity of a developer continuously. Recent software development uses configuration management systems that keep the record of source file creation and modifications as well as also bug fixes. In this paper, we propose an approach to visualize the activity of an individual developer using the record in a version control system. In the approach, at first, documents for the input of the Latent Dirichlet Allocation are generated from comments and identifiers involved in source code as well as commit logs, and then topics are derived from generated documents. Finally, the evolutions of derived topics are visualized by linking the information on each developer who contributed to the source code and each topic. A user of the proposed approach is expected to understand the activity of a developer from the visualization of the derived topics and their distributions. The case study mainly presents the topics derived from an open source project Columba and the discussion on them.%ソフトウェア開発プロジェクトでは,個々の開発者の活動がソフトウェアの品質に影響を与えると考えられており,開発プロセスの改善にはプロジェクト全体ではなぐ開発者単位でも行われるべきと考えられている.しかし,開発者の活動を逐一記録するのは困難である.通常ソフトゥェァ開発では構成管理システムが利用されており,開発で作成•編集されるソースコードや開発における不具合の修正履歴などを記録している.そこで,構成管理システムの1つであるパージヨン管理システムに記録されたデータから活動を可視化する手法を提案する.まず,ソースコードのコメントや識別子名,システムのコミットログからコミット単位でドキュメントを作成し,それをLDA(latent Dirichlet allocation)を用いてトピックの抽出を行う.次にドキュメントの基になったコミツトを行った開発者とドキュメントのトピック分布を用いてトピックの変化を可視ィ匕する.最後に抽出されたトピックと可視化されたトピックの変化から開発者の活動を推定する.本論文ではオープンソースソフトゥヱアブロジェクトのColumbaに提案手法を適用し得られた一部の特徴的なトピックを中心に結果と考察を述べる.
机译:在软件开发过程中,单个开发人员的活动被认为会影响软件质量。不仅要对项目进行过程改进,还应对单个开发人员进行过程改进。但是,很难连续保持开发者活动的记录。最近的软件开发使用配置管理系统,该系统保留源文件创建和修改以及错误修复的记录。在本文中,我们提出了一种使用版本控制系统中的记录来可视化单个开发人员的活动的方法。在该方法中,首先,从源代码中涉及的注释和标识符以及提交日志中生成用于潜在Dirichlet分配输入的文档,然后从生成的文档中派生主题。最后,通过链接有关对源代码和每个主题做出贡献的每个开发人员的信息,可以直观地显示派生主题的演变。预期所提议方法的用户将从派生主题及其分布的可视化中了解开发人员的活动。该案例研究主要介绍了来自开源项目Columba的主题以及有关它们的讨论。しかしロジェクト全体ではなぐ开発者単位でも行われるべきと考えられている。しかし,开発者の活动を逐一记录するのは困难である。通常ソフトゥェァゥェァ作成•编集,ソースコードのコメントや识别子名,システムのコミットログからコミット単位でドキュメントを作成し,それをLDA(潜在狄利克雷分配)を用いてトピックの抽出を行う。た発発発発発発ににににににににににににににににに本本本本本本。アブロジェクトのColumbaに实施手法を适用し得られた一部の特徴的なトピックを中心に结果と考察を述べる。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号