Taka-Coma's Blog

http://taka-coma.pro/

ソフトウェア工学関係

概要

  • KDEソフトウェア工学が専門の先生がおるので,コラボして研究をちょこちょこ
  • ソフトウェア検索にファセット検索を導入
    • あまり良い需要が見つからなかったので座礁
  • 異なるサービス間のユーザの名寄せ
    • 分類問題として定式化
    • 90% の分類精度を達成
    • 精度や汎化性能を向上させたい

研究の進行

ソフトウェア部品検索へのファセット検索の適用

  • 導入として,ソフトウェアを構築するプロジェクトの情報から検索できるようにした
  • ソフトウェア内部の情報を利用する方法について検討
    • 適当な情報やそれを表現するファセットの設計でつまづき座礁

成果

  1. 駒水 孝裕, 早瀬 康裕, 北川 博之, “ソフトウェア部品検索に適したファセット探索の一考察”, 電子情報通信学会技術研究報告, Vol. 111, No. 268, IEICE-SS2011-30, pp. 19-24, 2011年10月

異なるサービス間のユーザの名寄せおよびその応用

  • ソフトウェア開発に関わるサービス(e.g., GitHub, StackOverflow)が増えてきている
  • それぞれのサービスでのユーザの行動分析が盛んに行われている
  • サービス間でのユーザの行動パターン分析にも関心が寄せられている
  • 名寄せ:既知の方法での名寄せではデータが少ない,という問題に取り組む
    • 分類問題に帰着させ,既存のアプローチを比較
    • Gradient Boosting Decision Tree や Random Forest で精度90%を達成
    • 今後はより洗練されたモデルを要検討
  • 応用:統一的な分析および分析を利用した推薦
    • ユーザの名寄せをもとに行動分析を行い,一方サービス上での行動が他方のサービス上での行動に影響を与える
    • 影響の伝搬を利用して,GitHubにおけるリポジトリ推薦に応用

成果

国際会議
  1. Takahiro Komamizu, Yasuhiro Hayase, Toshiyuki Amagasa, Hiroyuki Kitagawa, “Exploring Identical Users on GitHub and Stack Overflow”, in Proc. the 29th International Conference on Software Engineering and Knowledge Engineering (SEKE 2017), pp.584-589, Pittsburgh, USA, July 5-7, 2017
査読付き国内シンポジウム
  1. 永野 真知, 早瀬 康裕, 駒水 孝裕, 北川 博之, “GitHubとStack Overflowの開発者の活動記録を併用したリポジトリ推薦”, ソフトウェアエンジニアリングシンポジウム 2017, シンポジウム論文, 2017年8月31-2017年9月1日
国内シンポジウム
  1. 永野 真知, 早瀬 康裕, 駒水 孝裕, 北川 博之, “GitHubとStack Overflowにおけるユーザ行動の統一的な分析”, 情報処理学会 第79回全国大会 2017, 4J-04, 2017年3月16-18日
表彰
  1. 学生奨励賞(共著学生),情報処理学会 第79回全国大会, 2017年3月