類似しているGitHub Issue発見ツール Refissue を作りました
GitHubのIssueは便利ですが、複数人で利用しているとどうしても似たようなIssueが登録されてしまうことがあります。 そこで、類似しているIssueを自動的に検出してくれるRefissueというツールを作りました。
https://github.com/addsict/refissue
このツールを動かしておくと、Issueが登録された時に過去のIssueの中から似たようなIssueを探しだし、下の写真のようにコメントとして残してくれます。
本当に同一の内容の場合、登録したIssueをcloseするなり、まとめるなりしてIssueの重複を防げますね。
肝心の類似判定ですが、今はIssueのタイトルと本文を形態素解析したものの中からキーワードとなる形態素のみ抽出し、コサイン類似度法でIssue間の類似度を求めています。
類似判定の精度がまだまだイマイチな所はありますが、是非使ってみてください。