概要
MRR = Mean Reciprocal Rank
ランキングアルゴリズムの性能を評価する指標の1つ。
計算方法
$\vert Q \vert$ 個の評価用検索クエリ $q_i\,(i=1,\cdots,\vert Q \vert)$ によるランキング結果に関して、クエリに適合するドキュメントが最初に現れる順位を $r(q_i)$ とする。
\[\mathrm{MRR} = \cfrac{1}{\vert Q \vert} \sum_{i=1}^{\vert Q \vert} \cfrac{1}{r(q_i)}\]具体例:4つのクエリ $q_1,q_2,q_3,q_4$ について、ランキングモデルの検索結果が以下のようになったとき(o:正解、x:不正解)
順位 $r$ | 1 | 2 | 3 | 4 | 5 | 6 | 7 | $\cdots$ | 初めて正解ドキュメントが当たる順位 |
---|---|---|---|---|---|---|---|---|---|
$q_1$ | o | o | x | o | o | x | x | $\cdots$ | 1 |
$q_2$ | x | o | x | x | x | o | x | $\cdots$ | 2 |
$q_3$ | x | o | o | o | o | o | o | $\cdots$ | 2 |
$q_4$ | x | x | x | x | o | x | o | $\cdots$ | 5 |
特徴
ランキング結果の最初の正解だけに焦点を合わせる(2番目以降の正解には注目しない)。
- 最適な結果1つだけが重要な場合など、対象を絞った用途のランキングの評価に適する
- 前述の具体例における $q_2$ と $q_3$ のように、検索結果のリスト全体で見ると正解率が全く異なる場合でも、初めて正解になる順位が同じなら同じ重みになる
- → トップ1件ではなく関連アイテムのリストを参照したいユーザーにとっては適切な評価指標ではない可能性あり