行がユーザー、列がアイテム。セルの色が評価値(1〜5)、ハッチングが未評価セルです。黄枠が予測対象セル、青枠が選ばれた近傍ユーザーの行を示します。
$$\hat r_{u,i}=\bar r_u+\frac{\sum_{v\in N}\text{sim}(u,v)\,(r_{v,i}-\bar r_v)}{\sum_{v\in N}|\text{sim}(u,v)|}$$
ユーザー $u$ のアイテム $i$ への予測評価 $\hat r_{u,i}$。$N$ はアイテム $i$ を評価した中で最も類似度の高い $k$ 人の集合、$\bar r_u$ はユーザー $u$ の平均評価です。
$$\text{cos}(u,v)=\frac{\sum_{j} r_{u,j}\,r_{v,j}}{\sqrt{\sum_j r_{u,j}^2}\,\sqrt{\sum_j r_{v,j}^2}}$$
コサイン類似度。$j$ は $u$ と $v$ が共通して評価したアイテムを走ります。2人の評価ベクトルのなす角が小さいほど 1 に近づきます。
$$\text{pear}(u,v)=\frac{\sum_{j}(r_{u,j}-\bar r_u)(r_{v,j}-\bar r_v)}{\sqrt{\sum_j(r_{u,j}-\bar r_u)^2}\,\sqrt{\sum_j(r_{v,j}-\bar r_v)^2}}$$
ピアソン相関。各ユーザーの平均評価を引いてから相関を取るため、採点の甘い・辛いのクセを補正できます。