推荐系统协同过滤算法——基于邻域的模型

最新推荐文章于 2022-12-16 22:23:12 发布

原创

最新推荐文章于 2022-12-16 22:23:12 发布 · 1.6k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文详细介绍了协同过滤中基于邻域的模型，包括相似度度量如皮尔逊相关系数，以及基于相似度的插值方法。通过讨论其优点，如直观性、可解释性和即时推荐能力，同时也指出标准模型存在的问题，如相似度函数的任意性、近邻物品相互作用的忽视和过拟合风险。文中还提出了联合派生插值权重以改进模型的准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

基于邻域的模型

基于邻域的模型

协同过滤领域最常见的方法就是基于领域的模型。其最原始的形式是基于用户的方法（详见文献[13]¹）：基于志趣相投的相似用户的评分记录来估计未知评分。

随后是一种类似的，基于物品的方法：使用同一个用户在相似物品上的评分来估计未知的评分

其具有更好的扩展性；
并提高了准确度；
能更好的解释预测背后的原因（用户对他之前喜欢的物品比较熟悉，但他们却不认识这些所谓志趣相投的人）。

一般来说，隐语义模型在描述数据的各方面具有很强的表达能力，因此其预测结果比基于邻域的模型要好。但是，基于领域的模型更加普遍，是因为：

1）基于邻域的模型，相对简单；
2）更重要的原因是，基于邻域的模型提供了推荐背后原因的直观解释——其不仅提高推荐的准确性；同时增强了用户体验；
3）基于邻域的模型，能够根据一个新进入系统的用户反馈立即提供推荐。

本节结构：

1）如何估计两个物品之间的相似度；
2）基于相似度的领域方法，及其一些特定限制；
3）解决这些问题的建议方法：以计算时间上微小的增加为代价，提高预测准确度。

1.相似度度量

相似度度量是基于物品方法的核心。

皮尔逊相关系数，仅仅是基于共同的用户支持，建议用基准预测器的残差来补偿特定用户和特定物品的偏差。

$\hat{\rho}_{ij} = \frac{\sum_{u \in U(i,j)} (r_{ui} - b_{ui} ) (r_{uj} - b_{uj} )}{\sqrt{\\ \sum_{u \in U(i,j)} (r_{ui} - b_{ui} )^2 · \sum_{u \in U(i,j)} (r_{uj} - b_{uj} )^2}\\ }\tag{3.15}$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。