深度推荐模型 -NFM

NFM(Neural Factorization Machines)是为了解决FM模型在表达特征交互时的局限性而提出的,它结合了FM的二阶交互和DNN的非线性学习能力。NFM通过引入特征交叉池化层,实现了FM与DNN的融合,能更好地建模复杂的数据结构。网络结构主要包括Input层、Embedding层、Bi-Interaction Pooling层、隐藏层和预测层,其中Bi-Interaction层是关键创新,它允许DNN学习更高级别的特征交互。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

NFM


参考 推荐系统遇上深度学习(七)–NFM模型理论和实践

提出背景 & 与其他模型的关系

NFM这个模型是在FM的基础上提出的,是为了改进FM模型只能表达特征之间两两组合之间的关系,无法建模两个特征之间深层次的关系或者说多个特征之间的交互关系,同时为了建模更高阶的特征而提出的。NFM是串行结构中一种较为简单的网络模型。

NFM(Neural Factorization Machines)是2017年由新加坡国立大学的何向南教授等人在SIGIR会议上提出的一个模型,**传统的FM模型仅局限于线性表达和二阶交互, 无法胜任生活中各种具有复杂结构和规律性的真实数据。**针对FM的这点不足,作者提出了一种将FM融合进DNN的策略,通过引进了一个特征交叉池化层的结构,使得FM与DNN进行了完美衔接,这样就组合了FM的建模低阶特征交互能力和DNN学习高阶特征交互和非线性的能力,形成了深度学习时代的神经FM模型(NFM)。

结构 描述 常见模型
并行结构 FM部分和DNN部分分开计算,只在输出层进行一次融合得到结果 DeepFM,DCN,Wide&Deep
串行结构 将FM的一次项和二次项结果(或其中之一)作为DNN部分的输入,经DNN得到最终结果 PNN,NFM,AFM

FM回顾

FM模型用n个隐变量来刻画特征之间的交互关系。这里要强调的一点是,n是特征的总数,是one-hot展开之后的,比如有三组特征,两个连续特征,一个离散特征有5个取值,那么n=7而不是n=3.

y ^ ( X ) = ω 0 + ∑ i = 1 n ω i x i + ∑ i = 1 n − 1 ∑ j = i + 1 n < v i , v j > x i x j \hat{y}(X) = \omega_{0}+\sum_{i=1}^{n}{\omega_{i}x_{i}}+\sum_{i=1}^{n-1}{\sum_{j=i+1}^{n} \color{red}{<v_{i},v_{j}>x_{i}x_{j}}} y^(X)=ω0+i=1nωixi+i=1n1j=i+1n<vi,vj>xixj
< v i , v j > = ∑ f = 1 k v i , f ⋅ v j , f <v_{i},v_{j}> = \sum_{f=1}^{k}{v_{i,f}\cdot v_{j,f}} <vi,vj>=f=1kvi,fvj,f

FM的化简公式也很重要:
KaTeX parse error: No such environment: align at position 8: \begin{̲a̲l̲i̲g̲n̲}̲ \sum_{i=1}^{n-…

  • v i , f v_{i,f} vi,f 是一个具体的值;
  • 第1个等号:对称矩阵 W W W 对角线上半部分;
  • 第2个等号:把向量内积 v i v_{i} vi,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值