FM和FFM原理

全栈程序员-站长 • 2022年5月20日下午7:00 • 未分类 • 阅读 50

大家好，又见面了，我是你们的朋友全栈君。

模型用途

FM和FFM，分解机，是近几年出的新模型，主要应用于广告点击率预估（CTR），在特征稀疏的情况下，尤其表现出优秀的性能和效果，也数次在kaggle上的数据挖掘比赛中拿到较好的名次。

FM原理

特征编码时常用的one-hot编码，会导致特征非常稀疏（很多0值）。常用的特征组合方法是多项式模型，模型表达式如下：

y (x) = w 0 + \sum i = 1 n w i x i + \sum i = 1 n \sum j = i + 1 n w i j x i x j

其中
xi
表示第i列特征，
n
表示特征数，
w0,wi,wij
为模型参数。模型参数为
n2
个。在对模型进行训练时，采用SGD(随即梯度下降)，由于特征较稀疏，大部分
wij
的梯度值为0，那么参数
wij
的值就不准确，会影响模型的效果。

FM模型，将参数
wij
对应的矩阵
W
，利用矩阵分解表示为
W=VTV
, 矩阵
V
∈Rk×n
, 可以通过调节k来调节模型的泛化能力。

k影响

FM模型则表示为：

y (x) = w 0 + \sum i = 1 n w i x i + \sum i = 1 n \sum j = i + 1 n < v i, v j > x i x j

模型参数减少为kn个。训练方法还是采用SGD，在预测时，可以通过下式将计算复杂度从
O(kn2)
降低为
O(kn)
：

\sum i = 1 n \sum j = i + 1 n < v i, v j > x i x j = 1 2 \sum f = 1 k ((\sum i = 1 n v i, f x i) 2 - \sum i = 1 n (v i, f x i) 2)

FFM 原理

FFM模型是在FM特征组合的基础上给特征加上了field属性，于是模型表示为

y (x) = w 0 + \sum i = 1 n w i x i + \sum i = 1 n \sum j = i + 1 n < v i, f j, v j, f i > x i x j

其中
fi
表示特征i所属的field，需要训练的
V
为
n×k×f
,
f
为field的个数，具体案例见
ppt

由于FFM加入field，使得训练和预测过程参数计算不能简化，复杂度为
O(kn2)

参考文献

转自：https://blog.csdn.net/Leo00000001/article/details/71330927?locationNum=13&fps=1

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/143838.html原文链接：https://javaforall.net

FM和FFM原理

模型用途

FM原理

FFM 原理

参考文献

相关推荐

高级C/C++编译技术之读书笔记（五）之动态库版本控制

八年phper的高级工程师面试之路八年phper的高级工程师面试之路

scp命令传文件

支付宝首席架构师_高并发用什么架构

QFile读写文件乱码[通俗易懂]

websocket和http的瓜葛以及websocket协议实现「建议收藏」

发表回复