csv 转 ffm[通俗易懂]

csv 转 ffm[通俗易懂]1.FFM介绍FFM最初的概念来自Yu-ChinJuan与其比赛队员,是他们借鉴了来自MichaelJahrer的论文中的field概念提出了FM的升级版模型。通过引入field的概念,FFM把相同性质的特征归于同一个field。FFM模型不同于常见的DataFrame格式文件,需要将数据格式转换成如下所示的格式:yfield_1:index_1:value_1…

大家好,又见面了,我是你们的朋友全栈君。

1. FFM介绍

 FFM最初的概念来自Yu-Chin Juan与其比赛队员,是他们借鉴了来自Michael Jahrer的论文中的field概念提出了FM的升级版模型。通过引入field的概念,FFM把相同性质的特征归于同一个field。
FFM 模型不同于常见的DataFrame格式文件,需要将数据格式转换成如下所示的格式:
 

y   field_1:index_1:value_1 field_2:index_2:value_2   …

0           0:0:0.1      1:1:0.5                 …

0           0:0:0.2      1:2:0.3                 …

1           0:0:0.2      1:2:0.3                 …

且满足一下三个要求:

1. 样本归一化:对样本进行归一化,否则容易造成数据溢出,梯度计算失败。

2. 特征归一化:为了消除不同特征取值范围不同造成的问题,需要对特征进行归一化。

3.省略零值特征:零值特征对模型没有任何贡献,省略零值特征,可以提高FFM 模型训练和预测的速度,这也是稀疏样本采用FFM  的显著优势

2. code

原始代码详将我的github:https://github.com/tide1994cc/csv2ffm

跪谢大家给的小星星~~~

处理代码如下,可以直接import 使用,使用方法非常简单,导入数据,然后实例化一个ffm对象即可,自动将转换后的数据保存在本地。创建对象时,如要的两个参数是 分类列是那些lie,用list表示,标签列是哪一列。也用list表示。详细使用方式如下:

csv 转 ffm[通俗易懂]

部分原始处理代码如下:

csv 转 ffm[通俗易懂]

 

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/146230.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • DECLARE在SQL中的用法及相关等等

    DECLARE在SQL中的用法及相关等等:arrow:允许用户创建游标,用于在一个大的查询里面检索少数几行数据。变量是在批处理或过程的主体中用DECLARE语句声明的,并用SET或SELECT语句赋值。游标变量可使用此语句声明,并可用于其他与游标相关的语句。除非在声明中提供值,否则声明之后所有变量将初始化为NULL。Transact-SQL语法约定语法DECLARE{…

    2022年8月20日
    10
  • unity3D场景_3D夜晚场景

    unity3D场景_3D夜晚场景在学习阿发你好的网课过程中,学习完Unity的2D课程后深有感触,决定将3D学习过程一步步记录下来,也方便日后查询。创建3D项目Step1:在UnityHub中新建3D项目Step2:将页面调整为2×3布局(项目中通常使用2×3)新建项目选择window->layouts->2by3选择window->General->Console调出控制台认识3D场景天空盒skybox:上有蓝天,下有深渊,在计算机图形学学习过程中就有所涉及。ALT+鼠标

    2022年8月10日
    14
  • mp3文件结构_mp3格式特点

    mp3文件结构_mp3格式特点MP3音频文件结构解析,包括文件首部的ID3V2、数据帧、以及位于文件末尾128字节的ID3V1等信息。

    2022年9月6日
    5
  • Velocity语法大全

    Velocity语法大全一、基本语法 1、”#”用来标识Velocity的脚本语句,包括#set、#if、#else、#end、#foreach、#end、#iinclude、#parse、#macro等; 如: #if($info.imgs) <imgsrc=”$info.imgs”border=0> #else <imgsrc=”noPhoto.jpg”> #end2、”$”用来标识一个对象(或理解为…

    2022年7月14日
    14
  • java中的next()方法,nextline()方法,hasnext()方法的用法系列(1)。

    java中的next()方法,nextline()方法,hasnext()方法的用法系列(1)。这是王秀秀的第23篇博客????看下方目录next()方法nextline()方法hasnext()方法最近本菜鸡做题呀,遇到了一些很好玩的事情,那就是scanner类中的一些方法,经过了解后,真挺好玩的。next()方法话不多说上代码importjava.util.Scanner;publicclassnext_and_nextline{ publicstaticvoid…

    2022年5月25日
    45
  • linux date -d 的一些使用方法[通俗易懂]

    linux date -d 的一些使用方法

    2022年1月27日
    32

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号