宽度 & 深度学习 特点对比

宽度 & 深度学习 特点对比宽度&深度学习特点对比推荐系统模型介绍实验过程与实验结果实验总结  为了提高神经网络的性能,是应该增加宽度呢?还是应该增加深度呢?增加宽度和增加深度各有什么样的效果呢?本文对论文《Wide&DeepLearningforRecommenderSystemsHeng-Tze》中关于宽度模型和深度模型的对比实验进行介绍。推荐系统  本论文基于推荐系统,推荐系…

大家好,又见面了,我是你们的朋友全栈君。

  为了提高神经网络的性能,是应该增加宽度呢?还是应该增加深度呢?增加宽度和增加深度各有什么样的效果呢?
本文对论文《Wide & Deep Learning for Recommender Systems Heng-Tze》中关于宽度模型和深度模型的对比实验进行介绍。

推荐系统

  本论文基于推荐系统,推荐系统的运作如图。以APP推荐为例,首先用户在查询入口输入关键字,系统自动将Database中的items对关键字进行匹配,从而Retrieval一定的items,这些items将根据之前使用用户的各种行为数据logs学习到的model进行Ranking,从而将用户更可能下载的APP排在前面。

在这里插入图片描述

模型介绍

  这里的模型,是针对上图中的Model模型。作者提及在推荐系统中最重要的两个特性是Memorize和generalize。Memorize的过程就是根据以往用户的数据训练模型的过程,类似training;generalize就是使用model对新的输入数据进行预测。
  作者对比了三种模型,如下图,分别是宽度模型(wide models),深宽结合模型(wide&deep models)深度模型(deep models)。对于各模型的特点理解,故名思意,不做更多解释。
在这里插入图片描述

实验过程与实验结果

  作者进行了3周的实时在线实验。对于对照组,作者随机选择1%的用户,并提供由之前版本的排名模型生成的推荐建议,这是一种高度优化的仅限广泛的逻辑回归模型,具有丰富的跨产品特征转换。对于实验组,1%的用户会收到由Wide&Deep models生成的建议,并使用相同的功能集进行训练。如表1所示,Wide&Deep models相对于对照组,应用程序商店主登陆页面上的应用程序获取率提高了3.9%(统计上显着)。结果也与另一个1%组进行比较,仅使用具有相同特征和神经网络结构的模型的深部,并且Wide&Deep models在仅deep models之上具有+ 1%的增益(具有统计显着性)。

在这里插入图片描述

  除了在线实验,作者器操作员特征曲线下面积(AUC)。 虽然Wide&Deep的离线AUC略高,但对在线流量的影响更为显着。 一个可能的原因是离线数据集中的印象和标签是固定的,而在线系统可以通过将概括与记忆相结合来产生新的探索性建议,并从新的用户响应中学习。

实验总结

  记忆和概括对于推荐系统都很重要。 宽线性模型可以使用跨产品特征转换有效地记忆稀疏特征交互,而深度神经网络可以通过低维嵌入来生成以前看不见的特征交互。作者介绍了Wide&Deep学习框架,以结合两种模型的优势。 作者在Google Play的推荐系统上制作并评估了该框架,Google Play是一个大规模的商业应用商店。 在线实验结果表明,Wide&Deep models在仅wide和仅deep models上的应用程序获取方面取得了显着改进。

  通俗地讲
  1.wide models能够从训练数据中学习到重要的特征,对训练数据达到高度拟合。但是更换数据后,数据特征改变,wide models的预测能力就会下降,所以说,wide models的泛化能力不够;
  2.deep models能够从训练数据中挖掘出更抽象的特征,这使得它具有很好的泛化能力,但是对单组数据来说,它的拟合能力比不上wide models;
  3.wide&deep models的结构类似于卷积神经网络中将不同级别的特征层信息进行融合使用,既有低级纹理信息又有高级语义信息;
  4.第一条和第二条还可以这样说,wide models容易过拟合,deep models不易过拟合。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/143597.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • http的幂等性[通俗易懂]

    一.什么是幂等性幂等(idempotent):在编程中.一个幂等操作的特点是其任意多次执行所产生的影响均与一次执行的影响相同.幂等函数,或幂等方法,是指可以使用相同参数重复执行,并能获得相同结果的函数。这些函数不会影响系统状态,也不用担心重复执行会对系统造成改变。例如,“setTrue()”函数就是一个幂等函数,无论多次执行,其结果都是一样的.更复杂的操作幂等保证是利用唯一交易号(流水号)实

    2022年4月17日
    64
  • go语言要学多久才能工作_go语言可以开发什么

    go语言要学多久才能工作_go语言可以开发什么我在2011年就听说了Go并学习了一段时间,坦白的说,那时候对Go是比较无感的,因为并没有看到Go的特别亮眼的地方,可能和我使用C、Erlang、Java有关,这三种语言可以写高性能、高并发、高可用的服务;包含了面相过程、面向并发、面向对象的思想,我觉得我并不需要再学习Go,何况那个时候好像也没宣传的那么优秀。 一切都发生在418天前,因为工作的需要,我开始写Go了,本来预期是一段压抑、蛋疼的旅程

    2022年10月5日
    5
  • OpenCV学习之路–5–OpenCV3.4.10的ARM版本移植到开发板

    OpenCV学习之路–5–OpenCV3.4.10的ARM版本移植到开发板开发板:迅为IMX6Q移植QTE5.7编译好的ARM版本OpenCV3.4.10文件:OpenCV3.4.10ARM版编译好的OpenCV依赖库文件:1.将/usr/local/arm/opencv-arm/lib/下的库拷贝到开发板相同目录及/lib/下mkdir/home/topeet/iMX6Q/qt/usr/local/arm/opencv-armcd/usr/local/arm/opencv-arm/cp-r*/home/topeet/iM…

    2022年10月14日
    4
  • SD/MMC卡初始化及读写流程[通俗易懂]

    SD/MMC卡初始化及读写流程[通俗易懂]二、MMC/SD卡的模型和工作原理PIN脚、SD卡总线、SD卡结构、SD卡寄存器、上电过程SD卡寄存器: OCR:操作电压寄存器:只读,32位第31位: 表示卡上电的状态位  CID:卡身份识别寄存器只读128位生产厂商、产品ID,生产日期和串号等  CSD:部分可写128位卡的容量、擦出扇区大小、读写最大数据块的大小、读操作的电流、电压等等 

    2022年5月20日
    43
  • 程序解码错误:Accept-Encoding“: “gzip, deflate, br[通俗易懂]

    程序解码错误:Accept-Encoding“: “gzip, deflate, br[通俗易懂]请求头设置”Accept-Encoding”:”gzip,deflate,br”返回的数据是乱码,无论设置utf-8、gbk、gb2312都无法解码一个奇怪的现象是本地测试可以正常解码,代码在服务器上运行就无法解码,最终将该请求头去除就正常了。…

    2022年7月15日
    54
  • js跳转页面并刷新(本页面跳转)

    1、跳转常用方法:window.location.href=”index.php”;window.history.back(-1);//类似于按钮,参数是负几,就后退几次。window.navigate(“index.jsp”);//navigate对象包含有关浏览器的信息,也可以作为页面跳转,后面直接加要跳转的地方。self.location.href=index.htm;

    2022年4月11日
    50

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号