batch内负采样

全栈程序员-站长 • 2022年6月23日下午11:16 • 未分类 • 阅读 75

batch内负采样一般在计算softmax交叉熵时，需要用tf.nn.log_uniform_candidate_sampler多itemid做随机负采样。但是在类似dssm这种双塔模型中，item侧特征除了itemid外，还有其他meta特征，此时负样本对itemid做负采样后，还需要取相应负样本的meta特征。可是在tf训练数据中并不方便建立itemid与各类meta特征的映射表。为了解决dssm类模型的负采样问题，可以取一个batch内其他用户的正样本做为本用户的负样本，以解决负采样meta特征问题。好了，废话少说，

大家好，又见面了，我是你们的朋友全栈君。

一般在计算softmax交叉熵时，需要用tf.nn.log_uniform_candidate_sampler对itemid做随机负采样。但是在类似dssm这种双塔模型中，item侧特征除了itemid外，还有其他meta特征，此时负样本对itemid做负采样后，还需要取相应负样本的meta特征。可是在tf训练数据中并不方便建立itemid与各类meta特征的映射表。
为了解决dssm类模型的负采样问题，可以取一个batch内其他用户的正样本做为本用户的负样本，以解决负采样meta特征问题。好了，废话少说，直接上代码

     for i in range(NEG):
        rand = int((random.random() + i) * batchSize / NEG)
        item_y = tf.concat([item_y,
                            tf.slice(item_y_temp, [rand, 0], [batchSize - rand, -1]),
                            tf.slice(item_y_temp, [0, 0], [rand, -1])], 0)
      prod_raw = tf.reduce_sum(tf.multiply(tf.tile(user_y, [NEG + 1, 1]), item_y), 1, True)
      prod = tf.transpose(tf.reshape(tf.transpose(prod_raw), [NEG + 1, batchSize])) 
      # 转化为softmax概率矩阵。
      prob = tf.nn.softmax(prod)
      # 只取第一列，即正样本列概率。
      hit_prob = tf.slice(prob, [0, 0], [-1, 1])
      loss = -tf.reduce_mean(tf.log(hit_prob))

代码注解：
其中item_y和item_y_temp 初始化为item侧最后一层embedding值，shape为[batchSize, emb_size]。
user_y为user侧最后一层embedding值，shape为[batchSize, emb_size]。
NEG为负采样个数，batchSize为batch大小。

在每次循环中，通过rand值打乱item_y_temp的行顺序，相当于取其他用户的正样本做为本用户的负样本
经历NEG次循环后，item_y的shape变为[(NEG+1)*batchSize, emb_size]；注：item_y初始值有batchSize行，每次循环累加batchSize行
与user_emb点乘后，prod_raw的shape为[(NEG+1)*batch_size,1]，
经过reshape和转置后，prod的shape为[batch_size,(NEG+1)]；注：prod的第一列为正样本，其他列为负样本。

后面即可计算出采样后的softmax交叉熵了。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/149671.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

LARS算法的几何意义

上一篇 2022年6月23日下午11:16

常见的测试用例设计方法有哪些呢？「建议收藏」

下一篇 2022年6月23日下午11:16

「镁客·请讲」百融金服张韶峰：为迎接大数据金融的风口，我们已准备了8年…[通俗易懂]

「镁客·请讲」百融金服张韶峰：为迎接大数据金融的风口，我们已准备了8年…

全栈程序员-站长
2022年3月13日
47
Netty学习之读netty权威指南（一）

Netty学习之读netty权威指南（一）大家问我为什么读这个来学netty，嗯嗯嗯？？我也说不上来，因为我以前看过某个培训班的课程，初步了解了一下netty，但是现在回想一下发现我所有的知识基本忘光了，不过没关系，慢慢来，一点一点的找回来不久好了吗，现在开始咱们读一读Netty权威指南这本书，学习一下Netty。当然了不会全部按照这本书来，我会加上自己学习的东西。I/O演进之路JDK1.4以前Java对IO的支持不完…

全栈程序员-站长
2022年10月2日
3
又被鹅厂问懵逼了：TCP 四次挥手收到乱序的 FIN 包会如何处理？

又被鹅厂问懵逼了：TCP 四次挥手收到乱序的 FIN 包会如何处理？大家好，我是小林。收到个读者的问题，他在面试鹅厂的时候，被搞懵了，因为面试官问了他这么一个网络问题：不得不说，鹅厂真的很喜欢问网络问题，而且爱问异常情况下的网络问题，之前也有篇另外一个读者面试鹅厂的网络问题：「被鹅厂面怕了！」。不过这道鹅厂的网络题可能是提问的读者表述有问题，因为如果FIN报文比数据包先抵达客户端，此时FIN报文其实是一个乱序的报文，此时客户端的TCP连接并不会从FIN_WAIT_2状态转换到TIME_WAIT状态。因此，我们要关注到点是看「在FIN_WAI

全栈程序员-站长
2022年5月8日
48
Linux系统查看CPU使用率、内存使用率、磁盘使用率

Linux系统查看CPU使用率、内存使用率、磁盘使用率一查看 CPU 使用率 1 top 命令 top 命令可以看到总体的系统运行状态和 cpu 的使用率 us 表示用户空间程序的 cpu 使用率没有通过 nice 调度 sy 表示系统空间的 cpu 使用率主要是内核程序 ni 表示用户空间且通过 nice 调度过的程序的 cpu 使用率 id 空闲 cpu wa cpu 运行时在等待 io 的时间 hi cpu 处理硬中断的数量 si cpu 处理软中断

全栈程序员-站长
2026年3月19日
2
from django.db import models_独立团模块源码

from django.db import models_独立团模块源码前言APIView中的dispatch是整个请求生命过程的核心方法，包含了请求模块，权限验证，异常模块和响应模块，我们先来介绍请求模块请求模块：request对象源码入口APIView类中di

全栈程序员-站长
2022年7月31日
7
武后：像输入英文一样输入中文

武后：像输入英文一样输入中文原文：TypingChineselikeEnglish作者：tedclancy翻译：赖信涛责编：仲培艺很长时间以来，我都希望输入中文能像输入英文一样。我的意思是，当你第一次看到中文键盘的时候，就知道如何输入中文，无论你的母语是什么。无需学习输入法（如仓颉）。无需知道怎么说普通话，无需学习如何写中文——我希望中文就像英文一样，所见即所得。15年来，我都在为这个问题寻找一个解…

全栈程序员-站长
2022年7月16日
14

发表回复

关注全栈程序员社区公众号