SGD（随机梯度下降）详解

全栈程序员-站长 • 2026年3月16日下午8:12 • 未分类 • 阅读 1

SGD（随机梯度下降）详解BGDvsSGDBGDv 名词解释功能快捷键合理的创建标题有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中居左居右 SmartyPants 创建一个自定义列表如何创建一个注脚注释也是必不可少的 KaTeX 数学公式新的甘特图功能丰富你的文章 UML 图表 FLowchart 流程图导出与导入导出导入 BGDvsSGD

SGD（随机梯度下降）详解

名词解释
SGD vs BGD

名词解释

名词	定义
original-loss	整个训练集上的loss
minibatch-loss	在一个mini batch上的loss
BGD	最原始的梯度下降算法，为了计算original-loss上的梯度，需要使用训练集全部数据
SGD	（近似）计算original-loss梯度时，只使用一个mini batch，相当于用minibatch-loss上的梯度去近似original-loss梯度
奇点（只是为了方便说明而起的名字）	local minimal和saddle point

SGD vs BGD

下面将通过BGD与SGD的对比，来对SGD进行深入理解。

效率方面

深度学习使用的训练集一般都比较大（几十万～几十亿）。而BGD算法，每走一步（更新模型参数），为了计算original-loss上的梯度，就需要遍历整个数据集，这显然是不现实的。而SGD算法，每次随机选择一个mini-batch去计算梯度，在minibatch-loss上的梯度显然是original-loss上的梯度的无偏估计，因此利用minibatch-loss上的梯度可以近似original-loss上的梯度，并且每走一步只需要遍历一个minibatch（一～几百）的数据。

优化方面

SGD优势

SGD劣势

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/227925.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

css字体设置透明度,CSS字体透明度怎么设置？

上一篇 2026年3月16日下午8:12

下一篇 2026年3月16日下午8:12

phpspreadsheet 读取 Excel 表格问题

phpspreadsheet 读取 Excel 表格问题要读取大量数据，需要ReadFilter，指定读取范围，下面是我的ReadFilter类<?phpnamespacecommon\models;classMyExcelReadFilterimplements\PhpOffice\PhpSpreadsheet\Reader\IReadFilter{private$startRowNo;//如1private$endRowNo;//如1000private$

全栈程序员-站长
2025年12月12日
4
leetcode-7整数反转「建议收藏」

leetcode-7整数反转「建议收藏」原题链接给你一个 32 位的有符号整数 x ，返回将 x 中的数字部分反转后的结果。如果反转后整数超过 32 位的有符号整数的范围 [−231, 231 − 1] ，就返回 0。假设环境不允许存储 64 位整数（有符号或无符号）。示例 1：输入：x = 123输出：321示例 2：输入：x = -123输出：-321示例 3：输入：x = 120输出：21示例 4：输入：x = 0输出：0class Solution {public: int rever

全栈程序员-站长
2022年8月8日
7
oracle 视图编辑保存,oracle 视图

oracle 视图编辑保存,oracle 视图视图是一个抽象的概念简单的说就是把表中的部分我们关注的内容保存一份出来到视图中这样我们每次就不需要通过那么多字段的表去查询数据只需要通过已经过滤出来的我们关系的数据中视图中取我们需要的数据进一步说就是从一张大的表数据中抽离出来一部分我们关注的数据这部分数据就是可以存放在视图中向视图提供数据内容的语句为 SELECT 语句可以将视图理解为存储起来的 SELECT 语句 oracle

全栈程序员-站长
2026年3月19日
2
unity不同骨骼模型公用动画_为何unity的模组映射为0

unity不同骨骼模型公用动画_为何unity的模组映射为0

全栈程序员-站长
2026年1月21日
4
【搜索引擎】强推！最好用资源最全的十个百度网盘搜索引擎

【搜索引擎】强推！最好用资源最全的十个百度网盘搜索引擎1.去转盘网网址：https://www.quzhuanpan.com/点击进入网站说明：大部分资源免费，部分为VIP资源（不影响基本使用）2.盘多多网址：http://www.panduoduo.online/点击进入网站说明：搜索方便，可选择资源类型3.云盘精灵网址：https://www.yunpanjingling.com/点击进入网站说明：搜索资源后可按照最新时间显示资源4.大力盘搜索网址：https://www.dalipan.com/点击进入网站说明：页面设计简洁

全栈程序员-站长
2022年5月23日
95
idea

pychan激活码【在线注册码/序列号/破解码】

pychan激活码【在线注册码/序列号/破解码】，https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧！

全栈程序员-站长
2022年3月20日
52

发表回复

关注全栈程序员社区公众号