概率论——Wasserstein距离Wasserstein 距离又叫 Earth Mover 距离 EM 距离 用于衡量两个分布之间的距离 定义 W P1 P2 inf P1 P2 E x y x y W P 1 P 2 inf gamma sim Pi P 1 P 2 mathbbE x y sim gamma x y P1 P2 Pi P 1 P 2 是 P1P
Wasserstein距离又叫Earth-Mover距离(EM距离),用于衡量两个分布之间的距离,定义:
W ( P 1 , P 2 ) = inf γ ∼ Π ( P 1 , P 2 ) E ( x , y ) ∼ γ [ | | x − y | | ]
Π ( P 1 , P 2 ) 是 P 1 和 P 2 分布组合起来的所有可能的联合分布的集合。对于每一个可能的联合分布 γ ,可以从中采样 ( x , y ) ∼ γ 得到一个样本 x 和 y ,并计算出这对样本的距离 | | x − y | | ,所以可以计算该联合分布 γ 下,样本对距离的期望值 E ( x , y ) ∼ γ [ | | x − y | | ] 。在所有可能的联合分布中能够对这个期望值取到的下界 inf γ ∼ Π ( P 1 , P 2 ) E ( x , y ) ∼ γ [ | | x − y | | ] 就是Wasserstein距离。
直观上可以把 E ( x , y ) ∼ γ [ | | x − y | | ] 理解为在 γ 这个路径规划下把土堆 P 1 挪到土堆 P 2 所需要的消耗。而Wasserstein距离就是在最优路径规划下的最小消耗。所以Wesserstein距离又叫Earth-Mover距离。
Wessertein距离相比KL散度和JS散度的优势在于,即使两个分布的支撑集没有重叠或者重叠非常少,仍然能反映两个分布的远近。而JS散度在此情况下是常量,KL散度可能无意义。
W ( P 1 , P 2 ) = sup | | f | | L ≤ 1 E x ∼ P 1 [ f ( x ) ] − E x ∼ P 2 [ f ( x ) ]
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/212637.html 原文链接:https://javaforall.net