长尾分布(long-tail distribution)和长尾效应「建议收藏」

长尾分布(long-tail distribution)和长尾效应「建议收藏」长尾分布(long-taildistribution)和长尾效应1、长尾效应作者:赵澈链接:https://www.zhihu.com/question/20027490/answer/20420381来源:知乎长尾效应其实是幂率分布的通俗提法,在物理上也被称为无标度现象,这种现象在自然界与社会生活中都相当地常见,可参考幂律分布_互动百科。里面也提到之所以叫无标度,是因为「系统中个体的尺度相差悬殊,缺乏一个优选的规模」。如下图这般,极少数个体(横轴)对应极高的值(纵轴),而拥有极低值的个体,数

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

长尾分布(long-tail distribution)和长尾效应

1、长尾效应

作者:赵澈
链接:https://www.zhihu.com/question/20027490/answer/20420381
来源:知乎

长尾效应其实是幂率分布的通俗提法,在物理上也被称为无标度现象,这种现象在自然界与社会生活中都相当地常见,可参考幂律分布_互动百科。里面也提到之所以叫无标度,是因为「系统中个体的尺度相差悬殊,缺乏一个优选的规模」。

如下图这般,极少数个体(横轴)对应极高的值(纵轴),而拥有极低值的个体,数量却占总体的绝大多数。形象地描述可称曲线靠近纵轴的部份为tall head,而靠近横轴的部份则是所谓的long tail:
长尾分布(long-tail distribution)和长尾效应「建议收藏」

据维基百科:長尾(英語:The Long Tail),或譯長尾效應,最初由《連線》的總編輯克里斯·安德森(Chris Anderson)於2004年發表於自家的雜誌中[1],用來描述諸如亞馬遜公司、Netflix和Real.com/Rhapsody之類的網站之商業和經濟模式。是指那些原來不受到重視的銷量小但種類多的產品或服務由於總量巨大,累積起來的總收益超過主流產品的現象

因此长尾效应这个提法,强调的是那些数量占绝大多数的个体的商业价值,它们单个的值虽然极低,但是这个长长的尾巴,总和不可小觑。而长尾之所以常常与互联网、电子商公司放在一起,主要是因为互联网与IT技术的发展使产品与服务的信息到达用户的平均成本降到了极低的值。幂率分布在海量产品信息与用户信息的情形下表现得尤其明显,并且被这些公司较早加以了良好利用。

以下拿网店与线下商店对比为例:

网店相当于用极小的成本,便换来几乎无限长的货架,可以同时包括大热门以及几乎无人问津的众多冷门。这众多冷门带来的效益总和则相当可观,甚至可以去与几个大热门相较量。用一个不恰当的比喻,「蚁多咬死象」。相较而言,线下实体商店由于可观的空间等成本是无法做到同样的事情的,边际效益不允许。

从用户的角度看,即使再小众的需求也可能通过互联网平台得以满足,相当于毫不费力逛一个无限大的、能尽可能满足自己的超级市场,可以说只要是世上存在的,都可能唾手可「见」(当然这是一种极为理想的描绘,实际的状况很大程度上依赖于技术的发展,比如搜索引擎、个性化推荐等,这裡暂且不谈)。之所以我不说唾手可「得」,是因为有物流这个实物类电子商贸无法逃避的瓶颈;O2O等服务类商品则也难以回避实际的消费一定发生在线下这一问题。即使消费者与商品之间碰撞出火花所需的时间再短,终不得不考虑这漫长多艰的蜀道难。这也是线下商店不会被电子商贸轻易打垮的重要原因之一。而手机话费、游戏点卡这类的虚拟(或者说完全数字化)商品,包括现在很热的网络金融产品,在这方面则受到很小的影响。

这种在电子商贸领域中的现象同样能够在其他互联网应用特别是平台化的应用上见到,比如多媒体内容分享平台、网络社区等。这时用户所拥有的值就从对商品或服务的需求(可能还对应为他们为实现这一需求愿意付出的代价)变成了对有趣、有价值的信息的需求(也可能对应愿付出的代价,当然这时可能更像是时间、精力这样的代价)。而这些信息同样主要来自于用户,也就是所谓的UGC。这种生产的长尾与需求的长尾同时作用,便是我所理解的Web 2.0的一个重要特徵。

现在也有不少其他领域借鉴了长尾这个说法,用以描述各自领域内的幂率分布现象。此外值得一提的是,幂率分布与正态分布都给人一种用以区分大多数与极少数的印象,但是正态分布的大多数集中于中间,极少数则分居两端,是个倒挂金钟的形状,二者描绘的其实是极为不同的现象。

2、长尾分布(和重尾分布即幂律分布)

Zipf分布是一种符合长尾的分布:

在这里插入图片描述

就是指尾巴很长的分布。那么尾巴很长很厚的分布有什么特殊的呢?有两方面:一方面,这种分布会使得你的采样不准,估值不准,因为尾部占了很大部分。另一方面,尾部的数据少,人们对它的了解就少,那么如果它是有害的,那么它的破坏力就非常大,因为人们对它的预防措施和经验比较少。也要所谓的二八法则。
https://www.cnblogs.com/huangshiyu13/p/6217180.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/215931.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • vue中父组件向子组件传值

    vue中父组件向子组件传值首先在以下案例中,App.vue是父组件,Second-module.vue是子组件。总体来说,父传子就是这四个步骤:父组件的data中定义值,引入并调用子组件,在引用的子组件的标签上通过v-bind指令给子组件传值,子组件通过在data中定义的props属性接收父组件传过来的值然后应用到子组件里。首先,值肯定是定义在父组件中的,供所有子组件共享,所以要在父组件的data中定义值:…

    2022年6月5日
    35
  • hash碰撞解决方法

    hash碰撞解决方法Hash碰撞冲突我们知道,对象Hash的前提是实现equals()和hashCode()两个方法,那么HashCode()的作用就是保证对象返回唯一hash值,但当两个对象计算值一样时,这就发生了碰撞冲突。如下将介绍如何处理冲突,当然其前提是一致性hash。1.开放地址法开放地执法有一个公式:Hi=(H(key)+di)MODmi=1,2,…,k(k<=m-1)其中,m为哈希表的表长。…

    2022年6月17日
    46
  • 慧荣PT项目见疑「建议收藏」

    慧荣PT项目见疑「建议收藏」

    2022年6月3日
    32
  • springboot实现拦截器_spring拦截器和过滤器

    springboot实现拦截器_spring拦截器和过滤器集成拦截器登录验证为例添加拦截器public class LoginInterceptor implements HandlerInterceptor { private Logger log = LoggerFactory.getLogger(getClass()); //Controller逻辑执行之前 @Override public boolean preHandle(HttpServletRequest request, HttpServletRe

    2022年8月9日
    1
  • 找工作必会的经典7大Python面试题!

    找工作必会的经典7大Python面试题:交换变量值;is和==的区别;可变对象和不可变对象;连接字符串用join还是+;理解__new__和__init__的区别;with与上下文管理器With基本语法;finally的理解。

    2022年1月18日
    64
  • 提问艺术「建议收藏」

    提问艺术「建议收藏」提问的艺术相信大部分老鸟当年都看过这篇经典的文章。在这里在转一次,以帮助大家能更好地问问题,以便获得更好的回答。先贴结论吧最后,不管是谁,来这里回答问题都是凭一腔热忱,凭兴趣和心情,如果版面充斥让人没有兴趣回答的问题,我想,对大家都不是好消息。自力更生真的很重要,不管你水平如何遇到什么样的困难,能自己解决多少就解决多少,然后再来求助,说需要什么什么帮助,多做一些努力只有好处

    2022年6月23日
    27

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号