长尾分布(long-tail distribution)和长尾效应「建议收藏」

长尾分布(long-tail distribution)和长尾效应「建议收藏」长尾分布(long-taildistribution)和长尾效应1、长尾效应作者:赵澈链接:https://www.zhihu.com/question/20027490/answer/20420381来源:知乎长尾效应其实是幂率分布的通俗提法,在物理上也被称为无标度现象,这种现象在自然界与社会生活中都相当地常见,可参考幂律分布_互动百科。里面也提到之所以叫无标度,是因为「系统中个体的尺度相差悬殊,缺乏一个优选的规模」。如下图这般,极少数个体(横轴)对应极高的值(纵轴),而拥有极低值的个体,数

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

长尾分布(long-tail distribution)和长尾效应

1、长尾效应

作者:赵澈
链接:https://www.zhihu.com/question/20027490/answer/20420381
来源:知乎

长尾效应其实是幂率分布的通俗提法,在物理上也被称为无标度现象,这种现象在自然界与社会生活中都相当地常见,可参考幂律分布_互动百科。里面也提到之所以叫无标度,是因为「系统中个体的尺度相差悬殊,缺乏一个优选的规模」。

如下图这般,极少数个体(横轴)对应极高的值(纵轴),而拥有极低值的个体,数量却占总体的绝大多数。形象地描述可称曲线靠近纵轴的部份为tall head,而靠近横轴的部份则是所谓的long tail:
长尾分布(long-tail distribution)和长尾效应「建议收藏」

据维基百科:長尾(英語:The Long Tail),或譯長尾效應,最初由《連線》的總編輯克里斯·安德森(Chris Anderson)於2004年發表於自家的雜誌中[1],用來描述諸如亞馬遜公司、Netflix和Real.com/Rhapsody之類的網站之商業和經濟模式。是指那些原來不受到重視的銷量小但種類多的產品或服務由於總量巨大,累積起來的總收益超過主流產品的現象

因此长尾效应这个提法,强调的是那些数量占绝大多数的个体的商业价值,它们单个的值虽然极低,但是这个长长的尾巴,总和不可小觑。而长尾之所以常常与互联网、电子商公司放在一起,主要是因为互联网与IT技术的发展使产品与服务的信息到达用户的平均成本降到了极低的值。幂率分布在海量产品信息与用户信息的情形下表现得尤其明显,并且被这些公司较早加以了良好利用。

以下拿网店与线下商店对比为例:

网店相当于用极小的成本,便换来几乎无限长的货架,可以同时包括大热门以及几乎无人问津的众多冷门。这众多冷门带来的效益总和则相当可观,甚至可以去与几个大热门相较量。用一个不恰当的比喻,「蚁多咬死象」。相较而言,线下实体商店由于可观的空间等成本是无法做到同样的事情的,边际效益不允许。

从用户的角度看,即使再小众的需求也可能通过互联网平台得以满足,相当于毫不费力逛一个无限大的、能尽可能满足自己的超级市场,可以说只要是世上存在的,都可能唾手可「见」(当然这是一种极为理想的描绘,实际的状况很大程度上依赖于技术的发展,比如搜索引擎、个性化推荐等,这裡暂且不谈)。之所以我不说唾手可「得」,是因为有物流这个实物类电子商贸无法逃避的瓶颈;O2O等服务类商品则也难以回避实际的消费一定发生在线下这一问题。即使消费者与商品之间碰撞出火花所需的时间再短,终不得不考虑这漫长多艰的蜀道难。这也是线下商店不会被电子商贸轻易打垮的重要原因之一。而手机话费、游戏点卡这类的虚拟(或者说完全数字化)商品,包括现在很热的网络金融产品,在这方面则受到很小的影响。

这种在电子商贸领域中的现象同样能够在其他互联网应用特别是平台化的应用上见到,比如多媒体内容分享平台、网络社区等。这时用户所拥有的值就从对商品或服务的需求(可能还对应为他们为实现这一需求愿意付出的代价)变成了对有趣、有价值的信息的需求(也可能对应愿付出的代价,当然这时可能更像是时间、精力这样的代价)。而这些信息同样主要来自于用户,也就是所谓的UGC。这种生产的长尾与需求的长尾同时作用,便是我所理解的Web 2.0的一个重要特徵。

现在也有不少其他领域借鉴了长尾这个说法,用以描述各自领域内的幂率分布现象。此外值得一提的是,幂率分布与正态分布都给人一种用以区分大多数与极少数的印象,但是正态分布的大多数集中于中间,极少数则分居两端,是个倒挂金钟的形状,二者描绘的其实是极为不同的现象。

2、长尾分布(和重尾分布即幂律分布)

Zipf分布是一种符合长尾的分布:

在这里插入图片描述

就是指尾巴很长的分布。那么尾巴很长很厚的分布有什么特殊的呢?有两方面:一方面,这种分布会使得你的采样不准,估值不准,因为尾部占了很大部分。另一方面,尾部的数据少,人们对它的了解就少,那么如果它是有害的,那么它的破坏力就非常大,因为人们对它的预防措施和经验比较少。也要所谓的二八法则。
https://www.cnblogs.com/huangshiyu13/p/6217180.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/215931.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 使用upx脱壳工具脱壳

    使用upx脱壳工具脱壳使用upx脱壳工具脱壳查壳工具链接:https://www.52pojie.cn/thread-437586-1-1.html脱壳工具链接:https://github.com/upx/upx/releases先查壳一般做到逆向的部分题的时候,把文件丢进ida会发现函数特别少,大部分都是加壳了(以攻防世界新手区第7题为例链接:https://adworld.xctf.org.cn/task/task_list?type=reverse&number=4&grade=0)ida打开只

    2022年7月12日
    36
  • 系统学习Pytorch笔记三:Pytorch数据读取机制(DataLoader)与图像预处理模块(transforms)

    系统学习Pytorch笔记三:Pytorch数据读取机制(DataLoader)与图像预处理模块(transforms)Pytorch官方英文文档:https://pytorch.org/docs/stable/torch.html?Pytorch中文文档:https://pytorch-cn.readthedocs.io/zh/latest/1.写在前面疫情在家的这段时间,想系统的学习一遍Pytorch基础知识,因为我发现虽然直接Pytorch实战上手比较快,但是关于一些内部的原理知识其实并不是太懂,这样…

    2022年4月28日
    48
  • python爬虫scrapy框架_nodejs爬虫框架

    python爬虫scrapy框架_nodejs爬虫框架叮铃铃!叮铃铃!老师:“小明你的梦想是什么?”,沉思了一下小明:“额额 我想有车有房,自己当老板,媳妇貌美如花,还有一个当官的兄弟”老师:“北宋有一个人和你一样···”;哈喽!大家好!请叫我布莱恩·奥复托·杰森张;爬虫部分!一提到爬虫,好多人先想到python没错就是那个py交易的那个,这货所为是什么都能干上九天揽月下五洋捉鳖无处不出现它的身影鄙人对它也是不得不折

    2022年9月17日
    0
  • directx修复工具强力修复_dll修复工具增强版

    directx修复工具强力修复_dll修复工具增强版说明:   此更新包仅限于升级已有的程序至最新版(如从V1.0版、V1.1版、以及V1.2标准版升级到V1.2增强版),如果您之前没有使用过DirectX修复工具,请勿使用本更新包,请直接从官方地址下载完整的程序包。 下载地址:http://download.csdn.net/detail/vbcom/4050752 请按照压缩包内的“更新说明.txt”文件进行更新即可。

    2022年5月3日
    53
  • DDR中的ODT_DDR SDRAM

    DDR中的ODT_DDR SDRAMODT电阻端接

    2022年9月9日
    0
  • OA工作流-Activiti(一)[通俗易懂]

    OA工作流-Activiti(一)[通俗易懂]OA工作流-Activiti(一)一、工作流定义工作流:一系列相互衔接、自动进行的业务活动或任务。OA工作流:建立于网络办公自动化基础上的事务行政审批,业务申请审批、公文、信息等的网上流转。它主要解决的是“使在多个参与者之间按照某种预定义的规则传递文档、信息或任务的过程自动进行,从而实现某个预期的业务目标,或者促使此目标的实现”。    不同于以往我们在仅仅进行增删改查(CRUD),我们还…

    2022年6月23日
    26

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号