长尾分布(long-tail distribution)和长尾效应「建议收藏」

长尾分布(long-tail distribution)和长尾效应「建议收藏」长尾分布(long-taildistribution)和长尾效应1、长尾效应作者:赵澈链接:https://www.zhihu.com/question/20027490/answer/20420381来源:知乎长尾效应其实是幂率分布的通俗提法,在物理上也被称为无标度现象,这种现象在自然界与社会生活中都相当地常见,可参考幂律分布_互动百科。里面也提到之所以叫无标度,是因为「系统中个体的尺度相差悬殊,缺乏一个优选的规模」。如下图这般,极少数个体(横轴)对应极高的值(纵轴),而拥有极低值的个体,数

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

长尾分布(long-tail distribution)和长尾效应

1、长尾效应

作者:赵澈
链接:https://www.zhihu.com/question/20027490/answer/20420381
来源:知乎

长尾效应其实是幂率分布的通俗提法,在物理上也被称为无标度现象,这种现象在自然界与社会生活中都相当地常见,可参考幂律分布_互动百科。里面也提到之所以叫无标度,是因为「系统中个体的尺度相差悬殊,缺乏一个优选的规模」。

如下图这般,极少数个体(横轴)对应极高的值(纵轴),而拥有极低值的个体,数量却占总体的绝大多数。形象地描述可称曲线靠近纵轴的部份为tall head,而靠近横轴的部份则是所谓的long tail:
长尾分布(long-tail distribution)和长尾效应「建议收藏」

据维基百科:長尾(英語:The Long Tail),或譯長尾效應,最初由《連線》的總編輯克里斯·安德森(Chris Anderson)於2004年發表於自家的雜誌中[1],用來描述諸如亞馬遜公司、Netflix和Real.com/Rhapsody之類的網站之商業和經濟模式。是指那些原來不受到重視的銷量小但種類多的產品或服務由於總量巨大,累積起來的總收益超過主流產品的現象

因此长尾效应这个提法,强调的是那些数量占绝大多数的个体的商业价值,它们单个的值虽然极低,但是这个长长的尾巴,总和不可小觑。而长尾之所以常常与互联网、电子商公司放在一起,主要是因为互联网与IT技术的发展使产品与服务的信息到达用户的平均成本降到了极低的值。幂率分布在海量产品信息与用户信息的情形下表现得尤其明显,并且被这些公司较早加以了良好利用。

以下拿网店与线下商店对比为例:

网店相当于用极小的成本,便换来几乎无限长的货架,可以同时包括大热门以及几乎无人问津的众多冷门。这众多冷门带来的效益总和则相当可观,甚至可以去与几个大热门相较量。用一个不恰当的比喻,「蚁多咬死象」。相较而言,线下实体商店由于可观的空间等成本是无法做到同样的事情的,边际效益不允许。

从用户的角度看,即使再小众的需求也可能通过互联网平台得以满足,相当于毫不费力逛一个无限大的、能尽可能满足自己的超级市场,可以说只要是世上存在的,都可能唾手可「见」(当然这是一种极为理想的描绘,实际的状况很大程度上依赖于技术的发展,比如搜索引擎、个性化推荐等,这裡暂且不谈)。之所以我不说唾手可「得」,是因为有物流这个实物类电子商贸无法逃避的瓶颈;O2O等服务类商品则也难以回避实际的消费一定发生在线下这一问题。即使消费者与商品之间碰撞出火花所需的时间再短,终不得不考虑这漫长多艰的蜀道难。这也是线下商店不会被电子商贸轻易打垮的重要原因之一。而手机话费、游戏点卡这类的虚拟(或者说完全数字化)商品,包括现在很热的网络金融产品,在这方面则受到很小的影响。

这种在电子商贸领域中的现象同样能够在其他互联网应用特别是平台化的应用上见到,比如多媒体内容分享平台、网络社区等。这时用户所拥有的值就从对商品或服务的需求(可能还对应为他们为实现这一需求愿意付出的代价)变成了对有趣、有价值的信息的需求(也可能对应愿付出的代价,当然这时可能更像是时间、精力这样的代价)。而这些信息同样主要来自于用户,也就是所谓的UGC。这种生产的长尾与需求的长尾同时作用,便是我所理解的Web 2.0的一个重要特徵。

现在也有不少其他领域借鉴了长尾这个说法,用以描述各自领域内的幂率分布现象。此外值得一提的是,幂率分布与正态分布都给人一种用以区分大多数与极少数的印象,但是正态分布的大多数集中于中间,极少数则分居两端,是个倒挂金钟的形状,二者描绘的其实是极为不同的现象。

2、长尾分布(和重尾分布即幂律分布)

Zipf分布是一种符合长尾的分布:

在这里插入图片描述

就是指尾巴很长的分布。那么尾巴很长很厚的分布有什么特殊的呢?有两方面:一方面,这种分布会使得你的采样不准,估值不准,因为尾部占了很大部分。另一方面,尾部的数据少,人们对它的了解就少,那么如果它是有害的,那么它的破坏力就非常大,因为人们对它的预防措施和经验比较少。也要所谓的二八法则。
https://www.cnblogs.com/huangshiyu13/p/6217180.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/215931.html原文链接:https://javaforall.net

(0)
上一篇 2025年7月11日 下午10:01
下一篇 2025年7月11日 下午10:43


相关推荐

  • CUDA deb 安装

    CUDA deb 安装1、CUDA下载https://developer.nvidia.com/cuda-toolkit-archive2、选择对应版本deb安装sudodpkg-icuda-repo-ubuntu1804-10-0-local-10.0.130-410.48_1.0-1_amd64.debsudoapt-keyadd/var/cuda-repo-<version&gt…

    2022年6月4日
    68
  • python 爬虫之selenium可视化爬虫

    python 爬虫之selenium可视化爬虫文章目录前文回顾快速入门元素定位页面操作等待方式扩展程序加载前文回顾一文带你了解Python爬虫(一)——基本原理介绍一文带你了解Python爬虫(二)——四种常见基础爬虫方法介绍之所以把selenium爬虫称之为可视化爬虫主要是相较于前面所提到的几种网页解析的爬虫方式selenium爬虫主要是模拟人的点击操作selenium驱动浏览器并进行操作的过程是可以观察到的就类似于你在看着别人在帮你操纵你的电脑,类似于别人远程使用你的电脑当然了,selenium也有无界面模式快速入门sel

    2022年5月9日
    32
  • asp:DropDownList 的一些属性

    asp:DropDownList 的一些属性使用 BorderStyle 属性为Web服务器控件指定边框样式。 使用一个 BorderStyle 枚举值设置此属性。 下表列出了可能的值。边框样式说明NotSet不设置边框样式。None无边框Dotted虚线边框。

    2022年10月17日
    5
  • smtp服务器组件,本机搭建虚拟SMTP服务器教程[通俗易懂]

    smtp服务器组件,本机搭建虚拟SMTP服务器教程[通俗易懂]该楼层疑似违规已被系统折叠隐藏此楼查看此楼Windows2000用户安装设置服务端WindowsXP和2000本身就拥有构件SMTP服务器的功能,只是一般还没有安装。选择“控制面板→添加/删除程序→添加/删除Windows组件”,弹出“Windows组件向导”对话框,在其中双击“Internet信息服务(IIS)”项,就会打开详细选择项,选中“SMTPService”,按“确定”,插入…

    2022年10月3日
    5
  • 科大讯飞发布新一代智慧课堂解决方案

    科大讯飞发布新一代智慧课堂解决方案

    2026年3月14日
    5
  • SQL索引使用初步,(转)

    SQL索引使用初步,(转)

    2021年6月20日
    103

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号