在统计学中,幂律是两个量之间的函数关系,其中一个量的相对变化导致另一个量的相对相对变化,与这些量的初始大小无关:一个量随另一个量的变化而变化。例如,考虑到其边长的方形面积,如果长度加倍,则该面积乘以因子4。
长尾是一些统计分布的长期特征(如Zipf,幂定律,Pareto分布和一般Lévy分布)的名称。在“长尾”分布的高频或高振幅人口之后是低频或低振幅人口逐渐“尾部关” 渐近。尾部远端的事件发生概率非常低。
根据经验,对于此类人口分布,大多数事件(超过一半,帕累托原则适用的地方,80%)由分布中的前20%项目计算。长尾分布的不寻常之处在于,最常出现的20%的项目代表不到50%的事件; 换句话说,最不常发生的80%的项目占总人口的比例更为重要。
幂律分布或函数表征了来自自然和人类努力的重要行为。这一事实使这种分布产生了浓厚的科学和社会兴趣,以及创造它们的关系。对这种分布的观察通常指向特定类型的机制,并且通常可以表明与其他看似无关的系统的深层联系。表现出长尾分布的行为的例子是特定语言中某些词的出现,企业的收入分配或地震的强度(参见:古腾堡 – 里希特定律)。
Chris Anderson和Clay Shirky的文章强调了我们能够修改基础关系并评估对事件频率的影响的特殊情况。在这些情况下,不常见的低幅度(或低收入)事件 – 长尾,在此处由第20百分位右侧的曲线部分表示 – 可以成为该线下的最大区域。这表明,一种机制(互联网访问)或关系(存储成本)的变化可以显着改变分布中某些事件的发生频率。这种转变对大众媒体和在线卖家等企业的概率和客户人口统计数据产生了至关重要的影响。
然而,像Gutenberg-Richter定律或词语出现的Zipf定律那样的长尾特征,以及Anderson和Shirky所强调的那些,如果不是相反的话,它们的性质是非常不同的:Anderson和Shirky指的是频率等级关系,而Gutenberg-Richter定律和Zipf定律是概率分布。因此,在后面这些情况下,“尾巴”对应于大强度事件,例如大地震和最流行的词,他们主导分布。相比之下,Anderson和Shirky强调的频率等级图中的长尾相当于相关概率分布中的短尾,因此说明了与Gutenberg-Richter和Zipf相比的相反现象。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/200567.html原文链接:https://javaforall.net
