泊松分布和幂律分布对应于均匀网络和非均匀网络

前天看一篇关于社交网络的论文,讨论到均匀和非均匀网络,进一步了解到其背后的理论基础是数学的泊松分布和幂律分布。碰巧了解到幂律分布也是长尾理论的数学基础,而长尾理论不仅对帕雷托法则(Pareto principle)进行补充,而且很好诠释了web 2.0时代的商业模式,简单是太美了。本文首先介绍帕雷托法则和长尾理论,接着讨论其背后的数学基础:泊松分布、幂律分布,最后,介绍该数学基础引申出来的均匀与非均匀网络。

1. 帕雷托法则与长尾理论

帕雷托法则(Pareto principle),也称为二八定律或80/20法则,最初是意大利经济学家维弗雷多·帕雷托在1906年对意大利20%的人口拥有80%的财产的观察而得出的。此法则得到广泛应用,如80%的劳动成果取决于20%的前期努力,80%的销量来自于20%的客户[1]

长尾(The Long Tail)理论,最初由《连线》的总编辑克里斯·安德森(Chris Anderson)于2004年发表于自家的杂志,用来描述诸如亚马逊公司、Netflix网站的商业和经济模式,即指那些原来不受到重视的销量小但种类多的产品或服务,由于总量巨大,累积起来的总收益超过主流产品的现象。在互联网领域,长尾效应尤为显著[2]长尾市场也叫“利基市场(niche market)”,是指由已有市场绝对优势的企业所忽略的某些细分市场并且在此市场尚未有完善的供应服务[3][4]

Long_tail

图1 长尾(黄色部分)

帕雷托法则向来被商业界视为铁律,其内涵认为企业界80%的业绩来自20%的产品。但长尾理论却认为互联网的崛起已打破这项铁律,广泛的销售层面让98%的产品都有机会销售,而这些具有长尾特性商品将具有增长企业营利空间的价值。不但如此,长尾商品的规模还大得惊人,其商品的总值甚至可与畅销商品相抗衡(直观理解:图1中曲线下面两部分面积比较)。如用指数曲线研究了亚马逊网站的书本销售量和销售排名的关系,发现亚马逊40%的书本销售来自于本地书店里不卖的书本[2]。Google目前有一半的生意来自那些放广告的小网站(Google AdSence)而不是搜索结果中放置的广告,数以百万计的中小企业代表了一个巨大的长尾广告市场[3]

2. 泊松分布与幂律分布

2.1 泊松分布

泊松分布(Poisson distribution),由法国数学家Siméon-Denis Poisson在1838年发表的(挺搞笑的,poisson在法语是鱼的意思),是一种统计与概率学里常见到的离散概率分布,适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数等[5]。维基百科英文描述得更加精确,如下:

Poisson distribution is a discrete probability distribution that expresses the probability of a given number of events occurring in a fixed interval of time and/or space if these events occur with a known average rate and independently of the time since the last event. The Poisson distribution can also be used for the number of events in other specified intervals such as distance, area or volume.

泊松公布的概率质量函数如下:

P(X=k)=\frac{e^{-\lambda}\lambda^k}{k!}

PS:概率质量函数(probability mass function,pmf)是离散随机变量在各特定取值上的概率。值得注意的是:概率质量函数是对离散随机变量定义的,本身代表该值的概率;概率密度函数是对连续随机变量定义的,本身不是概率,只有对连续随机变量的概率密度函数在某区间内进行积分后才是概率[6]

2.2 幂律分布

幂律分布(power law)是指少数事件的规模相当大,而绝大多数事件的规模很小。具有标度不变性(Scale invariance)、No average、Universality特性。

a power law is a functional relationship between two quantities, where one quantity varies as a power of another.

3. 均匀与非均匀网络

泊松分布和幂律分布对应于均匀网络和非均匀网络,我开始怀疑这样理解是错的?

均匀网络(heterogeneous network?)

无标度网络(Scale-free network)是指网络的度分布服务幂律(power law),典型特征是在网络中的大部分节点只与少量节点连接,如因特网、复杂网络。

参考资料:
[1]维基百科词条:帕雷托法则
[2]维基百科词条:长尾
[3]智库百科词条:长尾理论
[4]维基百科词条:利基市场
[5]维基百科词条:泊松分布
[6]维基百科词条:概率质量函数

发表评论

电子邮件地址不会被公开。 必填项已用*标注

One thought on “泊松分布和幂律分布对应于均匀网络和非均匀网络