博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
基尼系数的计算原理
阅读量:2728 次
发布时间:2019-05-13

本文共 573 字,大约阅读时间需要 1 分钟。

理论

基尼指数( 
Gini Index
 
20
世纪初
经济学家基尼定义的指标,最为知名的应用是考察居民收入的差异情况。
居民收入的情况符合幂指函数( 
Power Law
 )分布,最直观(但非准确)的理解就是 
80/20
 原则,也就是
 20%
的人拥有了 
80%
 的人的财富。用公式表示就是
描述了是收入靠后 
%x
 的人所拥有的收入总和占所有人收入总和的比例 
f(x)
 的关系。
幂指函数还有很多非常牛逼的应用,比如如果将单词出现的频率按照由高到低排列,则每个单词出现的频率和它在热门排行榜中排名的常数次幂成反比。
由于一本《长尾理论》的出现,在互联网领域幂指分布也叫长尾分布,因为大概最热门的 
20%
 的商品占据了用户购买商品数的 
80%
 。我们将物品按照热门程度从低到高排列,那么下图中的曲线表示最不热门的 
x%
 物品的总流行度占系统的比例 
y%
 。这条曲线肯定是在
 y=x
曲线之下的,而且和 
y=x
 曲线相交在
(0,0) 
 (1,1)

计算

基尼系数的计算公式为 
 ,也就是说,当收入很平均时,曲线接近于直线, 
A
 的面积趋于
0 
,基尼系统也趋于 
0
 
下面推导公式:
关键是求 
S(B)
 ,把
B 
分成从
 1
 
n
 一共
n 
个小梯形,梯形的底为 
 
 
,高为
 1/n
,而 
0 
 
 1
,则:
可得基尼系数为:
你可能感兴趣的文章
Mac 电脑鼠标和触摸板滚动方向不一致的问题
查看>>
LeetCode 62. Unique Paths LeetCode 63 Unique Paths II 不同的路径之二
查看>>
LeetCode 66. Plus One
查看>>
LeetCode 74. Search a 2D Matrix
查看>>
【已解决】 78. Subsets【39、40未解决】
查看>>
创建第一个android项目
查看>>
Excel 使用过程中碰到的问题处理
查看>>
阿里云负载均衡SLB--报错502 Bad Gateway 的解决方案
查看>>
Monte Carlo 方法求解π的近似值
查看>>
一些python学习的基本操作(持续更新中)
查看>>
Fluxion安装教程
查看>>
网络安全基础知识
查看>>
最详细 vsphere创建Windows service虚拟机,并安装VMware Tools 进行配置
查看>>
【html/css】如何设置HTML span 的宽度
查看>>
ubuntu12.10更新包后的问题
查看>>
【web开发】EL表达式的一些用法小结
查看>>
【mysql】关于命令load data local infile
查看>>
如何选择更适合你的 Linux 发行版?
查看>>
数据分析师必知必会的7款Python工具
查看>>
又到招聘季,说说网络招聘的那些坑
查看>>