偏度

形狀量數

偏度(英語:skewness),亦稱歪度,在機率論統計學中衡量實數隨機變數機率分布的不對稱性。偏度的值可以為正,可以為負或者甚至是無法定義。在數量上,偏度為負(負偏態;左偏)就意味著在機率密度函數左側的尾部比右側的長,絕大多數的值(不一定包括中位數在內[1])位於平均值的右側。偏度為正(正偏態;右偏)就意味著在機率密度函數右側的尾部比左側的長,絕大多數的值(不一定包括中位數[1])位於平均值的左側。偏度為零就表示數值相對均勻地分布在平均值的兩側,但不一定意味著其為對稱分布。

偏度不為零的實驗數據樣本(小麥胚芽鞘向地反應:1,790)
負偏態(左)和正偏態(右)

介紹

編輯

偏度分為兩種:

  • 負偏態左偏態:左側的尾部更長,分布的主體集中在右側。[2]
  • 正偏態右偏態:右側的尾部更長,分布的主體集中在左側。[2]

如果分布對稱,那麼平均值=中位數,偏度為零(此外,如果分布為單峰分布,那麽平均值=中位數=眾數)。

定義

編輯

隨機變數 的偏度 為三階標準動差,可被定義為:

 

其中 是三階主動差 標準差 期望值算子。等式的最後以三階累積量與二階累積量的1.5次方的比率來表示偏度。這和用四階累積量除去二階累積量的平方來表示峰度的方法向類似。

偏度有時用 來表示。老教科書過去常常用 來表示偏度,可是由於偏度可為負,這樣的表示法較為不便。

對上面的等式進行擴展可導出用非主動差E[X3]來表示偏度的公式:

 

樣本偏度

編輯

具有 個值的樣本樣本偏度為:

 

其中 樣本平均值 是三階樣本主動差, 是二階樣本中心距,即樣本變異數

性質

編輯

當:   時,偏度可以是無窮大的。

或者當:   為負)及

  為正)時,偏度無法定義。

在後面的這個例子中,三階累積量是無法定義的。 其他分布形式比如:

 

二階和三階累積量是無窮大的,所以偏度也是無法定義的。

如果假定  個獨立變量之和並且這些變量和 具有相同的分布,那麽 的三階累積量是  倍, 的二階累積量也是  倍,所以:  。根據中央極限定理,當其接近高斯分布時變量之和的偏度減小。

參見

編輯

註釋

編輯
  1. ^ 1.0 1.1 存档副本. [2018-12-14]. (原始內容存檔於2020-11-12). 
  2. ^ 2.0 2.1 存档副本. [2010-10-30]. (原始內容存檔於2011-08-11). 

參考資料

編輯
  • Groeneveld, RA; Meeden, G. Measuring Skewness and Kurtosis. The Statistician. 1984, 33 (4): 391–399 [2010-10-30]. doi:10.2307/2987742. (原始內容存檔於2020-08-20). 
  • Johnson, NL, Kotz, S, Balakrishnan N (1994) Continuous Univariate Distributions, Vol 1, 2nd Edition Wiley ISBN 0-471-58495-9
  • MacGillivray, HL. Shape properties of the g- and h- and Johnson families. Comm. Statistics - Theory and Methods. 1992, 21: 1244–1250.