柴比雪夫不等式

機率論中的不等式

柴比雪夫不等式(英語:Chebyshev's Inequality),是機率論中的一個不等式,顯示了隨機變數的「幾乎所有」值都會「接近」平均。在20世紀30年代至40年代刊行的書中,其被稱為比奈梅不等式(Bienaymé Inequality)或比奈梅-柴比雪夫不等式(Bienaymé-Chebyshev Inequality)。柴比雪夫不等式對任何分布數據都適用。

柴比雪夫不等式可表示為以下形式:對於任何隨機變數 和實數 ,都有 ,其中 表示 數學期望值變異數

概念

編輯

這個不等式以數量化這方式來描述,究竟「幾乎所有」是多少,「接近」又有多接近:

  • 與平均相差2個標準差以上的值,數目不多於1/4
  • 與平均相差3個標準差以上的值,數目不多於1/9
  • 與平均相差4個標準差以上的值,數目不多於1/16

……

  • 與平均相差k個標準差以上的值,數目不多於1/k2

舉例說,若一班有36個學生,而在一次考試中,平均分是80分,標準差是10分,我們便可得出結論:少於50分或多於110分(與平均相差3個標準差以上)的人,數目不多於4個(=36*1/9)。
公式: 

推論

編輯

測度論說法

編輯

設(X,Σ,μ)為一測度空間f為定義在X上的廣義實可測函數。對於任意實數t > 0,

 

一般而言,若g是非負廣義實值可測函數,在f的定義域非降,則有

 

上面的陳述,可透過以|f|取代f,再取如下定義而得:

 

機率論說法

編輯

 為隨機變數,期望值 標準差 。對於任何實數k>0,

 

改進

編輯

一般而言,柴比雪夫不等式給出的上界已無法改進。考慮下面例子:

 
 

這個分布的標準差  

對於任意分布形態的數據,根據柴比雪夫不等式,至少有   的數據落在k個標準差之內。其中k>1,但不一定是整數。

當只求其中一邊的值的時候,有Cantelli不等式

 [1]頁面存檔備份,存於網際網路檔案館

證明

編輯

定義 ,設 為集 指示函數,有

 
 

又可從馬可夫不等式直接證明:馬氏不等式說明對任意隨機變數Y和正數a 。取  

亦可從機率論的原理和定義開始證明:

 
 

參見

編輯

參考來源

編輯
  • 《基本統計學 觀念與應用二版》,林惠玲 陳正倉 著
  • 《應用統計學 第四版》 修訂版,林惠玲 陳正倉 著