抽样分布与估计式

上传人:杰猫 文档编号:187496250 上传时间:2021-07-26 格式:PPT 页数:44 大小:429.50KB
返回 下载 相关 举报
抽样分布与估计式_第1页
第1页 / 共44页
抽样分布与估计式_第2页
第2页 / 共44页
抽样分布与估计式_第3页
第3页 / 共44页
抽样分布与估计式_第4页
第4页 / 共44页
抽样分布与估计式_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《抽样分布与估计式》由会员分享,可在线阅读,更多相关《抽样分布与估计式(44页珍藏版)》请在金锄头文库上搜索。

1、第7章 抽樣分佈與估計式 前言 抽樣的目的並不意味著我們關心的焦點是在樣 本的資料上。樣本背後的母體才是關心的重點 。 以樣本的統計量(statistic),如樣本平均數、 樣本變異數等,來推論母體的參數(parameter ),如母體平均數、母體變異數等。 要達到此目的,必須知道樣本的統計量的機率 分佈,以及如何在眾多的統計量中,選擇最恰 當的,以便估計母體參數。 第一節 抽樣誤差 (1) 不針對母體進行普查的主要原因有: 1. 母體太大,客觀條件限制。 2. 無法確知母體的範圍。 3. 破壞性檢測。 4. 從樣本的結果已經可以有效推知母體。 第一節 抽樣誤差 (2) 估計誤差 抽樣誤差(s

2、ampling error) :任何因為抽樣中 的機遇(chance)所產生的變動。增加樣本數 ,可以降低抽樣誤差。使用恰當的樣本統計量 來估計母體參數,也是降低抽樣誤差的方法之 一。適當的抽樣方法,可以降低抽樣誤差。 非抽樣誤差(nonsampling error) :一切不是 因為抽樣所產生的誤差。例如樣本沒有代表性 ,在資料的蒐集、整理、分析時也可能產生誤 差。 第二節 抽樣方法 (1) 抽樣方法 隨機抽樣(random sampling):依照隨機的方 式,使母群體中的每一個份子都有可能被抽到 。 非隨機抽樣(nonrandom sampling):取決於 研究者主觀的想法或是參照客觀

3、環境的限制, 所設計出來的抽樣方法,因此母群體的某些份 子完全沒有被抽到的機會。 第二節 抽樣方法 (2) 隨機抽樣 1. 簡單隨機抽樣(simple random sampling) 2. 間隔抽樣(interval sampling) 3. 分層抽樣(stratified sampling) 4. 集群抽樣(cluster sampling) 5. 分段抽樣(staged sampling) 非隨機抽樣 1. 配額抽樣(quota sampling) 2. 判斷抽樣(judgment sampling) 第二節 抽樣方法 (3) 簡單隨機抽樣 先將母體加以編號,然後如抽籤般的抽出200 位

4、即可。也可以利用均勻分佈所產生的數值來 代替抽籤。 如果母群體很大,將母體加以編號恐怕不切實 際。有時研究者並不確知母群體的大小,簡單 隨機抽樣並不見得可行。 第二節 抽樣方法 (4) 間隔抽樣 每隔幾個就抽取一個。在工商界中,常用此方 法進行抽樣,如每隔幾個上門的顧客就訪問一 位,每隔幾個產品就抽樣一個。使用間隔抽樣 時,必須確保樣本的資料並無規律性變化才可 。 第二節 抽樣方法 (5) 分層抽樣 先決定有哪幾個重要的層(strata),接著就依 照母體分佈的比率,隨機抽樣。這樣一來可以 保證樣本與母群體的分佈情形非常相近,因此 所得到的調查結果比簡單隨機抽樣更能夠推論 到母群體。 如果選擇

5、一些不相干的層,就會一點效果都沒 有。因此在實務上,通常只選取少數幾個最為 重要的層而已。 第二節 抽樣方法 (6) 集群抽樣 先將母群體分為數個相似的集群,然後隨機抽 取數個集群,加以調查。 在集群抽樣裡,集群與集群間要非常相似,集 群內則差異要大(越接近母群體的分佈越好) 。在分層抽樣裡,層與層之間的差異要大,但 層之內要非常相似。 第二節 抽樣方法 (7) 分段抽樣 採用多種抽樣的方法。例如先集群抽樣,然後 再簡單隨機抽樣。或先集群再分層抽樣。實務 上,仍以兩階段和三階段的抽樣最為普遍。 第二節 抽樣方法 (8) 配額抽樣 它和分層抽樣的概念非常類似,只不過在分層 抽樣裡,研究者確知母群

6、體中各層的比率,但 在配額抽樣裡,事先並不完全知道母群體的分 佈,但依照研究者的學識和判斷,研擬出配額 的依據。 第二節 抽樣方法 (9) 判斷抽樣 它必須仰賴研究者主觀的判斷來進行抽樣。判 斷抽樣又比配額抽樣更為主觀。因為在配額抽 樣中,研究者只是去估計母體的比例而已。但 在判斷抽樣裡,研究者甚至判斷哪些份子較具 代表性,以決定是否要對它進行調查。 第三節 抽樣分佈 (1) 推論統計學就是利用樣本統計量來估計母體參 數的一門學問。統計量的機率分佈稱為抽樣分 佈理論(sampling distribution theory)。 基本上我們關心該分佈是何種機率分佈,平均 數和變異數各為多少,藉以

7、估計母體參數。 第三節 抽樣分佈 (2) 定理7.1 令X1, , Xn為獨立隨機變項,其平均數分別為 m1, , m n,其變異數分別為 , , 。若令 Y的平均數和變異數分別為 第三節 抽樣分佈 (3) 例子1 令X1表示丟公平硬幣出現的點數,X2表示丟公 平骰子出現的點數,則3X1 2X2的平均數和變 異數分別是多少? 作法 公平硬幣出現的點數的平均數和變異數分別為 0.5以及0.25。丟骰子出現的點數為間斷均勻分 佈,平均數和變異數分別為3.5以及2.92。 X1和X2互為獨立,得3X1 2X2的平均數為3 0.5 2 3.5 = -5.5,變異數為32 0.25 + 22 2.92

8、= 13.93。 第三節 抽樣分佈 (4) 例子2 X和Y變項互為獨立,X變項的變異數為 ,Y變 項的變異數為 ,aX + bY的變異數是多少? 作法 aX + bY的變異數為a2 + b2 。 第三節 抽樣分佈 (5) 推論1 X1,Xn的平均數均為m,變異數均為 ,且 ai 都等於1/n: 的平均數會等於母體平均數m,變異數會等 於母體變異數除以n,即s2/n。即: 第三節 抽樣分佈 (6) 定理7.2 令X1, , Xn為來自常態分佈的獨立隨機變項, 其平均數分別為m1, , mn,變異數分別為 , , 。若令 則Y為常態分佈,平均數為和變異數分別為 第三節 抽樣分佈 (7) 推論 1

9、令X1, , Xn為來自常態分佈N(m, s2)的獨立隨 機變項,則樣本平均數 推論2 令X1, , Xn為來自常態分佈N(m, s2)的獨立隨機 變項,則 第三節 抽樣分佈 (8) 推論3 令X1, , Xn為來自標準常態分佈N(0, 1)的獨立 隨機變項,則 第三節 抽樣分佈 (9) 例子3 假設智商的分佈為N(100, 225)。隨機抽樣25人 調查其智商,並計算智商的樣本平均數。如果 重複抽樣無數次,每次抽樣25人,並計算樣本 平均數,則樣本平均數會成何分佈?其平均數 和變異數各為多少? 作法 令這25人的智商分別為X1, , X25。已知它們 均服從常態分佈N(100, 225),根

10、據定理7.2得知 ,樣本平均數的抽樣分佈為N(100, 225/25)。 第三節 抽樣分佈 (10) 定理7.3 令Z1, , Zn為標準常態分佈的獨立隨機變項, 則 定理7.4 令X1, , Xn為來自常態分佈N(m, s2)的獨立隨 機變項,且其樣本平均數為 ,樣本變異數為S2 ,則 (1) 和S2互相獨立,(2) 第三節 抽樣分佈 (11) 例子4 假設智商的分佈為常態分佈,平均數和變異數 分別為100和225。如果隨機抽樣25人調查其智 商,並計算智商的樣本變異數S2。如果重複抽 樣無數次,每次抽樣25人,並計算樣本變異數 ,則樣本變異數S2會成何分佈?其平均數和變 異數各為多少? 第

11、三節 抽樣分佈 (12) 作法 令這25人的智商分別為X1, , X25,均服從常 態分佈N(100, 225),因此 由於卡方分佈的平均數是其自由度,變異數為 2倍的自由度,因此 的平均數是24,變 異數是48。所以S2的平均數是225,變異數是 4218.7 (=48 / (24/225)2)。 第三節 抽樣分佈 (13) 定理7.5 中央極限定理 令X1, , Xn為來自某平均數為m,變異數為s2 的母體的獨立隨機變項,當n趨近無限大時, 其樣本平均數會趨近於N(m, s2/n)。 在實用上,只要樣本數n夠大(如n 25),樣 本平均數就會很接近常態分佈。其實即使n小 於25,只要母體分

12、佈與常態分佈相去不遠,如 類似單峰和左右對稱形狀,樣本平均數會近似 常態分佈。 第三節 抽樣分佈 (14) 例子5 已知丟骰子出現點數為間斷均勻分佈,平均數 和變異數分別為3.5和2.92。現丟骰子25次,計 算骰子點數的平均數。如果這樣無數次,每次 均丟骰子25次,並計算骰子點數的平均數,則 骰子點數的平均數會成何分佈?其平均數和變 異數各為多少? 作法 根據中央極限定理,樣本平均數接近常態分佈 ,其平均數為母體平均數3.5,變異數為0.12 (=2.92/25)。 第三節 抽樣分佈 (15) 定理7.6 若由平均數為m1和m2,變異數為 和 的常態 分佈母體抽隨機抽出樣本數為n1和n2的獨

13、立樣 本,則 如果母體並非常態分佈,只要樣本數n1和n2夠 大(如均大於25),就可放心使用常態分佈了 。 第三節 抽樣分佈 (16) 例子6 丟硬幣25次,計算出現點數的平均數(正面一 點,反正零點),也丟骰子25次,計算出現點 數的平均數。然後將硬幣的平均數減骰子的平 均數,得到兩平均數差異。如果重複這樣無數 多次,這些無數多次的平均數差異成何分佈? 平均數和變異數各式多少? 第三節 抽樣分佈 (17) 作法 丟硬幣出現的點數的平均數和變異數分別為0.5 以及0.25。丟骰子出現的點數的平均數和變異 數分別為3.5以及2.92。 令 為硬幣的平均數, 為骰子的平均數,則 的平均數為0.53

14、.5 = -3,變異數為 根據中央極限定理, 近似常態分佈。 第四節 估計式 (1) 推論統計包括兩大部份:估計和假設檢定。估 計分為點估計和區間估計。 母體參數的點估計:利用統計量的某一個值加 以估計。例如用樣本平均數這個統計量的(大 寫表示變項,小寫表示特定的數值)估計母體 平均數m。 統計量又稱為估計式(estimator),以表明其 估計母體參數的功用。同一個參數可以有好多 個估計式。 第四節 估計式 (2) 不偏性 令q為所欲估計的參數, (唸做theta hat)為其 估計式。如果 E ( ) = q,那麼 就具有不偏性 。或謂 是q的不偏估計式(unbiased estimato

15、r )。 樣本平均數的期望值為母體平均數,因此樣本 平均數是母體平均數的不偏估計式。 第四節 估計式 (3) 例子7 令X1, X2, X3, X4為隨機從母體抽出的4個值,樣 本平均數是母體平均數m的不偏估計式,已如 上述。但X1、 、 、 是否也是母體平均數的不偏估計 式? 第四節 估計式 (3) 作法 E(X1) =m 第四節 估計式 (4) 例子8 樣本變異數S2是母體變異數s2的不偏估計式嗎 ? 作法 第四節 估計式 (5) 有效性 假設q是所欲估計的參數, 是眾多估計式中的 一種。若E( -q )2在所有的估計式中最小, 就 是最有效的估計式。 在所有的估計式中,具有最小的均方誤,

16、就是 最有效的估計式。如果只限於從不偏估計式中 挑選最有效的,那麼該估計式就是不偏的最小 變異估計式。 第四節 估計式 (6) 例子9 在例子7中, 、X1、Y1、Y2都是母體平均數的 不偏估計式。何者較為有效? 作法 第四節 估計式 (7) 一致性 如果樣本數n越大,估計式 與母體參數q 的誤 差量越小。如果樣本數趨近於無限大, 與q 的 差量小於微量e的機率趨近1。即 該估計式 就具有一致性(consistency) 是母體平均數的不偏估計式,且變異數為 s2/n。如果n趨近於無限大,則s2/n趨近於0 , 因此 具有一致性。 第四節 估計式 (8) 例子10 例子7中的X1、Y1、Y2是否具有一致性? 作法 即使樣本數n再大,X1、Y1、Y2的變異數都不會 改變,當然也不會趨近於0。換句話說,樣本 數增加,並無助於X1、Y1、Y2趨近於母體平均 數,因此它們不具有一致性。 第四節 估計式 (9) 充分性 令X1,Xn為隨機變項,其聯合機率函數為 f(x1, , xn; q)。統計量 是q的充分統計式或具 有充分性,若且為若 f(x1, , xn; q) = g( ; q) h(x

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号