统计学之样本大小

上传人:luobi****88888 文档编号:94012948 上传时间:2019-07-31 格式:PPT 页数:35 大小:1.36MB
返回 下载 相关 举报
统计学之样本大小_第1页
第1页 / 共35页
统计学之样本大小_第2页
第2页 / 共35页
统计学之样本大小_第3页
第3页 / 共35页
统计学之样本大小_第4页
第4页 / 共35页
统计学之样本大小_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《统计学之样本大小》由会员分享,可在线阅读,更多相关《统计学之样本大小(35页珍藏版)》请在金锄头文库上搜索。

1、本资料来源,2,第四章 樣本大小,3,樣本大小之選擇,樣本不要過大, 過大浪費成本;但也不要過小, 過小則會有太大的抽樣誤差。如何決定適當的樣本大小?在機率抽樣的情況下, 有關樣本大小的決定及樣本統計顯著性的判斷, 可藉由機率法則的運用。(也就是說, 有公式可供計算啦!) 但在非機率抽樣的情況下, 除了依靠抽樣人員的主觀判斷或假設外, 實無客觀之科學方法可資應用。,4,估計平均數時的樣本大小 母體變異數已知,於母體變異數(2)已知之情況下, 樣本數(n)之求算公式為: 為顯著水準或風險水準, (1-)即信賴係數或信賴水準;顯著水準表示檢定者主觀認定統計量出現極端數值的機率。信賴係數愈高愈好,表

2、示估計精準。 e為可容忍誤差 為母體標準差:是用來衡量觀測值與平均值間的離散程度。 先別忙著計算樣本數, 由於本書是介紹Excel之書籍, 故得對所使用到的各相關函數先介紹一下。,5,基本定義,標準差 變異數 標準隨機變數 平均值 m,6,常態分配之Z值,一般統計學之常態數值(Z), 係利用查常態分配表(附錄二)來得知。如:Z0.025為1.96、Z0.05為1.645。但於Excel下, 則可利用NORMSINV()標準常態分配反函數來查得;而若知道Z值, 也可以NORMSDIST()函數來求得其機率。,7,標準常態分配NORMSDIST(),NORMSDIST(z):由z值求機率 其作用為

3、求自標準常態分配( = 0, = 1)的左尾開始, 累加到z值處的總面積(機率)。即, 下圖之陰影部份:,8,有了此函數, 即可省去查常態分配表某z值之機率的麻煩。如:(詳範例光碟Ch04.xlsxNORMSDIST工作表) =NORMSDIST(-1.96) 為0.025 =NORMSDIST(-1.645) 為0.05 =NORMSDIST(0) 為0.5 =NORMSDIST(1.96) 為0.975,9,常態分配(normal distribution)是次數分配呈中間集中, 而逐漸向左右兩端勻稱分散的鐘形曲線分佈。根據中央極限定理, 不論原母體的分配為何?只要樣本數夠大(n=30),

4、 樣本平均數 的分配, 會趨近於常態分配。,10,標準常態分配反函數NORMSINV(),NORMSINV(累計機率) :由機率求z值 NORMSINV(probability) 其作用為於標準常態分配( = 0, = 1), 求某累計機率所對應之Z值。有了此函數, 即可省去查常態分配表之Z值的麻煩。如:(詳範例光碟Ch04.xlsxNORMSINV工作表) =NORMSINV(0.025) 為-1.96 =NORMSINV(0.05) 為-1.645 =NORMSINV(0.5) 為0 =NORMSINV(0.95) 為1.645 =NORMSINV(0.975) 為1.96,11,標準常態

5、分配表,一般統計學之教科書, 均會附有標準常態分配表(如:附錄二), 以利查常態數值(Z)。由於, 常態分配是對稱的分配, 故一般僅附上正值之部分, 表內之累計機率, 是由Z值為0時開始累計。如:Z值1.96, 查得1.96之0.475, 表示由標準常態分配中央(Z=0)開始, 累計到Z=1.96的機率。即, 下圖之陰影部份:,12,如要查負值之部份, 仍以正值查表。然後, 以0.5減去表內之累計機率即可。如:Z值-1.96, 查得1.96之0.475, 以0.5-0.475=0.025, 即是自左尾開始累計到Z值為-1.96的機率。 相反地, 若要計算由Z值為-1.96開始累計到右尾的機率,

6、 則將查得之值(0.475)加上0.5, 即0.975。通常, =0.05時, 如要查Z/2值, 是找尋右尾機率為0.025時之Z值, 即找出由左尾累積得0.975之Z值1.96。若用Excel之NORMSINV()函數來求算, 其公式應為:(詳範例光碟Ch04.xlsx依査Z值工作表) =NORMSINV(1-0.05/2),13,於Excel下, 利用NORMSDIST()函數即可輕易建立標準常態分配表。其建立步驟為:(詳範例光碟Ch04.xlsx常態分配表工作表) 於A2輸入Z字串, A3輸入0.0(僅顯示0), A4輸入0.1 選取A3:A4, 切換到常用索引標籤,按數值群組之 增加小

7、數位鈕, 使兩數均可擁有一位小數 拖曳A3:A4右下角之複製控點, 拉到A33位置, 複製出0.0、0.1、0.2、2.9、3.0等數值,14,於B1輸入Z值的小數第二位字串 於B2輸入0.00(僅顯示0), C2輸入0.01 選取B2:C2, 按數值群組之 增加小數位鈕, 使兩數均可擁有2位小數 拖曳B2:C2右下角之複製控點, 拉到K2位置, 複製出0.00、0.01、0.02、0.08、0.09等數值,15,於B2:K2尚呈選取之狀態, 切換到常用索引標籤,按儲存格群組 格式鈕之下拉鈕,續選自動調整欄寬(I), 將各欄調整成最適欄寬 選取B1:K1, 按對齊方式群組 跨欄置中鈕, 讓Z值

8、的小數第二位字串, 於這幾欄內跨欄置中,16,於B3輸入=NORMSDIST($A3+B$2)-0.5 拖曳其右下角之複製控點, 往右複製到K3,17,於B3:K3尚呈選取之狀態, 按兩次按數值群組之增加小數位鈕, 使各數均可有4位小數 於B3:K3尚呈選取之狀態, 按儲存格群組格式鈕之下拉鈕, 續選自動調整欄寬(I), 調整成最適欄寬 雙按K3右下角之複製控點, 將B3:K3往下複製到K33, 即完成整個建表工作,18,母體變異數已知時的樣本大小,學過所需之幾個函數後, 現在, 可以 來計算於母體變異數(2)已知之情況下的樣本數(n)。式中: 為顯著水準或風險水準, (1-)即信賴係數或信賴

9、水準 e為可容忍誤差 為母體標準差,19,假定, 母體變異數2=6.25(=2.5), 於風險顯著水準=0.05(Z/2=1.96)的情況下, 希望對母體均數的估計誤差e不超過0.3, 其樣本數應為多大? 將=2.5與Z/2=1.96代入公式 至少應取得267個樣本, 才能有95%的保證其誤差不超過0.3。 以Excel來安排相關之數字與公式, 將為:(詳範例光碟Ch04.xlsx估計均數樣本數已知工作表),B欄各儲存格之公式分別為: 母體標準差 =SQRT(B1) Z/2 =NORMSINV(1-B3/2) 樣本數n =(B4*B2)/B5)2,20,假定, 電力公司根據過去之調查經驗, 知

10、道用戶用電度數的母體變異數為48000(2=48000)、於顯著水準=0.05(Z/2=1.96)的情況下, 希望對母體平均用電度數的估計誤差不超過5度, 其樣本數應為多大? 將相關之數字輸入Excel即可算出, 至少應取得7376個樣本, 才能有95%的保證其估計誤差不超過5度:(詳範例光碟Ch04.xlsx估計均數樣本數已知1工作表),21,馬上練習,以範例光碟Ch04.xlsx大學生零用金樣本數工作表進行計算。假定, 大學生之平均每月零用錢為1200元, 其變異數為368,560。至少應取得多少樣本?才能有95%的信賴水準, 保證其估計誤差不超過100元。,22,習題三 假定大學畢業生之

11、平均每月收入為26500元, 其變異數為4202500。至少應取得多少樣本?才能有9X%(X為學號最後一位數字)的信賴水準, 保證其估計誤差不超過1000元,23,平方根SQRT()函數,SQRT(數值) SQRT(number) 本函數是用來求某數值的平方根, 若數值為負值, 本函數將回應#NUM!之錯誤。如:(詳範例光碟Ch04.xlsx平方根工作表),24,事實上, 有無此函數並不很重要。利用 運算符號也可達成開方之動作。如:=64(1/2)之結果即=SQRT(64);但若要求開三方, 那SQRT()可就無能為力了。但仍可利用 運算符號來解決(乘冪為1/3即等於開三方):,25,母體變異

12、數未知的樣本大小,事實上, 實務上很多數情況是無法得知母體變異數(2)。若是母體變異數未知, 則可以過去調查之樣本變異數(S2)來替代。若過去也無類似之調查, 可先做一小規模試訪, 以利計算樣本變異數。然後, 再來計算樣本數: 式中: 為顯著水準或風險水準, (1-)即信賴係數或信賴水準 e為可容忍誤差 S為樣本標準差,26,於Excel中, 樣本變異數可以VAR()函數來求得, 其語法為: VAR(數值1,數值2,.) VAR(number1,number2,.) 數值1,數值2,.為要計算變異數之儲存格或範圍引數, 它是對應於某母體抽樣選出的1到255個數字引數樣本, 方括號包圍之部份可省

13、略。 樣本變異數(S2)的計算公式為: 其值恰為樣本標準差(S)之平方, 也是用來衡量觀測值與平均值間的離散程度。,27,由於, 母體變異數未知。故舉行一次試訪, 以範例光碟Ch04.xlsx估計均數樣本數未知工作表, 取得120位大學生之手機平均月費。計算出其樣本變異數(S2)為109,593、於顯著水準=0.05(Z/2=1.96)的情況下, 希望對母體手機平均月費的估計誤差不超過30元, 其樣本數應為多大? 將相關之數字輸入Excel, 即可算出, 至少應取得468個樣本, 才能有95%的保證其估計誤差不超過30元:,28,馬上練習,由於, 母體變異數未知。故舉行了一次試訪, 取得40位

14、大學生之信用卡每月平均簽帳金額。(詳範例Ch04.xlsx信用卡問卷樣本數工作表)於風險顯著水準=0.05(Z/2=1.96)的情況下, 希望對母體信用卡每月平均簽帳金額的估計誤差不超過50元, 其樣本數應為多大?,29,估計比率時的樣本大小,若研究目的是在估計比率(p, proportion), 其樣本數(n)之求算公式為: p為母體的真正比率 為風險顯著水準, (1-)即信賴係數 e為可容忍誤差 p為母體標準差, 其運算公式為:,30,將其代入上式, 即可獲致新的樣本數(n)公式: 不過, 通常我們是無法得知母體之真正比率p, 要計算樣本數時, 則以過去之調查結果替代。假定, 上個月支持執

15、政黨之比率為38%(p)。這個月, 於95%的信賴水準下(=0.05), 希望調查結果之支持率的允許誤差(e)為3%, 應取樣多少? 將相關值代入公式: 至少應取得1006個樣本, 才有95%的信心, 保證其調查結果的支持率之誤差不超過3%。,31,以Excel來安排相關之數字與公式, 將為:(詳範例光碟Ch04.xlsx以母體比率求樣本數工作表),32,保守估計母體比率,於將前面之抽樣中, 若將不同之p值分別代入, 其樣本數勢必不同。茲將各種結果彙集成下表來比較:(詳範例光碟Ch04.xlsx以母體比率求樣本數工作表),33,可發現, 其樣本數的極大值1067係發生於母體比率為0.5時。母體

16、比率0.5時, 隨母體比率逐漸增加, 樣本數則逐步減少。 故而, 若我們無法得知母體真正比率p, 要計算樣本數時, 可以採取最保守的估計, 將母體比率設定為0.5。這樣, 由於其樣本數最大, 所獲得之結果也將是各種情況下最正確的。,34,馬上練習,以範例Ch04.xlsx以保守估計求樣本數工作表進行計算, 保守估計執政黨的支持度為50%。要以90%之信賴水準(風險顯著水準=0.1), 希望調查結果之支持率的誤差為3%, 應取樣多少?,35,重點整理,NORMSDIST(z):由z值求機率 NORMSINV(累計機率) :由機率求z值 母體變異數已知時樣本的大小 母體變異數未知時樣本的大小 估計比率時樣本的大小,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号