样本标准差母体标准差标准差

上传人:re****.1 文档编号:568456337 上传时间:2024-07-24 格式:PPT 页数:45 大小:1.34MB
返回 下载 相关 举报
样本标准差母体标准差标准差_第1页
第1页 / 共45页
样本标准差母体标准差标准差_第2页
第2页 / 共45页
样本标准差母体标准差标准差_第3页
第3页 / 共45页
样本标准差母体标准差标准差_第4页
第4页 / 共45页
样本标准差母体标准差标准差_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《样本标准差母体标准差标准差》由会员分享,可在线阅读,更多相关《样本标准差母体标准差标准差(45页珍藏版)》请在金锄头文库上搜索。

1、 2006 by 滄海書局 1 11 SlideSlideSlide第第 3 章章資料與統計資料與統計II:數值方法:數值方法Part A (3.13.2) 2006 by 滄海書局 2 22 SlideSlideSlide統計實例統計實例Small Fry Design創設於創設於1997年,它是一間設計與進口年,它是一間設計與進口嬰孩用品的公司。嬰孩用品的公司。現金流量的管理是日常營運中現金流量的管理是日常營運中最重要的項目之一。最重要的項目之一。在現金流量管理中,最重要的在現金流量管理中,最重要的就是分析與控制應收帳款帳戶,就是分析與控制應收帳款帳戶,若能衡量未兌現支票平均到期若能衡量未

2、兌現支票平均到期日與金額,管理者就可以預測日與金額,管理者就可以預測何時收到現金,並且監督應收何時收到現金,並且監督應收帳款帳戶的變化。帳款帳戶的變化。Small Fry Design設定了以下目標:未兌現支票平均的設定了以下目標:未兌現支票平均的到期日不能超過到期日不能超過45天,到期日若有超過天,到期日若有超過60天的未兌現天的未兌現支票,總價值不能超過應收帳款總數的支票,總價值不能超過應收帳款總數的5%。 2006 by 滄海書局 3 33 SlideSlideSlide資料與統計資料與統計II:數值方法:數值方法Part A3.1 位置量數位置量數3.2 離散量數離散量數3.3 相對位

3、置的量數與離群值的偵測相對位置的量數與離群值的偵測3.4 探究性資料分析探究性資料分析3.5 兩變數的相關性量數兩變數的相關性量數3.6 加權平均數與群組資料的處理加權平均數與群組資料的處理 2006 by 滄海書局 4 44 SlideSlideSlide3.1 位置量數位置量數測量值是由樣本資料計算測量值是由樣本資料計算而得,則稱之為樣本統計量而得,則稱之為樣本統計量(sample statistics)。若是由整個母體計算而得,若是由整個母體計算而得,則稱之為母體參數則稱之為母體參數(population parameters)。統計推論中,樣本統計量是指統計推論中,樣本統計量是指相對應

4、的母體參數的相對應的母體參數的點估計量點估計量(point estimator)。平均數平均數中位數中位數眾數眾數 百分位數百分位數四分位數四分位數 2006 by 滄海書局 5 55 SlideSlideSlide平均數平均數一個變數最重要的位置量數或許是一個變數最重要的位置量數或許是平均數平均數(mean, average value)。若資料來自某一母體以若資料來自某一母體以 m m 表示。表示。 若資料來自某一樣本以表示。若資料來自某一樣本以表示。 平均數是一種中央位置量數。平均數是一種中央位置量數。 2006 by 滄海書局 6 66 SlideSlideSlide觀察值的樣本數觀察

5、值的樣本數資料集中資料集中 n 個觀察值個觀察值的總和的總和平均數平均數 2006 by 滄海書局 7 77 SlideSlideSlide觀察值的樣本數觀察值的樣本數資料集中資料集中 N 個觀察值個觀察值的總和的總和母體平均數母體平均數 m m 2006 by 滄海書局 8 88 SlideSlideSlide平均數實例平均數實例假設某大學的就業輔導室寄出一份問卷給被抽假設某大學的就業輔導室寄出一份問卷給被抽中的商學院畢業生以調查工作起薪。中的商學院畢業生以調查工作起薪。表表3.1為所蒐集的資料。為所蒐集的資料。 2006 by 滄海書局 9 99 SlideSlideSlide平均數實例平

6、均數實例樣本中樣本中12個商學院畢業生之平均月薪計算如下。個商學院畢業生之平均月薪計算如下。 2006 by 滄海書局 101010 SlideSlideSlide中位數中位數將資料值由小排到大時,中位數為中間的那一個值。將資料值由小排到大時,中位數為中間的那一個值。根據傳統的中位數定義,將中間兩個值之平均數當根據傳統的中位數定義,將中間兩個值之平均數當作中位數。作中位數。若資料個數為奇數時,中位數即位於中間的數值;若資料個數為奇數時,中位數即位於中間的數值;若資料項目為偶數時,就沒有單一的中間項。若資料項目為偶數時,就沒有單一的中間項。中位數中位數(median)是另一種中央位置量數。是另一

7、種中央位置量數。 2006 by 滄海書局 111111 SlideSlideSlide中位數中位數將資料遞增排列將資料遞增排列(即由小到大排列即由小到大排列)a)資料值為奇數項時,中位數為此資料之中資料值為奇數項時,中位數為此資料之中間值。間值。b)資料值為偶數項時,中位數為此資料之中資料值為偶數項時,中位數為此資料之中間兩個數值的平均數。間兩個數值的平均數。 2006 by 滄海書局 121212 SlideSlideSlide中位數實例中位數實例計算表計算表3.1商學院畢業生起薪的中位數商學院畢業生起薪的中位數首先將資料遞增排列後如下首先將資料遞增排列後如下因為因為n12是偶數,故有兩個

8、中間值:是偶數,故有兩個中間值:2,890和和2,920,中位數為此兩個值之平均。,中位數為此兩個值之平均。2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 33252711中間兩個值 2006 by 滄海書局 131313 SlideSlideSlide眾數眾數眾數眾數(mode)是資料集中出現次數最多的資料值。是資料集中出現次數最多的資料值。當資料集中出現次數最多的值有兩個或以上時,當資料集中出現次數最多的值有兩個或以上時,眾數就不只一個。眾數就不只一個。若資料集恰有兩個眾數,則稱此資料為若資料集恰有兩個眾數,則稱此資料為雙峰雙峰

9、(bimodal)。若出現兩個以上的眾數時,則稱為若出現兩個以上的眾數時,則稱為多峰多峰(multimodal)。 2006 by 滄海書局 141414 SlideSlideSlide眾數實例眾數實例表表2.2的軟性飲料購買狀況調查整理成如下的次的軟性飲料購買狀況調查整理成如下的次數分配。數分配。眾數,即最常購買的軟性飲料,是眾數,即最常購買的軟性飲料,是Coke Classic 。 2006 by 滄海書局 151515 SlideSlideSlide百分位數百分位數百分位數百分位數(percentile)也是一種位置量數,有助於也是一種位置量數,有助於瞭解資料在最小值與最大值間的分布情況

10、。瞭解資料在最小值與最大值間的分布情況。針對那些沒有太多重複的資料集而言,針對那些沒有太多重複的資料集而言,p-百分位百分位數可將資料分割成兩部分,大約數可將資料分割成兩部分,大約p-百分比的觀察百分比的觀察值會小於值會小於p-百分位數;而大約有百分位數;而大約有(100p)百分比百分比的觀察值會大於的觀察值會大於p-百分位數。百分位數。 2006 by 滄海書局 161616 SlideSlideSlide百分位數百分位數 p-百分位數表示至少有百分位數表示至少有p-百分比百分比(百分之百分之 p)的的觀察值小於或等於它,而至少有觀察值小於或等於它,而至少有(100p)百分百分比的觀察值大於

11、或等於它。比的觀察值大於或等於它。 2006 by 滄海書局 171717 SlideSlideSlide將資料遞增排列,即由小到大排序。將資料遞增排列,即由小到大排序。計算指標計算指標 i p p為百分位,為百分位,n n為觀察值的個數。為觀察值的個數。i i = ( = (p p/100)/100)n n若若 i 不是整數,無條件進位後的整數即不是整數,無條件進位後的整數即 p-百分位數百分位數的位置。的位置。若若 i 是整數,則是整數,則p-百分位數為資料排序後的第百分位數為資料排序後的第 i 個與個與第第 i1 個觀察值之平均數。個觀察值之平均數。百分位數百分位數 2006 by 滄海

12、書局 181818 SlideSlideSlide百分位數實例百分位數實例求表求表3.1起薪資料的起薪資料的85-百分位數。百分位數。步驟步驟 1. 將資料集的所有資料由小到大排序。將資料集的所有資料由小到大排序。2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325步驟步驟 2.步驟步驟3. 因為因為 i 不為整數,無條件進位為不為整數,無條件進位為11,即,即85-百分位數的位置指標。因此,百分位數的位置指標。因此,85百百分位數排在第分位數排在第11位。位。 2006 by 滄海書局 191919 SlideSlideSli

13、de百分位數實例百分位數實例再看看再看看50-百分位數的計算過程,由步驟百分位數的計算過程,由步驟2得得知知因為因為 是整數,步驟是整數,步驟3(b)指出指出50-百分位數為百分位數為排序資料的第排序資料的第6個與第個與第7個數值的平均數;因個數值的平均數;因此,此,50-百分位數為百分位數為(28902920)/22905 。要注意的是此處的要注意的是此處的50-百分位數也是中位數。百分位數也是中位數。 2006 by 滄海書局 202020 SlideSlideSlide四分位數四分位數四分位數四分位數(quartiles)是百分位數的特例。是百分位數的特例。Q1 第一四分位數或第一四分位

14、數或25-百分位數百分位數Q2 第二四分位數或第二四分位數或50-百分位數百分位數(即中位數即中位數)Q3 第三四分位數或第三四分位數或75-百分位數百分位數 2006 by 滄海書局 212121 SlideSlideSlide四分位數四分位數 2006 by 滄海書局 222222 SlideSlideSlide四分位數實例四分位數實例將表將表3.1起薪資料再次重新由小到大排序後,第起薪資料再次重新由小到大排序後,第二四分位數二四分位數(即中位數即中位數)為為2,905。2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325我

15、們需利用找出我們需利用找出25與與75-百分位數的規則來得到百分位數的規則來得到第一四分位數第一四分位數Q1與第三四分位數與第三四分位數Q3,計算如下。,計算如下。 2006 by 滄海書局 232323 SlideSlideSlide四分位數實例四分位數實例對對Q1而言:而言:因為因為 i 是整數,步驟是整數,步驟3(b)指出第一四分位數,指出第一四分位數,或或25-百分位數,為第百分位數,為第3個與第個與第4個資料之平均數;個資料之平均數;因此,因此,Q1 (28502880)/22865。 2006 by 滄海書局 242424 SlideSlideSlide四分位數實例四分位數實例對對

16、Q3而言:而言:因為因為 i 為整數,步驟為整數,步驟3(b)指出第三四分位數,指出第三四分位數,或或75-百分位數,為第百分位數,為第9個與第個與第10個資料之平均個資料之平均數,因此,數,因此, Q3 (29503050)/23000。 2006 by 滄海書局 252525 SlideSlideSlide四分位數實例四分位數實例四分位數將四分位數將12個資料分成四部分,而每一部分個資料分成四部分,而每一部分均包含均包含25%的觀察值。的觀察值。我們定義了我們定義了25, 50, 75-百分位數等三個四分位數百分位數等三個四分位數後,便可利用計算百分位數的規則求出四分位後,便可利用計算百分

17、位數的規則求出四分位數。數。 2006 by 滄海書局 262626 SlideSlideSlide評註評註當資料集出現極端值時,中位數會比平均值更當資料集出現極端值時,中位數會比平均值更合適作為中央位置量數。極端值存在時,有時合適作為中央位置量數。極端值存在時,有時會用到另一種量數,稱作修正平均數會用到另一種量數,稱作修正平均數(trimmed mean),作法是刪除資料集的極小值與極大值,作法是刪除資料集的極小值與極大值後,剩下資料值的平均數即為修正平均數。例後,剩下資料值的平均數即為修正平均數。例如,如,5% 的修正平均數即是刪除最小的的修正平均數即是刪除最小的5%以以及最大的及最大的5

18、%觀察值後得到的平均數。以表觀察值後得到的平均數。以表3.1的的12筆起薪為例,筆起薪為例,12筆資料的筆資料的5% 是是120.050.6,將,將0.6進位為進位為1,表示,表示5% 的修正平均數是的修正平均數是將最高的一筆起薪與最低的一筆起薪刪除後,將最高的一筆起薪與最低的一筆起薪刪除後,再求平均值,因此,以再求平均值,因此,以10筆資料求得的筆資料求得的5% 的的修正平均數是修正平均數是2,924.5。 2006 by 滄海書局 272727 SlideSlideSlide3.2 離散量數離散量數除了位置量數外,我們還常希望能知道離散量數除了位置量數外,我們還常希望能知道離散量數或變異量

19、數。或變異量數。例如,選擇兩家不同的供應商訂貨,不僅要考慮例如,選擇兩家不同的供應商訂貨,不僅要考慮其平均運送時間,還要考慮其運送時間的變異性。其平均運送時間,還要考慮其運送時間的變異性。 2006 by 滄海書局 282828 SlideSlideSlide3.2 離散量數離散量數全距全距四分位數距四分位數距變異數變異數標準差標準差變異係數變異係數 2006 by 滄海書局 292929 SlideSlideSlide全距全距最簡單的離散量數就是最簡單的離散量數就是全距全距(range)。全距全距 最大值最大值 最小值最小值全距僅用到資料中的兩個值,因此深受極端值全距僅用到資料中的兩個值,因

20、此深受極端值的影響。的影響。 2006 by 滄海書局 303030 SlideSlideSlide全距實例全距實例參考表參考表3.1商學院畢業生的起薪資料,最大值是商學院畢業生的起薪資料,最大值是3,325,最小值是,最小值是2,710,全距就是,全距就是33252710615。假設有一位畢業生的起薪是假設有一位畢業生的起薪是$10,000,此例中的,此例中的全距變為全距變為1000027107290而不是而不是615,這個,這個值並不是非常適合描述資料集的變動性,因為值並不是非常適合描述資料集的變動性,因為12個資料中的個資料中的11個資料均是在個資料均是在2,710與與3,130之之間。

21、間。 2006 by 滄海書局 313131 SlideSlideSlide四分位數距四分位數距四分位數距四分位數距(interquartile range, IQR)這個離散這個離散量數是第三四分位數與第一四分位數的差。量數是第三四分位數與第一四分位數的差。IQR Q3 Q1IQR為中間為中間50% 資料的全距。資料的全距。能克服極端資料值的離散量數。能克服極端資料值的離散量數。 2006 by 滄海書局 323232 SlideSlideSlide四分位數距實例四分位數距實例參考表參考表3.1商學院畢業生的起薪資料,對每月起商學院畢業生的起薪資料,對每月起薪資料而言,第三與第一四分位數分別

22、為薪資料而言,第三與第一四分位數分別為 Q33,000與與 Q1 2,865,因此,因此,IQR為為30002865135。 2006 by 滄海書局 333333 SlideSlideSlide變異數變異數(variance)是利用到全部資料的離散量數。是利用到全部資料的離散量數。變異數變異數變異數是根據每一個觀察值與平均數之差而求變異數是根據每一個觀察值與平均數之差而求得。每一個觀察值與平均數得。每一個觀察值與平均數(為樣本平均數為樣本平均數, 為母體平均數為母體平均數)之差稱為之差稱為離差離差(deviation about the mean)。 2006 by 滄海書局 343434

23、SlideSlideSlide 變異數之定義如下:變異數之定義如下: 當樣本平均數的差距平方和除以當樣本平均數的差距平方和除以n1,而非,而非n時,此樣本變異數為母體變異數的不偏估計量時,此樣本變異數為母體變異數的不偏估計量樣本變異數樣本變異數母體變異數母體變異數變異數變異數 2006 by 滄海書局 353535 SlideSlideSlide變異數實例變異數實例利用利用3.1節中節中5個大學班級人數的樣本為例。個大學班級人數的樣本為例。資料的彙總在表資料的彙總在表3.3,包括離差及離差的平方。,包括離差及離差的平方。離差平方的總和為離差平方的總和為256。因此,。因此,在在n14時,樣本變

24、異數為時,樣本變異數為 2006 by 滄海書局 363636 SlideSlideSlide變異數實例變異數實例 2006 by 滄海書局 373737 SlideSlideSlide變異數實例變異數實例表表3.1的起薪資料為例說明樣本變異數的計算,的起薪資料為例說明樣本變異數的計算,在在3.1節中,我們算出樣本平均起薪值為節中,我們算出樣本平均起薪值為2,940。樣本變異數。樣本變異數(s227,440.91)的結果列於表的結果列於表3.4。表表3.3與與3.4中值得注意的是我們算出離差與離中值得注意的是我們算出離差與離差平方的總和。對於任何資料集,離差的總和差平方的總和。對於任何資料集,

25、離差的總和必為必為0。因此,如同表。因此,如同表3.3與表與表3.4顯示顯示 0,這是恆成立的,因為正的離差與負的離,這是恆成立的,因為正的離差與負的離差會相互抵消,而使得離差的總和為差會相互抵消,而使得離差的總和為0。 2006 by 滄海書局 383838 SlideSlideSlide 2006 by 滄海書局 393939 SlideSlideSlide標準差標準差(standard deviation)的定義是變異數的的定義是變異數的正平方根。正平方根。標準差比變異數容意解釋,因為標準差的標準差比變異數容意解釋,因為標準差的衡量衡量單位與資料相同單位與資料相同。標準差標準差 2006

26、 by 滄海書局 404040 SlideSlideSlide由變異數得到標準差的方法如下。由變異數得到標準差的方法如下。 樣本標準差樣本標準差母體標準差母體標準差標準差標準差 2006 by 滄海書局 414141 SlideSlideSlide標準差實例標準差實例以表以表3.1的起薪資料為例,樣本標準差為的起薪資料為例,樣本標準差為 s 165.65。 2006 by 滄海書局 424242 SlideSlideSlide變異係數計算如下:變異係數計算如下: 變異係數變異係數變異係數是變異性的相對衡量,它衡量標準差變異係數是變異性的相對衡量,它衡量標準差相對於平均值的大小。相對於平均值的大

27、小。樣本變異係數樣本變異係數 母體變異係數母體變異係數 2006 by 滄海書局 434343 SlideSlideSlide變異係數實例變異係數實例以表以表3.1起薪資料為例,其樣本平均數起薪資料為例,其樣本平均數2,940與與樣本標準差樣本標準差165.65,變異係數為,變異係數為(165.65/2940)100%5.6%,這告訴我們此,這告訴我們此樣本之標準差佔平均數的樣本之標準差佔平均數的5.6%。一般而言,欲比較具有不同的標準差與平均數一般而言,欲比較具有不同的標準差與平均數的資料之離散程度時,變異係數是一個有用的的資料之離散程度時,變異係數是一個有用的統計量。統計量。 2006 by 滄海書局 444444 SlideSlideSlide此樣本之標此樣本之標準差佔平均準差佔平均數的數的5.6%5.6%變異數變異數標準差標準差變異係數變異係數表表3.1起薪資料為例起薪資料為例 2006 by 滄海書局 454545 SlideSlideSlideEnd of Chapter 3, Part A

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号