《回归分析的例子》ppt课件

上传人:tian****1990 文档编号:74936194 上传时间:2019-01-30 格式:PPT 页数:42 大小:1.34MB
返回 下载 相关 举报
《回归分析的例子》ppt课件_第1页
第1页 / 共42页
《回归分析的例子》ppt课件_第2页
第2页 / 共42页
《回归分析的例子》ppt课件_第3页
第3页 / 共42页
《回归分析的例子》ppt课件_第4页
第4页 / 共42页
《回归分析的例子》ppt课件_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《《回归分析的例子》ppt课件》由会员分享,可在线阅读,更多相关《《回归分析的例子》ppt课件(42页珍藏版)》请在金锄头文库上搜索。

1、迴歸分析的例子,黃熾森 香港中文大學管理學系教授 地址: 香港新界沙田香港中文大學管理學系 電郵:cswongbaf.msmail.cuhk.edu.hk 2006年3月,大綱,迴歸分析及其統計測試原理 虛擬變項(Dummy Variable)的運用 增加效度(Incremental Validity) 調節變項(Moderator)的測試 中介變項(Mediator)的測試 應用迴歸分析時要注意的重點 討論幾個應用迴歸分析的研究例子,迴歸分析的數學方程,自變項與依變項成線性關係(Linear Relationship),假如X1及X2(即自變項;Independent Variables)是

2、Y(即依變項;Dependent Variable)的原因,那麼它們的關係可用以下方程式代表: Y = 0 + 1X1 + 2X2 + 其中: (1) 0為一常數; (2) 1代表了如果X1改變了一個單位,Y會改變的程度; (3) 2代表了如果X2改變了一個單位,Y會改變的程度; (4) 代表了隨機的誤差;,變異量的角度:最簡單的情況,最簡單的情況: 1和2是獨立的,如果A佔Y的總變異量的比重愈高,那麼1便會愈大,反映X1對Y的影響愈大; 如果B佔Y的總變異量的比重愈高,那麼2便會愈大,反映X2對Y的影響愈大。 而C則是代表了X1及X2無法影響Y的部分,也就是的變異量了。因此C佔Y的總變異量的

3、比重愈高,以X1及X2來預測或解釋Y的變異情況的能力便愈差。 A和B的部分是沒有關係的,那就是說1和2是獨立的,不會互相影響。,變異量的角度:更常見的情形,常見的情形: 1和2不是獨立的,如果我們假設這個圖中C佔Y的總變異量與之前的圖一樣,那麼,X1及X2對預測或解釋Y的變異情況的能力也會與之前的圖一樣(即A+B=a+b+D) 1和2不是獨立的,它們會互相影響,因為如果我們不考慮X2, 1便會較大;同樣地,因為如果我們不考慮X1, 2便會較大。 這一點對我們了解真實的現象是很重要的,因為如果在真實的現象中,X1及X2都同時存在而對Y有所影響,但我們的理論卻沒有考慮X1及X2都同時存在的情形,那

4、麼我們的理論便不能正確地描述這些自變項和依變項的關係了。,迴歸分析的原理,迴歸分析的原理是同時(simultaneously)考慮不同自變項對某一依變項的影響,兩點是很重要的: (1)整體而言,這些自變項對依變項的預測或解釋能力有多大,即的變異量佔Y的總變異量的大小,如果愈小,則預測或解釋能力愈高; (2)在同時考慮了所有自變項的情況下,個別自變項對依變項的影響,因此,我們可作出這樣的結論:在其他因素不變的情況下,這個自變項(例如X1)對依變項(例如Y)的影響是當X1改變一個單位時,Y會改變1的單位(Given other things equal, Y will change by 1 un

5、it when X1 changes one unit)。,迴歸分析的統計數和參數,R2 , b0及bi的計算,因為我們是要以自變項來預測或解釋依變項,因此,在樣本的數據中,我們是找出一組b0及bi的數值使e的變異量最小的,然後用這一組的R2及bi來作統計測試(Hypothesis testing)。,R2 的統計測試,證整體而言,自變項對依變項的預測或解釋能力是否存在: (1)設立保守假設,即在母體中自變項對依變項沒有影響,所有自變項與依變項均無共變量,即母體的1 (的變異量)/(Y的變異量) 等於零。 (2)抽取樣本、測量各自變項及依變項,以取得數據計算R2 ; (3)計算在保守假設正確時

6、,我們會看到這個樣本的R2的機會有多大(即P值;P value); (4)根據P值判斷是否要推翻原來保守的假設。,i 的統計測試,在其他因素不變的情況下,各自變頂對依變項的影響。我們以X1為例: (1)設立保守假設,即在母體中X1對Y沒有影響,所以1等於零; (2)抽取樣本、測量各自變項及依變項,以取得數據計算b1; (3)計算在保守假設正確時(即1等於零),我們會看到這個樣本的b1的機會有多大(即P值;P value); (4)根據P值判斷是否要推翻原來保守的假設。,虛擬變項的需要,由於我們以: Y = 0 + 1X1 + 2X2 + 這樣的方程式來代表X1、X2及Y的關係,事實上我們已經假

7、設了X1、X2及Y最起碼是等距尺度的了,否則數學上無法運算。,類別尺度的虛擬變項,例如X2是性別,那麼我們可創造一個新的虛擬變項(D)代替,當回應者是男性時,把D設定為1,而當回應者是女性時,把D設定為0,這樣一來,迴歸的方程式是: Y = 0 + 1 X1 + 2D + 。 (1) 當D等於1時,變成:Y = 0 + 1X1 + 2 + ; (2) 當D等於0時,變成:Y = 0 + 1X1 + 。 如果在統計測試中我們的結論是2等於零時,便代表男性和女性在預測或解釋Y方面沒有作用,因為無論回應者是男性還是女性,我們接受的結論均為: Y = 0 + 1X1 + 。 所以,以虛擬變項(D)代表

8、性別後,我們便可以如常地進行迴歸分析。,依變項的虛擬變項,假如依變項(Y)是類別尺度測量及分為兩類的,我們仍可設立虛擬變項,進行特別的迴歸分析,稱為Logistic Regression。 例如:離職(Turnover)的研究。,多於兩個類別的虛擬變項,假如X2是多於兩個類別,例如是公司的種類:國營企業(SOE)、中外合資企業(JV)、外資獨資企業(WOFE) ,這樣我們便要創造兩個新的虛擬變項(D1及D2)來代替這變項。 例如當企業是SOE時,把D1設定為1,而其他企業則把D1設定為0;當企業是JV時,把D2設定為1,而其他企業則把D2設定為0。 我們的迴歸方程式便是: Y = 0 + 1

9、X1 + 2D1 + 3D2 + 如果在統計測試中我們的結論是2及3均等於零時,則代表企業類別對預測或解釋Y方面沒有用。 如果自變項的類別數目為n時,我們祗要設定(n-1)個虛擬變項,便可進行迴歸分析以測試此自變項對依變項的影響。,增加效度的測試,增加效度(Incremental validity):即某一自變項在考慮了已知其他對依變項有影響的自變項後,仍對依變項有影響。 有些理論也可能描述了各自變項對依變項的影響是一個(或一類)接一個(或一類)的 我們不能單靠R2及bi的測試來驗證這些理論的正確性,而要用Hierarchical Regression的方法 。,Hierarchical Re

10、gression的測試-1,如我們要驗證X2是否在X1之上,對Y仍有預測及解釋能力,我們可比較以下兩個方程式: (1) Y = 01 + 11X1 + 1 (2) Y = 02 + 12X1 + 2X2 + 2 如果第二個方程式對Y的預測及解釋能力較第一個方程式為高,那麼我們便可以說X2是在X1之上,對Y仍有預測及解釋能力。在樣本的數據中,我們便是比較兩個方程式的R2的分別(稱為delta R-square;R2)。,Hierarchical Regression的測試-2,(1)設立保守假設,即在母體中兩個方程式對Y的預測及解釋能力沒有分別,即兩個方程式的 1 (的變異量)/(Y的變異量)

11、是一樣的。 (2)抽取樣本、測量各自變項及依變項,以取得數據計算兩個方程的R2及R2; (3)計算在保守假設正確時,我們會看到這個樣本的R2的機會有多大(即P值;P value); (4)根據P值判斷是否要推翻原來保守的假設。,調節變項的測試 -1,在迴歸分析中我們可用交互變項(Interaction term)來驗證調節變項。所謂交互變項,就是兩個可能是調節變項相乘的積(Cross-product term), 例如我們要驗證X2是否在X1和Y的關係中,擔當了調節的作用,我們可先計算X1及X2相乘的積(X1*X2)。我們可用Hierarchical Regression 的測試方法,比較以下

12、兩個方程式: (1) Y = 0 + 1X1 + 2X2 + 1 (2) Y = 0 + 1X1 + 2X2 + 3(X1*X2) + 2 如果我們的結論是接受第二個方程式,即在R2的測試中我們推翻它等於零的保守假設,便等於承認了X2在X1和Y的關係中擔當了調節的作用。,調節變項的測試 -2,我們說當X2不變時,而X1增加了一個單位,那麼Y的改變(Y)會是: (1) Y1 = 0 + 1X1 + 2X2 + 3(X1*X2) + (2) Y2 = 0 + 1(X1+1) + 2X2 + 3【(X1+1)*X2】+ Y = Y2 Y1 = 1 + 3X2 明顯地,由X1的改變而帶來對Y的轉變,仍

13、要視乎X2實際的數值而定。,調節變項的測試 -3,在檢定了調節變項後,如有需要,我們應以圖示其實際的調節形態,由迴歸分析的結果如何繪圖來表示調節的形態,可參看Aiken and West (1991) 。 如果我們要測試更高層次的交互作用,例如三個自變項(X1、X2及X3)的交互作用,也是以層級迴歸咎於Hierarchical Regression) 的測試方法,檢定加入了調節變項相乘的積(即X1*X2*X3)後的R2。 唯一要注意的是,在最後加入X1*X2*X3之前,我們需先把所有較低層次的交互作用(即X1*X2、X1*X3、X2*X3)包括在迴歸分析中,可參看Aiken and West

14、(1991)。,中介變項,中介變項(Mediator)的意思,就是說自變項對依變項的影響是透過中介變項的,如果M真的是X和Y的中介變項,那麼,它們的關係應該是:XMY。這裡有三個因果關係的條件: X是M的原因之一; X是Y的原因之一; X對Y的影響是透過M的。,中介變項的證據-1,在對樣本的迴歸的分析中,我們應該看到以下的結果(Judd & Kenny, 1981;Baron and Kenny, 1986): (1) X = b01 + b11M + e1 (2) Y = b02 + b21X + e2 (3) Y = b03 + b31X + b32M + e3 在第一個方程式中,以b11

15、來測試M和X的關係,結論應是:11不等於零。在第二個方程式中,以b21來測試X和Y的關係,結論應是:21不等於零。在第三個方程式中,是以b31和b32來測試當M被同時考慮時,X對Y的影響,最理想的結論是:31等於零,但32不等於零。 如果這三個條件都符合,我們的結論便會是:M是X和Y的中介變項。,中介變項的證據-2,有些時候,雖然第一個和第二個方程式的結論都得到支持,但在第三個方程式中我們的結論是31和32都不等於零,這樣我們便要看b21和b31的分別,或者是第二和第三個方程式的R2分別了。基本上,如果M是X和Y的中介變項,那麼這些分別應該是頗大的。 (MacKinnon, Lockwood,

16、 Hoffman, West, & Sheets (2002)有很詳細的總結。),應用迴歸分析時要注意的重點,(1) 自變項與依變項的因果關係。 (2) 自變項與依變項的測量尺度。 (3) 控制變項。 (4) 線性關係的設定。 (5) 測量的誤差。 (6) 數據方面的要求:例如應該是隨機和常態分佈的;當各自變項互相的共變量很大,bi便會很不穩定,使我們難以判斷最終對依變項的影響到底是來自那一個自變項,這問題稱為多線性問題(multicollinearity) 。,例子一:Law, Wong and Wang (2004) (1) 研究問題(Research Question)-1,這個研究要探討的是在中國,跨國企業(Transnational Corporations;TNC)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号