使得个体间在此空间的距离与其相似性尽可能保持一致

上传人:小** 文档编号:55078320 上传时间:2018-09-24 格式:PPT 页数:70 大小:531.53KB
返回 下载 相关 举报
使得个体间在此空间的距离与其相似性尽可能保持一致_第1页
第1页 / 共70页
使得个体间在此空间的距离与其相似性尽可能保持一致_第2页
第2页 / 共70页
使得个体间在此空间的距离与其相似性尽可能保持一致_第3页
第3页 / 共70页
使得个体间在此空间的距离与其相似性尽可能保持一致_第4页
第4页 / 共70页
使得个体间在此空间的距离与其相似性尽可能保持一致_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《使得个体间在此空间的距离与其相似性尽可能保持一致》由会员分享,可在线阅读,更多相关《使得个体间在此空间的距离与其相似性尽可能保持一致(70页珍藏版)》请在金锄头文库上搜索。

1、Ch7 Multidimensional scaling,7.1前言,前述四、五、六章中,我們談論到主成分分析與因素分析,聚焦於變數之間的關聯性。接下來兩張的焦點將轉移至試著去了解觀察值之間的相似性型態。 Multidimensional scaling (MDS)一組方法用來獲得個體(entities)間的相似性的空間表達。 主成分分析與因素分析也是一種scaling的方法,將觀察值以較少構面表達於空間圖。 MDS所使用的資料與主成分分析(或因素分析)不同,它所利用的資訊是成對個體間的相對接近性或相似性,它的目的是利用此種資訊去建構合適的低次元空間,使得個體間在此空間的距離與其相似性盡可能保

2、持一致。,7.1前言(續),當相似性資料的性質具度量性(metric)時,(即它們代表個體間的真實距離),我們所使用的方法為 metric MDS 去還原資料空間。本章所要介紹的metric MDS 方法是Torgerson(1958)所提出的古典MDS。 就大部分的應用問題而言,其相似性資料並不具有metric scale的性質,(例如ordinal),此時我們使用nonmetric MDS。在nonmetric MDS方法中,排序資料是由單一個人提供,或由多人提供但整合為一個排序(假設這些人在評估個體間相似性時,所使用的標準及權重都是一樣的,homogeneous) 但若承認不同個人使用的

3、標準及權重有差異時,我們需使用另一種方法:Individual differences scaling;此法所建立的空間圖,允許不同個人對在評估的個體間相似性時,使用不同的特徵及不同權重。,7.1前言(續),有時資料涉及兩個不同組的個體間的相似性資料,例如一組包含若干消費者,另一組為三種品牌手機,每一個消費者表達他對三種手機的偏好順序,因此我們就有每個消費者與三種手機的相對相似性,本章將介紹MDPREF (multidimensional analysis of preference)的方法來解決此種資料的尺度還原問題。,7.1.1 Potential Applications - Perce

4、ptual Mapping,Perceptual Mapping 是MDS最廣泛的應用之一。Nonmetric MDS的一個優點是它能提供心理距離的尺度以描繪個人心中的心理地圖。 Perceptual Mapping最經典的範例是Roger.N. Shepard探討個別居民關於美國本土各州間相對接近性的主觀判斷。他用的是nonmetric MDS。 以圖7.1為例,此為波士頓居民對於美國本土各州相對接近性的主觀判斷所繪成之美國地圖。雖然結構上與實際的美國地圖相似,但東半部各州的相對距離似乎被誇大。,-Market Segmentation and Product Positioning,當做產

5、品定位時,我們除了要確定我們的產品與目標顧客心中的其他品牌產品能有所區別外,也希望我們的產品能在顧客的知覺空間中佔有一個有吸引力的地位。 為了要解決這樣的問題,我們可以使用MDS來同時決定產品空間圖及個別顧客每個產品偏好的分佈圖。 圖7.2是根據32位學生以1到10分來表示每個人對10種不同廠牌啤酒喜好,使用MDPREF分析所獲得的空間知覺圖。 這樣的圖可以告訴我們這32位學生對於不同廠牌啤酒喜好的分佈形態及不同啤酒的空間知覺分布。因此,我們可以根據這樣的資料來作為新啤酒品牌投入市場時其產品定位及市場區隔。,7.2 Classical Metric MDS: How it works-Intu

6、ition,以表7.1為例,其顯示出歐洲10個城市之間的直線距離,我們將以此為資料來重建此10個城市的相對位置圖 若我們以手製圖(程序為何?),所描繪出的地圖(圖7.3)與實際地圖之間可能會產生以下問題: 會失去個別城市的絕對位址(absolute location) 地圖有可能是實際地圖的鏡像 地圖可能被旋轉而與實際不同 我們可以利用Metric MDS來解決上述問題,7.2.2 Classical Metric MDS: How it works-Mechanics,首先列出不同受估個體(object)間的相似性或不相似性矩陣,而這些矩陣內的數字與個體之間的距離是線性相關(透過一個線性函數

7、)的,其斜率可為正向(不相似性)或負向(相似性) 若資料是屬於相似性資料,我們先將資料中每一個資料值減去資料中的最大值,以轉換為不相似性資料,隨後在上述的線性函數中求出常數項,函數的斜率可設為1,因為圖是任意的,如此只剩下截距項(常數項)需設法求出 另外,在Torgerson(1958)中指出,有許多方法可以求出上述的常數項,但最為被廣泛使用的是其書上所提到的one-dimensional subspace,此法為每一個不相似係數加上一個正數,且此正數為確保讓加過正數的每一個相似性係數都滿足三角不等式公理的最小常數,如此加過正數的不相似性係數才能成為距離係數,7.2.2 Classical M

8、etric MDS: How it works-Mechanics,根據Torgerson,將上述求得的常數項作為所有不相似性資料jk之加項,以轉換成估計的距離djk:當資料矩陣為對稱的且其對角線直接為零,則我們所求得的距離近似於Euclidean distance,7.2.2 Classical Metric MDS: How it works-Mechanics,為了解決每個受估個體在空間構面座標位置的問題,我們使用圖7.4的幾何關係,亦可表達為下式:上式重新排列後為:以個體i為原點,dij指個體j在空間圖上距離原點的距離,dik類同,因為故上式可再轉換為,7.2.2 Classical

9、Metric MDS: How it works-Mechanics,由前式,我們可以用以求得個受測體的座標位置。 為求個體i的座標位置,我們另外創造了 (n-1)by(n-1)的矩陣B(i),i表示個體i被選為座標圖上的原點, 因為B(i)矩陣為對稱的故又可表達為 ,U為特徵向量的矩陣,而為特徵值的對角矩陣,所以,7.2.3 Sample Problem: Mapping cities from intercity distances,當使用Metric MDS時,例如在本例,若我們所選擇的起點城市太靠近空間圖的邊緣,資料間的微小差異性可能在求最後解時被放大。因此一般而言,不以任選一個體為原

10、點,而選所有個體的中心為原點。 因此我們將B(i)略作修改,我們創造一個nbyn的矩陣B,而其組成資料bjk係由以下式子計算求得(Torgerson 1958):表7.2即利用上式推算求得;另外B矩陣的Sigular value decomposition之結果呈現在表7.3,其中只有兩個特徵值是非常大的,其餘的皆相對地非常小,這也表示此雙構面的解足以將這些城市的相對位置描繪出來,7.2.3 Sample Problem: Mapping cities from intercity distances,圖7.5係根據表7.3繪製而成,但須注意的是,這與我們實際上看到的歐洲城市相對位置是不同的,

11、將圖旋轉以後,這些城市也不在其正常位置。 若將圖先鏡射再旋轉,則可得到這些城市正常的相對位置。,7.3 Nonmetric MDS: How it works,雖然前節談到Torgerson對於Metric MDS問題的解決方法是很有用的,但通常我們所遇到的應用問題,通常不涉及實際距離資料或可度量(metric)相近性資料。因此,我們通常對於nonmetric資料的空間表達較感興趣。 以下範例針對單一個人對於10種車價相當的不同車款之不相似性的認知。接受測試的人以1至45分來排序每對車款的相似性,1分代表最相似,45分代表最不相似。表7.4為不同車款的知覺不相似性矩陣中,矩陣中的資料為次序尺度

12、(ordinal)。 Nonmetric不相似性資料轉換成距離資料是困難的,因為兩者間非簡單的線性關係,而是非線性關係;因此Togerson的metric MDS方法不適合用來解決問題。以下將介紹Kruscal的iterative approach。,7.3.1 Intuition,於本節中,我們將探討Kruskal的two-way nonmetric MDS approach,我們將用到前述表7.4中的相異性資料。Step1:選擇空間圖的構面數 r 。Step2:選擇起始空間分布圖。用metric MDS所獲得的解,可以作為一個很好的起始分布。若能嘗試使用多個起始分佈,可避免最終圖形分布陷入

13、local optimum 。Step3:計算空間圖上的點兩兩間的距離Step4:評估距離dij與不相似性ij之間的一致性。利用least squares monotone regression 將ij轉換為 ,再利用下頁的公式計算當前解的壓力係數。圖7.7為Shepard diagram,即可用以評估dij與ij之間的一致性,7.3.1 Intuition,Krustal(1964)為前述的一致性找到衡量的指標Stress值,當此值越小時,空間圖點的兩兩間距離的排序與原始不相似性資料的排序越一致,即越fit:Step5:使用數值最適法(例如gradient search method)搜尋空

14、間圖各點的移動方向,使減低壓力係數;回Step3。若所有點都無法移動以得到更好的壓力係數時,表示已經收斂,此時可回Step1,選擇另一個r 或終止此程序。,決定r的經驗法則,Smallest number of objects generally necessary for a viable nonmetric MDS solution in r dimensions:,7.3.3 Sample problem:,PROC MDS ; VAR variables ; INVAR variables ; ID | OBJECT variable ; MATRIX | SUBJECT variab

15、le ; WEIGHT variables ; BY variables ; The PROC MDS statement is required. All other statements are optional.,MDS的語法,例: 美國各大都市的飛行距離,data city; title Analysis of Flying Mileages Between Ten U.S. Cities; input (atlanta chicago denver houston losangeles miami newyork sanfran seattle washdc) (5.) 56 cit

16、y $15.; datalines; 0 Atlanta 587 0 Chicago 1212 920 0 Denver 701 940 879 0 Houston 1936 1745 831 1374 0 Los Angeles 604 1188 1726 968 2339 0 Miami 748 713 1631 1420 2451 1092 0 New York 2139 1858 949 1645 347 2594 2571 0 San Francisco 2182 1737 1021 1891 959 2734 2408 678 0 Seattle 543 597 1494 1220

17、 2300 923 205 2442 2329 0 Washington D.C. ;proc print data=city; proc mds data=city level=absolute converge=0.0001 pfinal out=out outres=res; id city; run; %plotit(data=out, datatype=mds, labelvar=city, vtoh=1.75, labfont=swissb); run;proc print data=res;proc gplot data=res;plot data*distance data*fitdata /overlay;run;,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号