角色外貌:
研究生:王曉明
指導教授:賴勇成老師
口試委員:鍾昀儒教授,呂舜教授
線上見習研究生,請見下表:
陳忠志 |
雷妲娜 |
林琬芸 |
孫珮馨 |
羅文娜 |
陳星喆 |
薛素梅 |
夏梅雅 |
鄭宇廷 |
宋亞君 |
唐盈盈 |
潘氏璧 |
宋昕祐 |
萬小芳 |
阮氏賢 |
施海瓊 |
梁山達 |
范竹琼 |
丁喜妲 |
莫堤妲 |
艾 琳 |
蘇樂林 |
呂述莉 |
|
--------------------------
場景事件:
一日,曉明的研究論文口試現場。
曉明的研究議題,是近日才剛結束的統測,https://www.cna.com.tw/news/ahel/202204300209.aspx。
論文題目是,教師教學策略對學生學習成效影響之研究-以參加111年甄試中壢地區學生為例。
曉明,完成15~18分鐘的論文簡報。
鍾教授提問,請將投影片轉到資料畫面(如下),關於學生在閱讀,作文,推理等成績,曉明你選用的主成分分析(PCA),是不對的,應該選用因素分析(FA)。
呂教授接著提問,曉明你選用的主成分分析(PCA),應該要說明使用主成分分析(PCA)的原因,以釋疑鍾教授的提問。
這時候的曉明,望著指導教授,心想,指導教授快救我。
指導教授僅有咳嗽兩聲,眼神飄向遠方。看起來,曉明心知要自己想辦法Defense,此時,曉明看一下Line訊息,線上同學有無pass訊息救援...............
此時,曉明想到了指導老師在上課時,提到主成分分析(PCA)與因素分析(FA),都是縮減變數的方法。前者是形成型指標,後者是反映型指標。存在著使用PCA與FA的差異。
兩位委員,問題:
鍾教授認為應該採因素分析(FA),但
呂教授則認為可以採用主成分分析(PCA),但須說明採用PCA的理由。
這時候,王曉明不知如何是好?
-----------------------------
地點外觀:
研究生王曉明口試現場,在C403教室,教室外觀如下
--------------------------
角色行動:
王曉明: 吸氣,我要讓我自己冷靜。呼氣,我要讓我自己放鬆。眼神,飄向指導教授。
鍾教授: 等待王曉明回答。
呂教授: 等待王曉明回答。
線上見習研究生: 請提供意見,救救同學。
----------------------------------------------------------------------------------------
線上見習研究生,請按下回應,寫下你/妳意見,提醒同學。
所以你們認為王曉明該用哪種分析法?為什麼??
以上述科目可以做主成分分析,若是有其他更多科目且不確定其相關性的話,最好還是做因素分析
以論文題目來說,主成分分析亦可達到其目的,但因素分析精確度確實較高,也適合。
因素分析(FA)
1.反映型(Reflective)指標。
2.從原始/觀察O變數來估計潛在L變數。
3.共變異數取向。
4.變數分群;萃取成份必須進行轉軸。
5.藉著少數共同因素解釋O變數間的相關程度。
回覆 : 艾琳; 曉明應採用去中心化(把坐標原點放在數據中心) , 然後; 找出坐標(找到方差最大的方向) , 問題; 怎麼找到方差最大的方向。
數據 → 去中心化 → 協方差矩陣 → 待征向量 ↗ 坐標軸方向 。
↘ 特征值 → 坐標軸方向的方差 。
回覆 : 述莉 ;
1. 從一群變數找出少數幾個共同的因素。
2. 偵測變數間的相關結構,以便將變數做分類。
3. 將一群變數經分組組成少數幾個同質性高的變數群組。
4. 篩選變數或降低變數的個數,以便將資料簡化。
5. 從同質性高的變數群組中挑選一個、兩個或因素本身當代表。衡量一些不能直接測量的因素。
回覆:琬芸;資料降維假設有一些資料, 這資料中每一筆維度都很高, 導致很難“看出”或“分析”這資料集的特性, 這時候就會想要在低維度空間裡(通常三維以下)建構一組點資料, 並且想辦法使新的這組點資料在某些程度上能表示出原本高維度的點資料或保有某種特性.這種將高維度資料在低維度表現出來的方式就稱為資料降維.而 PCA 就是其中一種線性降維的方式.
因素分析與主成分分析比較兩種的相同性質說明:
因素分析(FA)與主成分分析(PCV)比較兩種的相同性質:
1. 兩者都被歸於探索資料分析分法 (exploratory data analysis)。
2. 兩者皆可應用於降維。如果特殊變異數 很小,兩者給出相近的因素分數 (標準化後);如果特殊變異數為零,因素分析與主成分分析有相同的結果。
因素分析(FA)與主成分分析(PCA)的相異性質:
- 因素分析假設一個資料產生模型,主成分分析沒有任何假設。
- 因素分析強調因素至可量測變數的變換,主成分分析強調可量測變數至主成分的變換。
- 因素分析的因素分數計算複雜,主成分分析的主成分分數計算相對簡單。
- 因素分析 (配合適當的旋轉) 的負載矩陣可用於解釋變數間的關係,主成分分析則不具備此功能。
回覆 : 莫堤妲 ; 精準客觀的分析結果PCA&FA為形成型跟反映型指標,本身兩種方法都有基礎上的差異 .
對變數進行因素分析之前, 應先進行KMO取樣適當性檢定及巴氐球形檢定(Bartlett Test of Sphericity) 以確定資料的分析效果及是否適合進行因素分析? KMO值越高表示進行因素分析的效果越好.
其值在0.9以上表示交果佳.
0.8以上表示有價值的.
0.7以上是中度的.
0.6以上是不好也不壞.
0.5以上是不太好的.
巴氐球形檢定則是在檢定資料分析所需之變數而已.
至於應縮減為幾個因素? HKaiscr 所倡之方法為依以能解釋之變異數(特微值)達1.0為選取標準, 自動判斷應縮減為幾個因素?這應是最常被選用之判斷方法.
曉明同學論文,屬形成型指標,透過字義、語詞、閱讀等成績簡化成語文能力。以上變數有些是相關的,先將相關的變數中選擇一個或者將幾個變數總合成一個變數作代表。用少數變數來代表所有變數和解釋研究問題,將繁瑣做簡化,抓住方向,也是降維的想法。
指導老師: 沒錯。研究問題,將繁瑣做簡化,抓住方向。很棒。詳細可以參考22樓的說法。
回覆 : 亞君 Jennifer ;「主成分分析被歸類為降維內特徵擷取的一種方法,降維就是希望資料的維度數減少,但整體的效能不會差異太多甚至會更好」 → 簡單說法是,降維(Dimension reduction)是當資料維度數(變數)很多的時候,有沒有辦法讓維度數(變數)少一點,但資料特性不會差太多。
那麼決定是否適合做因素分析; 在進行因素分析尋求較少之因素來代表較多之變數之前,應先確定各變數分數間具有共同變異之存在,如此才值得作因素分析。
1. **問題的目標**:首先,他應該清楚問題的目標是什麼。因素分析(FA)和主成分分析(PCA)雖然都是多變量分析方法,但其目標不同。因素分析旨在找出潛在的共變變量,而主成分分析則旨在將原始變量轉換為一組互相獨立的主成分。
2. **數據特徵**:考慮數據的特徵,包括變量之間的相關性和變量的性質。如果變量之間存在高度相關性且存在潛在的共變變量,可能更適合使用因素分析。而如果變量之間的相關性較低,且希望將變量降維為互相獨立的主成分,則主成分分析可能更合適。
3. **數據假設**:考慮數據是否符合分析方法的假設。因素分析通常假設變量之間存在共變性,且每個變量受多個共變因素影響。而主成分分析則假設變量之間存在線性關係,並且旨在最大化變量的方差解釋。
基於以上考慮,如果王曉明的目標是找出潛在的共變變量,且數據符合因素分析的假設,那麼可以採用因素分析。如果他更關心的是將原始變量轉換為互相獨立的主成分,並且數據的相關性較低,那麼主成分分析可能更合適。
在這個情況下,建議王曉明先確定問題的目標,再根據數據的特徵和假設來選擇合適的分析方法。如果仍然不確定,他也可以考慮諮詢其他專家或進一步研究有關因素分析和主成分分析的文獻。
PCA可以用於縮減變數,將大量變數轉換為少量不相關的主成分,有助於降低數據維度和複雜性。
PCA適用於形成型指標,主要用於發現變數之間的結構,而不是解釋隱含的潛在變量。
在一些情況下,PCA可能更適合於數據的特性和研究問題,因此選擇PCA可能有助於達到研究的目標。
曉明可以根據這些原因,對採用主成分分析(PCA)而非因素分析(FA)提供清晰且合理的解釋,以回應鍾教授和呂教授對於使用不同分析方法的看法。
- PCA與FA的區別:
因素分析 (FA):主要用於探討潛在的因素(隱變量),這些因素解釋觀測變量之間的相關性。FA的因素是基於變量的共同變異,是反映型指標。
- 使用PCA的理由:
說明曉明的目的是減少數據的複雜性,去除多餘的信息,並且PCA能夠保留大部分數據的變異,這樣可以更清晰地展示不同變數對學生成績的影響。
回應鍾教授時,曉明可以這樣說:「鍾教授,謝謝您的建議。我選用主成分分析(PCA)主要是為了簡化數據,去除冗餘信息,並保留數據的主要變異。這樣可以更清晰地展示不同變數(如閱讀、作文、推理等)對學生成績的影響。當然,若研究目的是探索潛在因素,因素分析(FA)會是更好的選擇。」
回應呂教授時,曉明可以這樣說:「呂教授,謝謝您的支持。選用PCA的原因是希望通過簡化數據來更好地理解不同變數對學生成績的影響。PCA能夠減少數據的複雜性,並且保留大部分數據的變異,這樣可以更有效地進行後續的數據分析。」
因子分析(FA)是另一種用於分析多變量資料的統計方法。它與 PCA 的目標有相似之處,即識別潛在模式並降低維度。然而,FA 與 PCA 的不同之處在於其基本假設和解釋。
為什麼 FA 更適合分析學生成績. 在分析學生的閱讀、寫作和推理成績時,FA 是更合適的選擇,因為它符合以下考慮因素:
可解釋性:目標是了解影響學生在這些領域表現的根本因素。 FA 旨在識別這些潛在因素,這些因素可以解釋為與閱讀、寫作和推理能力相關的心理結構。
理論架構:FA 與理論架構較好地保持一致,這些理論架構假定存在影響學生表現的潛在因素或結構。這些因素可能代表認知能力或學習過程的不同面向。
資料結構:FA中公共因素的假設更適合分析學生成績,因為這些分數很可能受到共同的潛在因素的影響,而不是完全獨立。
結論
雖然 PCA 和 FA 都可以用於數據縮減和降維,但 FA 通常被認為更適合分析心理數據,例如學生成績,因為它強調可解釋性,並且與假設存在潛在構造的理論框架保持一致。在給定的場景中,教授使用 FA 而不是 PCA 的建議是合理的,因為 FA 更適合理解影響學生閱讀、寫作和推理表現的潛在因素。
我認為應該要用因素分析(FA),因為因素分析主要用於解釋效度,變數與變數之間相關性係數高,有共同因素,用因素分析(FA)估算過程的誤差較小,精確度較高,應該要採用因素分析(FA)。
採用主成份分析(PCA)也能達到統計,因素分析是主成份分析的初始概念,因素分析在數學與統計的立論基礎上優於主成分分析,假設誤差項彼此之間可能存在關聯性,亦即誤差項並非完全獨立。成份之間的變數項目相互獨立,沒有關聯性,並不適合用於曉明的論文。
主成分分析 (PCA) 透過線性組合來簡化數據。比如,將身高與體重縮減為體型,將考試壓力與課堂壓力縮減為學校壓力,將家庭經濟壓力、父親期望壓力、母親期望壓力縮減為家庭壓力。觀察變數可以正相關、負相關或無關,且無法相互取代。
因素分析(FA)旨在找出多個變數間的共通相關性。例如,從字義、語詞、閱讀、作文中提取語文能力,或從推理、空間、計算中提取數學能力。觀察變數需中高度相關,且可相互取代,缺少個別變數不會影響潛在變數的形成。
PCA和FA的區別:
主成分分析(PCA):旨在透過降維來解釋資料的總變異,主要用於簡化資料並去除冗餘。 PCA的主要組成部分是基於變數之間的線性組合,並且是形成性指標。
因素分析(FA):主要用於發現解釋觀察變數之間相關性的潛在因素(隱藏變數)。 FA的因素是基於變數的一般變化,是反映性指標。
我認為曉明應該使用PCA,因為在曉明的研究中,目的是簡化資料並將許多相關變數(例如閱讀、佈局、推理等)的維度減少為幾個主要部分,以便更好地理解。變數對效能影響篩選測試的影響。目的是降低資料複雜度並消除冗餘訊息,PCA可以保留資料中的大部分變化,從而可以更好地揭示不同變數對學生學習結果的影響。
PCA對於曉明來說可能是個合適的選擇。
因素分析(FA)
1.反映型(Reflective)指標。
2.從原始/觀察O變數來估計潛在L變數。
3.共變異數取向。
4.變數分群;萃取成份必須進行轉軸。
5.藉著少數共同因素解釋O變數間的相關程度。
因王曉明的論文題目為: 教師教學策略對學生學習成效影響之研究-以參加111年甄試中壢地區學生為例。關於學生在閱讀,作文,推理等成績採用因素分析(FA)是沒問題的,我們可以找出教學策略之共通相關性,觀察變數間可相互取代,若是觀察變數缺少一個,不會影響潛在構念。
麗君覺得可用因素分析,因為閱讀和作文有共通相關性,且是中高度的相關,缺少一個不會影響,可相互取代。