活動
敘述統計-分散統計量數
以統計量描述資料分配的樣態,介紹變異數和標準差的定義、計算和意義。
分散趨勢統計量用來衡量數據的分佈情況,包括數據如何分散及變異的程度。這些統計量幫助我們了解數據的波動和離散程度,以不同於集中趨勢統計量的方式理解數據的分配。以下是幾種常見的分散趨勢統計量:
全距(Range)
全距是統計學中最簡單的分散量數之一,定義為數據集中最大值與最小值之間的差異。它提供了一個簡單直觀的數據分佈範圍,能夠快速了解數據的最大變化幅度。然而,全距容易受到極端值的影響,可能會導致對數據分佈的誤導。因此,全距通常用於初步的數據分析,提供一個快速的數據範圍概覽。
四分位距(Interquartile Range, IQR)
四分位距是數據分佈中間50%的範圍,定義為第三四分位數(Q3)與第一四分位數(Q1)之間的差異。四分位距不受極端值的影響,因此能夠更準確地反映數據的真實分佈情況。它常用於描述數據的集中趨勢和變異程度,特別是在數據具有偏態分佈時。例如,在教育評估中,四分位距可以用來比較學生成績的分佈狀況。
變異數(Variance)
變異數是衡量數據變異程度的重要指標,定義為數據集中每個值與平均數之差的平方的平均。變異數提供了數據分佈的詳細資訊,但因為計算的是平方值,所以單位與原數據不同。較大的變異數表示數據點遠離平均數,分佈較為分散;較小的變異數則表示數據點靠近平均數,分佈較為集中。變異數在許多統計分析和研究中具有重要作用,尤其是在變異分析和假設檢定中。
標準差(Standard Deviation)
標準差是變異數的平方根,它保留了變異數的所有特性,但單位與原數據相同,使得解釋數據變異性更加直觀。標準差越大,表示數據越分散;標準差越小,表示數據越集中。標準差廣泛應用於統計分析、品質控制和金融風險管理等領域。例如,在品質控制中,標準差可以用來衡量產品的一致性。
變異係數(Coefficient of Variation, CV)
變異係數是標準差與平均數的比值,通常表示為百分比。它提供了一個無量綱的分散量度,適合用來比較不同尺度或不同量級數據的變異程度。變異係數在經濟、醫學和工程等領域具有重要應用。例如,在醫學研究中,變異係數可以用來比較不同試驗的結果變異性,從而評估實驗數據的穩定性。
平均絕對離差(Mean Absolute Deviation, MAD)
平均絕對離差是數據集中每個值與平均數之差的絕對值的平均。它是一種簡單易懂的分散量度,對極端值的敏感度較低。平均絕對離差適合用來描述數據的變異情況,特別是當需要對數據進行簡單的變異分析時。例如,在零售業中,平均絕對離差可以用來衡量不同店鋪的銷售業績變動情況。