標準差的意義 什么是標準差

莖葉圖是一種顯示原始數據分布狀況的圖形,由“莖”和“葉”兩部分組成 。莖葉圖不僅能反映數據的分布特征,還能保留原始數據的信息 。莖葉圖適用于未分組的定量數據,特別是當數據量較少時 。

標準差的意義 什么是標準差

文章插圖

要繪制莖葉圖,首先要把一個數字分成兩部分,通常以該數據的高位數值作為樹的“莖”,樹的“葉”只保留該數值的最后一位數字 。例如,425分為42|5,42為“莖”,5為“葉” 。然后,按照“莖”的大小順序排列,并把對應的“葉”列在“莖”的右邊 。如果某個“莖”對應的“葉”過多,可以將該“莖”重復一次或多次,以便觀察數據的細節 。

標準差的意義 什么是標準差

文章插圖

下面是一個莖葉圖的例子:
8| 0 10| 0 10| 123456789 11| 0123456789 11| 0123456789 12| 0123456789 12| 0123456789 12| 56789 13| 0123456789 13| 0123456789 13| 123456789 14| 0123456789 14| 0123456789 14| 0123456789 14| 56789
【標準差的意義 什么是標準差】這個莖葉圖表示了一組8-20歲年齡的調研樣本 。從圖中可以看出,每個“莖”代表10個年齡段,每個“葉”代表一個樣本 。例如,第一行表示有一個8歲的樣本,第二行表示有一個10歲的樣本,第三行表示有10個10歲的樣本,依此類推 。

標準差的意義 什么是標準差

文章插圖

從圖中還可以看出,數據的分布大致呈對稱形狀,沒有明顯的極端值或異常值 。我們可以用一些統計量來描述數據的分布特征,如中位數、平均數、標準差等 。
中位數是將數據從小到大排列后位于中間位置的數值 。如果數據個數是奇數,則中位數就是中間那個數;如果數據個數是偶數,則中位數就是中間兩個數的平均值 。在莖葉圖中,可以通過計算每個“莖”對應的“葉”的頻數來確定中位數所在的位置 。例如,在上面的例子中,共有150個樣本,所以中位數應該在第75和第76個樣本之間 。從圖中可以看出,第75個樣本是13歲,第76個樣本也是13歲,所以中位數就是13歲 。
平均數是將所有數據相加后除以數據個數得到的數值 。在莖葉圖中,可以通過將每個“莖”乘以主干寬度(即每個“莖”代表多少個單位),再加上每個“葉”的值來計算每個樣本的具體數值 。然后將所有樣本的數值相加,并除以樣本個數來得到平均數 。例如,在上面的例子中,主干寬度是10,所以第一個樣本的數值是80(8乘以10加上0),第二個樣本的數值是100(10乘以10加上0),依此類推 。將所有樣本的數值相加得到13200(80+100+101+…+145),再除以樣本個數150得到平均數88(13200除以150) 。
標準差是衡量數據離散程度的一個指標,它反映了每個數據與平均數之間的偏差大小 。標準差越小,說明數據越集中在平均數附近;標準差越大,說明數據越分散在平均數兩側 。在莖葉圖中,可以通過計算每個樣本與平均數之間的差值(即殘差)來得到標準差 。然后將所有殘差平方相加,并除以樣本個數減一來得到方差 。最后再開方來得到標準差 。例如,在上面的例子中,第一個樣本與平均數之間的殘差是-8(80-88),第二個樣本與平均數之間的殘差是12(100-88),依此類推 。將所有殘差平方相加得到11400(-8(2+12)2+…+57^2),再除以149得到方差76.51(11400除以149) 。最后再開方得到標準差8.75(76.51開方) 。