雖然我前一篇的標題就寫了 想查degree of freedom 的人請不要進來
但後來還是有很多叛逆的人用這個關鍵字連結進來
看旁邊的關鍵字雲就知道了 這幾個關鍵字一直存在!!
是鬼遮眼了嗎= =
所以為了對得起搜尋這個關鍵字的廣大鄉民(用功的孩子)
這次就讓你們進來好了...
degree of freedom 就是自由度 他是無法解釋的東西 連統計老師都解釋不清楚
(就像"亂度"一樣難懂 連名字都很像= =)
就當他是莫名其妙的規則背起來吧! 這是衷心的建議!
不過如果你還是想知道的話
可以看一下維基百科 我可以幫你翻譯一下他到底在說什麼鬼話
自由度
維基百科,自由的百科全書
統計學上的自由度(degree of freedom, df),是指當以樣本的統計量來估計總體的參數時,樣本中獨立或能自由變化的資料的個數,稱為該統計量的自由度。
例如,在估計總體的平均數時,樣本中的 n個數全部加起來, 其中任何一個數都和其他資料相獨立,從其中抽出任何一個數都不影響其他資料(這也是隨機抽樣所要求的)。 因此一組資料中每一個資料都是獨立的,所以自由度就是估計總體參數時獨立資料的數目,而平均數是根據 n個獨立資料來估計的,因此自由度為 n。
他的意思是說
當你用樣本來估計母體的時候
例如 你想調查全PTT所有的鄉民(母體)愛用什麼牌的保險套
但是因為鄉民實在是不計其數
所以你可以用抽樣的方式 抽出西斯板的板眾們(共n人) 問他們喜歡哪一牌的保險套
這可能不是很隨機 你也可以利用亂數表等等方式
總之 只要樣本中的任何一個人
都來自PTT的廣大鄉民(來自同一個母體)
任何一個人被抽到的機率都是相等的
而且不互相影響對方結果(獨立)的情況下
就可以稱作這個樣本資料是 "隨機抽樣"
(但如果你想抽"第一次板"的板友 我也沒有意見)
而這個樣本的個數n人 就是樣本平均數的自由度
樣本平均數的公式是
有的時候自由度會需要n -1 -2 -3....
像是用樣本變異數來推估母體變異數的時候
(為什麼需要推估呢? 因為母體太大了 你根本不可能知道正確數字)
自由度常常是n-1
母體變異數的公式是
樣本變異數的公式是
自由度=n-1是因為發現
當S2的算法是除以n-1的時候
他算出來的結果會跟母體變異數的結果最接近(最不偏)
但是如果是除以n的話 計算結果則會比實際母體的值小
所以自由度是n-1
可以看一下這篇 解釋也是一樣的
另外
像是在做卡方分析的時候
自由度也常常是n-1
這裡的n就不是樣本個數了
看一下這個我虛構的資料
假設西斯板的板眾共有200人
市面上的保險套品牌只有這3種
維基說:自由度是樣本中獨立或能自由變化的資料的個數
能變化的數目只有 86 67 47 這3個
所以這筆資料的n=3
但是因為全部加起來要等於總人數200
所以當86和67 這個兩個數目出來的時候
第三個品牌的愛好者就一定會是 200-86-67=47人
所以他是不自由的!!
所以這邊的自由度應該是 3-1=2
同理
如果多加一個變數進去
因為喜歡有蕾絲牌的人數是86人 所以男性如果佔了63 女性一定就是23
其他也是一樣的 都沒有自由
所以自由度就變成6-4=2
這是老師說的 也許他是唬爛的
但我想或許他也只能這樣解釋了
所以我只能說
還是把規則背起來就好了
了 解 這 個 是 無 法 幫 助 你 考 試 拿 高 分 的
(如果還是不懂可以往下看下面的留言)