l 母數(parameter):代表母群之性質的量數。
l 統計數(statistic):描述樣本性質的量數。
l 估計數(estimator):被用來推定母數的統計數。
※區間估計:不是估計一個點,而是估計數線上的一個線段,並且說母數的值可能落在這一個線段之間。
l 例如:我們不說兩百名高中生平均智商110,我們說他們的平均智商可能落在108到105之間,同時還要指出落在108到105的機率有多大。
※抽樣
抽取一個樣本的平均數、標準差。
母群 | 樣本 | ||
平均數 | μ | 估出 | M |
標準差 | α | ? | SD |
一組數字:1 2 3 4 5 6 7 8 9 10
抽樣
S1= {1、2、3、4} M=2.5
S2={4、5、8、9} M=6.5
S3={2、5、6、7} M=5
S4={7、8、9、10} M=8.5
抽樣誤差 + 樣本平均數=母群平均數
包含真正的母群平均數,你要將範圍拉多大來證明。
圖一
圖一顯示一組數字:1、2、3、3、4、4、4、4、5、5、5、5
抽出的平均數會在5。
假設有次我抽平均數為6,而6出現的機率大嗎?
而7出現因為7±5抽樣誤差,
這就是中央極限定理。
※中央極限定理:
假設一個樣本的平均是這樣分布,所以每一次抽的平均數有誤差,但它包含真正的母群平均數。
圖二
※如圖二有一個班級的男生,抽十個同學,抽到的體重有68公斤 、66公斤 、59公斤 、56公斤 、49公斤 、58公斤 、65公斤 、54公斤 、61公斤 。
樣本:一個母群抽十個同學
樣本:一個母群抽十個同學
平均是60公斤 。
區間估計:M=60 ±SD=1.89 (樣本標準差)
如果我有一群樣本平均數,推估母群平均數。
60±1.89 X 2.2622<錯誤系數>
60±1.89 X 3.25
※區間估計:找一頭拉布拉多,拉布拉多叫的範圍,五十公尺 內範圍,代表食物在裡面。但你如果畫100公尺 ,就沒有意義了。
圖三
圖四
圖三顯示一個飛盤,每次射都射在三個環中,有一次射到A點,就從A點往外畫三個三公分 的圈,以後射到的範圍就會包含在內,這就是區間估計。紅心就是母群平均數,一樣有95%的信賴。(圖四)
※自由度(df )
是任何變數之中可以自由變化數值的數目。
圖五
自由度2.2622
樣本10找9那欄。
當你有一點的時候,另外兩個點,要成立一個自由度。
10樣本會出現1 個平均數,最後出現的數字已經定出來,就是n-1。
樣本是10就要找9那欄。
※自由度(df )
(因為N個數值中一定有一個失去自由,也就是失去一個自由度,其餘還有N-1個可以自由變化。剩下可以自由變化的數值之數目(N-1)便是自由度。)
※單側考驗(one-tailed test):
考驗單一方向性的問題。
用於含有大於、小於的時候。
範圍愈大涵蓋愈準。
※雙側考驗(tow-tailed test):
只強調兩者存有差異存在,不強調方向性,只強調兩者有差異的假設考驗。
2.5代表的是”雙側考驗”。
95%是信心水準,教育研究常用,但醫學99%才可以。
母群中,抽出來可能會抽到有偏差,估計一個區間。
樣本數越大,它的範圍就可以變小,變穩定。
母群 | 樣本 | |
平均數 | μ=可以 | M=60 |
標準差 | 已知 α 未知? α | SD=1.89 |
樣本平均數可以推估母群平均數。
但樣本標準差不能推估母群標準差。
※要30到60一組數的公式,
(30+rand)*30
跑一個心目中想要的國文成績,跑一30個出來。
圖六
圖七
圖八
※SPSS檢定:
兩組數字>用T檢定
三組數字>單因子變異數(兩組也可以做)
※F值:
**
***
P值(顯著性)
※ANOVA(單因子變異數):
單因子變異數的實驗中,可能有以下幾種方式:
1. 隨機分派到不同組別,接受不同水準的處理。稱為等組法或組間設計。
2. 同一組人重複接受實驗處理,利用單一組法使同一組受試者在多個實驗條件被重複觀測,稱為重複量數。此種實驗法,受試者本身作為控制,以減少實驗誤差,稱為組內設計。
3. 利用配對組法組成K組受試者,並假定K組受試者某一與依變數有關的特質相同,k組受試者雖然不是同樣的人,但仍然假定為同一組人。配對組法也是組內設計的一種。
※SPSS單因子變異數分析
分析>比較平均數法>單因子變異數檢定
圖九
圖十
圖十一
圖十二
圖十三
圖十四
圖十五
圖十六
圖十七
※(虛無假設>假設母群不同)從同一個母群抽兩次樣本進行比較,假設兩組數是由不同母群抽樣,這樣假設發生錯誤的機率為P,P<0.05表示假設錯誤機率小於5%,正確率95%。
※T分配:
當某一特質之分配是常態分配時,如果自此項分配中抽取無限個樣本,則這些樣本平均數之分配,仍然是常態分配。當N的數目大約在30以上時,此項分配也成為常態分配,當N的數目小於30或愈來愈小時,此項分配愈不接近常態分配。大體上說來,當N或df愈大時(大於25或30以上),t分配愈接近常態分配。但是當N或df愈小,t分配愈不接近常態分配了。
資料來源
林清山(民66)。第十章推論統計的基本概念。載於張春興、楊國樞、文崇一(主編),心理與教育統計學(182、187- 188、194-195、198-199頁)。台北市:台灣東華。
林清山(民66)。第十四章變異數分析(一)─單因子實驗設計。載於張春興、楊國樞、文崇一(主編),心理與教育統計學(269-270頁)。台北市:台灣東華。
沒有留言:
張貼留言