2011年11月30日 星期三

HW1130 課堂筆記 樣本

樣本大小(sample size)
  • 母群population:一個群體(個數或對象未知/已知);population也可當人口數
  • 樣本sample:個數或對象已知
    時候母群=樣本,由於母群數不多(母群已知),樣本即等於母群,母群即等於樣本。
  • 抽樣samplig:是統計學的基礎,從母群中取出已知的樣本數。
  • 抽樣即會形成機率,而機率有好有壞好,便形成抽樣誤差了。
    有時候抽樣只是一次,不穩定的情況。
  • 母群平均數
  • 樣本平均數
  • 抽樣誤差:樣本平均數-母群平均數,通常為3%
  • 信心水準(confidence level):即估計正確的機率數值大小,自由設定,當信心水準越低時,抽樣數需要的也越少,反之亦然。通常設定95%。
  • 標準差Percentage:反映樣本的差異或離散情形,分散程度。Sample Size Caculator則將Percentage預設為50即做最悲觀的假設


統計工具:Sample Size Calculator
台大圖資電子報:介紹Sample Size Calculator


利用Excel製作下表(以方便計算取10為區間差)表示PercentageConfidence Interval的關係
也可從上表驗證Percentage設為50即是最悲觀的假設

結論:母群越大,信度越大,而如何降低樣本數,又不失代表性相當的重要,可利用Sample Size Caculator運算達到此目的。樣本數超過30才能做統計,樣本數為小於100不須抽樣,直接全部當樣本數;樣本數1000以上才能做抽樣,樣本數大概在300-500之間。統計的目的即推算未知的東西,而非已知的過去

年代2012總統大選民意調查TVBS民意調查中心報告中檢視自己不懂的字詞。 

Homework
玩Sample Size Calculator,達到"民調騙不了你"
Future Course
  • 平均數與標準差
  • 標準分數與常態分配
  • 信度與效度
  • T-test與單因子共變數

沒有留言:

張貼留言