(一) 姚明的身高
先看一個故事:
NBA火箭隊中鋒姚明身高到底多少?目前至少有223、226、227、229厘米4個版本,NBA在即將開打的本季網站上認定他的身高是229厘米,莫非23歲的姚明又長高了?
《休斯敦紀事報》報道227、229厘米的兩個數字由來,原來是姚明上季在選秀時,NBA官方將姚明的身高登記為7英尺5.5英寸,換算為227厘米,此一高度是姚明在NBA體檢時所量;火箭隊在上季公布姚明身高時是7英尺6英寸,就是229厘米了,火箭隊的說法是,當時姚明是穿鞋量的。
那麽,223和226厘米的數字是怎麽來的呢?原來226厘米是中國籃管中心在中國男籃隊參加亞洲男籃賽時報名冊上的數字,而223厘米據說是姚明在1998年時的身高,他所屬的上海東方大魚隊在報名參加2001—2002年甲級籃球聯賽時的身高,據說當時是因量身高的尺不夠長。
(二)測量與誤差
姚明的身高故事告訴我們,測量都是有誤差的。誤差並不可怕,關鍵是我們要對誤差有足夠的了解和評估。
維基百科:測量誤差
測量誤差(英語:Measurement error)也稱觀測誤差(Observational error),是指觀測值與真實值之間的差異。
在統計學中,測量誤差並不是“錯誤”,是事物固有的不確定性因素在量測時的體現。每次我們用精密儀器重複量測某一數據時,我們會得到一些存在微小差異的數據。
在統計學上,通常測量誤差被分為兩部分:
係統誤差:在相同的觀測條件下,係統誤差通常會表現出一定的規律性。有時也被稱作統計偏差。係統誤差可由嚴格標準的操作來控製。
隨機誤差:也稱偶然誤差,是由我們無法控製的因素造成的,如人眼的分辨能力,儀器的極限精度和氣象因素等。偶然誤差是不可避免的,但是大量的偶然誤差呈現一定的統計規律。通過重複觀測取平均數的方法可以較少偶然誤差的影響。
在測量學上,也把由於觀測者的不規範操作和操作失誤造成的粗大誤差當作測量誤差。
在對誤差的處理上,我們可以對係統誤差進行校正,對隨機誤差進行統計分析。關於誤差與偏差,準確度與精確度和更多的概念,就不多說了。
(三)有效數與數據處理
有效數字指科學計算中用以表示一個浮點數精度的那些數字。一般地,指一個用小數形式表示的浮點數中,從第一個非零的數字算起的所有數字。如1.24和0.00124的有效數字都有3位。
舉一個例子,三人的身高分別是 175, 176, 179cm. 那麽他們的平均身高是多少?
用計算器算:(1.75 + 1.76 + 1.79)/3 = 176.66666666667
但是我們報結果的時候,隻能報177cm。 這裏就涉及到有效數運算規則。
如果我們的量尺沒有厘米刻度,隻有分米刻度。那我們的結果就是 1.8 x 10^2 cm. 所以測量的誤差會影響結果的準確度。
(四)人口統計的誤差
這裏有兩個問題:
(1)我們對人口非正常死亡的估算,對人口統計誤差的容忍度有多大?換句話說,如果精確到千萬數量級,百萬數量級,十萬數量級,可以容忍多大的誤差?
(2)對人口統計的誤差,有沒有辦法進行評估和校正?
第一個問題告訴我們,隻要我們不要求精確到個位數,有誤差的人口統計數據是非常有意義的。
第二個問題的答案,也是肯定的。因為在1953年,1964年,和1982年,中國進行了人口普查。這個數據,就是對人口統計進行誤差分析和校正的標尺。
下一篇,我們講人口學家如何用人口普查數據對人口統計數據進行誤差分析和校正。
參考閱讀:
http://baike.baidu.com/view/46884.htm - China - Translate this page
人口普查(英文:census),是指在國家統一規定的時間內,按照統一的方法、統一的項目、統一的調查表和統一的標準時點,對全國人口普遍地、逐戶逐人地進行的 ...