西北工業大學 統計學 Statistics 簡體中文 普通話 DVD 統計學主要又分為描述統計學和推斷統計學。給定一組數據,統計學可以摘要並且描述這份數據,這個用法稱作為描述統計學。另外,觀察者以數據的形態建立出一個用以解釋其隨機性和不確定性的數學模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統計學。這兩種用法都可以被稱作為應用統計學。另外也有一個叫做數理統計學的學科專門用來討論這門科目背後的理論基礎。 為了將統計學應用到科學,工業以及社會問題上,我們由研究母體開始。這可能是一個國家的人民,石頭中的水晶,或者是某家特定工廠所生產的商品。一個母體甚至可能由許多次同樣的觀察程序所組成;由這種資料蒐集所組成的母體我們稱它叫時間序列。 為了實際的理由,我們選擇研究母體的子集代替研究母體的每一筆資料,這個子集稱做樣本。以某種經驗設計實驗所蒐集的樣本叫做資料。資料是統計分析的對象,並且被用做兩種相關的用途:描述和推論。 描述統計學處理有關敘述的問題:資料是否可以被有效的摘要,不論是以數學或是圖片表現,以用來代表母體的性質?基礎的數學描述包括了平均數和標準差。圖像的摘要則包含了許多種的表和圖。 推論統計學被用來將資料中的數據模型化,計算它的機率並且做出對於母體的推論。這個推論可能以對/錯問題的答案所呈現(假設檢定),對於數字特徵量的估計(估計),對於未來觀察的預測,關聯性的預測(相關性),或是將關係模型化(回歸)。其他的模型化技術包括變異數分析(ANOVA),時間序列,以及資料採礦。 相關的觀念特別值得被拿出來討論。對於資料集合的統計分析可能顯示兩個變量(母體中的兩種性質)傾向於一起變動,好像它們是相連的一樣。舉例來說,對於人收入和死亡年齡的研究期刊可能會發現窮人比起富人平均來說傾向擁有較短的生命。這兩個變量被稱做相關的。但是實際上,我們不能直接推論這兩個變量中有因果關係;參見相關性推論因果關係(邏輯謬誤)。 如果樣本足以代表母體的,那麼由樣本所做的推論和結論可以被引申到整個母體之上。最大的問題在於決定樣本是否足以代表整個母體。統計學提供了許多方法來估計和修正樣本和蒐集資料過程中的隨機性(誤差),如同上面所提到的透過經驗所設計的實驗。參見實驗設計。 要了解隨機性或是機率必須具備基本的數學觀念。數理統計(通常又叫做統計理論)是應用數學的分支,它使用機率論來分析並且驗證統計的理論基礎。 任何統計方法是有效的只有當這個系統或是所討論的母體滿足方法論的基本假設。誤用統計學可能會導致描述面或是推論面嚴重的錯誤,這個錯誤可能會影響社會政策,醫療實踐以及橋樑或是核能發電計劃結構的可靠性。 即使統計學被正確的應用,結果對於不是專家的人來說可能會難以陳述。舉例來說,統計資料中顯著的改變可能是由樣本的隨機變量所導致,但是這個顯著性可能與大眾的直覺相悖。人們需要一些統計的技巧(或懷疑)以面對每天日常生活中透過引用統計數據所獲得的資訊。