新聞中心 活動報導

職涯起航計畫業就與職涯演講-應數系-一窺統計的世界

image003

時間:106年5月4日 14時10分至16時10分
地點:本校科技大樓ST529
主講者:蔡聰明
活動/課程內容簡介:統計學涉及數據的處理、不確定性與猜測的藝術,它們分別對應下面的三部曲:
1.記述統計學(Descriptive Statistics):將一堆數據精煉出9個代表值與1個參差度。
2.機率論(Probability Theory):大數法則與中央極限定裡。
3.推論統計學(Inferential Statistics):湖裡魚數的推估、點推估、區間推估、假說檢定。

此次演講的主題為「一窺統計的世界」,演講者為台大數學系蔡聰明副教授。演講者一開始就提到,統計的英文Statistics一詞是由State一詞演變而來的,當初是為了處理整個國家對某項事務所收集的隨機數據,因此統計其實就是在處理生活中隨機現象所產生的數據。然而,數據當中最重要的十個數分別為算術平均數、變異數、中位數、眾數、最小值、最大值、全距、第一四分位、第二四分位及第三四分位,其中算術平均、變異數以及標準差最為重要,只要有以上十個數,基本上可以掌握整堆數據的核心,而以上是記述統計學所包含的內容。
隨機現象的數學理論包含記述統計學、機率論以及推理統計學或數理統計學,當記述統計結束之後,也就是機率論的開始。在未然的世界裡,才會有機率的概念存在。舉例來說,假設你買了一張樂透,在還沒有開獎之前,你擁有可能會中獎的機率;但當開獎的那一刻,已經知道是否中獎了,就沒有機率的存在了,也就是說,在已然的世界裡,沒有機率的存在。因此概念上,記述統計(已經發生)為實的,而機率論(還沒發生)為虛的。
而在機率學當中,最為重要的兩個法則為大數法則以及中央極限定理,此兩個法則同時也是在統計學中應用最為廣泛。大數法則簡單來說就是將取樣的點取得越多,會與現實情況越符合;而中央極限定理則是當取樣點趨近於無限大時,n 個隨機變數的和 S_n 的標準化之分布會趨近於 N(0,1),也就是常態分佈,而常態分布在生活中較為常見且較為容易計算。因此,演講者形容常態分布在人類的經驗中具有”鶴立雞群”的地位,對於由觀測與度量所得到的基本數據之分析與解釋,它是不可或缺的工具。
此次演講當中,演講者也舉了一些生活當中,使用機率學與統計學的例子以及計算方式。例如如何推估某湖當中有幾條魚,以及總統大選的選舉民調等等。透過演講者淺顯的說法,使得原本一直覺得機率與統計很複雜的學生,有更進一步的了解,也讓學生對機率與統計更有興趣,因此,此次的演講對學生來說收穫良多。