時序資料分析/Serial Data Analysis

導引:曹振海

 

這是一門新的課程,因此許多同學對於課程的內容乃至名稱都感到陌生。希望這篇簡短的介紹能夠讓各位對這個課程有些基本的認識。

背景知識/課程

這門課假設你已經修過微積分、線性代數、統計學。也就是說,這幾門課程的基本知識是了解新課程的基礎。如果你另外修過迴歸分析、數值分析或數理統 計,將可對本課程有更深入的瞭解。

課程內容

在各位過去所學的統計學多半假設樣本為獨立同分配抽樣(e.g. X_1, …, X_n iid 來自某母體),這假設在許多重要的統計問題都被使用。有了這個關鍵性的iid假設,資料 間的機率結構及後續的統計推論(如參數估計、信賴區間、假設檢定等)也就變得相當簡單。然而,有不少的統計問題的資料並非獨立而是互相相關;或是由於場域 的限制,必須等待一定的時間,才能取得新的觀察值;乃至迭代方法(iterative methods)所延伸的統計機率問題。在這些問題中假設樣本為iid均不合理, 因此需要新的統計概念及方法來處理這些問題──這正是SDA要談的主題。在本課程中,我們將針對以下幾個方向作一介紹:

Statistical Quality Control

產品與服務品質的管控是企業經營的重要課題,統計方法早被廣泛地使用在這個領域。我們將介紹Control ChartSequential analysis中的重要方法,並說明其基本理論架構。

Stochastic Approximation/Iterative Methods

由於計算能力的不斷提升,許多求解、求極值的迭代algorithm也陸續被提出。這些方法也廣泛地被應用到分類、影像處理等問題。然而,其理 論性質的討論相對則較缺乏。最近研究指出這些方法可以透過stochastic approximation的架構作釐清。透過適當的轉換,這個架構很自然地銜接上serial data analysis,我們將由這個角度進一步檢視這些迭代方法的適用性並指出一些可能的改進方向。

Time Series Data Analysis/Prediction and Forecasting

在許多商業及經濟資料分析問題中,雖然有近似迴歸模型的架構,然而誤差項通常隨時間變化而有正相關。對於此類問題,統計學者提供了不少成功的分析西 法。我們也將概略介紹。另一方面,利用時序資料來預測更是應用及理論的重要課題,我們將對information theory中的universal prediction問題作一初探。