講 題:矩陣視覺化與其應用
主講人:陳君厚 研究員兼所長(中央研究院統計科學研究所)
時 間:2019年9月26日(星期四)下午02:10 - 04:00
地 點:B302A(淡水校園商管大樓)
茶 會:2019年9月26日(星期四)下午01:30 (商管大樓 B1102)
 
摘 要
 
    John W. Tukey在探索式資料分析(Exploratory Data Analysis, EDA)書中開宗明義提到“It is important to understand what you CAN DO before you learn to measure how WELL you seem to have DONE it.” 學習可以做什麼,有助於在資料分析的過程中達到事半功倍的效果 。EDA的作用在於從「看」資料獲得資料所傳達的訊息,所注重的是簡單的算術與容易建構的圖、表。透過EDA對於圖表中所顯露的型樣(pattern)做一初步的認知與描述,再進一步以人類的心智(mind)對所接受的訊息做全面的分析與判斷,以探索潛藏於資料中的訊息。強調的是探索式的分析而非嚴謹的模式確認。
   
    現代資料分析與統計應用面臨高維度與高複雜度之艱難挑戰,而現有之統計繪圖法與視覺化方法不足以讓使用者一窺資料之全貌,以選擇合適之分析方法與統計模型。EDA已經問世三十年了,而箱型圖(box-and-whisker plot)與散佈圖(scatterplot) 仍然是二十一世紀最主要之工具。發展有效率之繪圖法與視覺化環境以幫助使用者在處理由先進科技與複雜實驗所產生之資料時瞭解what one CAN DO乃統計學家重要職責。
   

    本演講將介紹相關研究團隊多年來發展之矩陣視覺化環境: Generalized Association Plots (GAP 廣義相關圖)。我們以矩陣視覺化來進行統計分析,包含敘述統計、建模、推論,以至於診斷;我們也將統計概念引進矩陣視覺化以處理更複雜之資料形態。GAP可以處理上萬個樣本在上萬個維度(變數)的各式資料矩陣,包含連續、二元、有序、類別、象徵性 (symbolic data)、及與地圖學連結之各類資料。本演講將以深入淺出方式經由各種實例介紹各種主要GAP工作環境。有興趣者請瀏覽GAP網頁:http://gap.stat.sinica.edu.tw/


建議最佳瀏覽 Microsoft IE 10 以上/Google Chrome/Mozilla Firefox 或相容W3C網頁標準之瀏覽器

更新日期 : 2021/09/23