Datawhale 8月 組隊學習活動
參考書籍:《科研論文配圖繪制指南—— 基于Python》,寧海濤著,人民郵電出版社
【資料圖】
PS:已開學,中心已向學校內容為主
一、單變量圖
單變量圖指使用數據組的一個變量進行相應圖的繪制。其中數據變量分為連續變量和離散型變量。
1.基于連續變量繪制的單變量圖的類型
(1)直方圖:表示數據分布和離散情況,使用一系列寬度相等、高度不等的長方形來表示相應的每個分組內的數據元個數。可以顯示各組數據的分布情況,也體現了組間數據差異、數據異常等情況。
(2)密度圖:是直方圖的一個變種類型。體現了數據在連續時間段內的分布狀況。它不會因分組個數而導致數據顯示不全,幫助用戶判斷數據的整體趨勢。
(3)Q-Q圖:Q代表分位數,Q-Q圖本質是概率圖,作用是檢驗數據分布是否服從某一個分布。不但可以檢驗樣本數據是否符合某種數據分布,而且可以通過對數據分布形狀的比較,來發現數據在位置、標度和偏度方面的屬性。
(4)P-P圖:與Q-Q圖相似,根據變量的累積概率與指定的理論分布累積概率的關系繪制,檢驗樣本數據是否符合某一概率分布。檢驗樣本數據符合預期分布時,圖中的各點將會呈現一條直線。
(5)經驗分布函數圖:檢驗樣本數據是否符合某種預期分布。
2.圖形繪制
在 Matplotlib 中使用 () 函數繪制。參數 x 為要繪制的樣本數據,參數 bins 用于定義分布區間。參數 density對應的值為布爾類型,該參數決定繪圖結果是否為密度圖,默認值為 False 。同時還可以使用 SciencePlots 的繪圖主題進行進一步美化。還可以使用 () 函數對繪制數據實現正態擬合,計算出概率密度函數結果。
二、核心代碼實現
(未完待續)