第二章 數(shù)據(jù)描述
第一節(jié) 用圖表展示定性數(shù)據(jù)
本節(jié)主要介紹定性數(shù)據(jù)的圖表展示方法。定性數(shù)據(jù)包括分類數(shù)據(jù)和順序數(shù)據(jù),它們的圖表展示方法基本相同。通??梢杂妙l數(shù)分布表和圖形來描述。
一.生成頻數(shù)分布表
定性數(shù)據(jù)本身是對(duì)事物的一種分類,因此,只要先把所有的類別都列出來,然后統(tǒng)計(jì)出每一類別的頻數(shù),就是一張頻數(shù)分布表。頻數(shù)分布表中落在某一特定類別的數(shù)據(jù)個(gè)數(shù)稱為頻數(shù)。頻數(shù)分布包含了很多有用的信息,通過它可以觀察不同類型數(shù)據(jù)的分別情況。
二.定性數(shù)據(jù)的圖形表示
定性數(shù)據(jù)(分類數(shù)據(jù)和順序數(shù)據(jù))可以描繪出它們各類的比例,常用餅圖和條形圖表示。
(一) 餅圖
餅圖又稱圓餅圖、圓形圖等,它是利用圓形及圓內(nèi)扇形面積來表示數(shù)值大小的圖形。餅圖主要用于總體中各組成部分所占比重的研究。
(二) 條形圖
條形圖是用寬度相同的條形的高度或長(zhǎng)度來表述數(shù)據(jù)多少的圖形,用于觀察不同類別數(shù)據(jù)的多少或分布情況。繪制時(shí),各類別可以放在縱軸,也可以放在橫軸。
(三) 環(huán)形圖
餅圖只能顯示一個(gè)變量(如年齡變量)各部分所占的比重。如果我們想比較不同變量之間的結(jié)構(gòu)差異,就可以通過環(huán)形圖來實(shí)現(xiàn)。
首先,利用產(chǎn)生頻數(shù)表的方法先做出分性別的年齡分布表
然后,根據(jù)上表再繪制出環(huán)形圖。
第二節(jié) 用圖表展示定量數(shù)據(jù)
定性數(shù)據(jù)的圖示表示方法,也都適用于定量數(shù)據(jù)。但定量數(shù)據(jù)還有一些特定的圖示方法,它們并不適用于定性數(shù)據(jù)。
一.生成頻數(shù)分別表
生成定量數(shù)據(jù)的頻數(shù)分布表時(shí),首先是將數(shù)據(jù)進(jìn)行分組,然后再統(tǒng)計(jì)出各組別的數(shù)據(jù)頻數(shù)即可。
首先,要對(duì)數(shù)據(jù)進(jìn)行分組,一般的分組個(gè)數(shù)在5—15之間。
其次,要確定組距。所謂組距是指每個(gè)組變量值中的最大值與最小值之差。每組最大值稱為該組上限,最小值稱為該組下限。則組距等于上限與下限之差,即
組距=上限-下限
在確定組距是,一般應(yīng)掌握的原則:一是要考慮各組的劃分是否能區(qū)分總體內(nèi)部各個(gè)組成部分的性質(zhì)差別。如果不能正確反映各部分質(zhì)的差異,必須重新分組。二是要能準(zhǔn)確地清晰地反映總體單位的分布特征。
在確定組距時(shí),在研究的現(xiàn)象變動(dòng)比較均勻的情況下,可以采用等距分組;而當(dāng)研究的現(xiàn)象變動(dòng)很不均勻時(shí),例如急劇的增長(zhǎng)或急劇的下降,波動(dòng)的幅度很大時(shí),則一般采用不等距分組。在實(shí)際工作中,要結(jié)合實(shí)際情況確定各組的組距。
最后,統(tǒng)計(jì)出各組的頻數(shù)及頻數(shù)分布表。在統(tǒng)計(jì)各組頻數(shù)時(shí),恰好等于某一組的組限時(shí),則采取上限不在內(nèi)的原則,即將該頻數(shù)計(jì)算在與下限相同的組內(nèi)。
二.定量數(shù)據(jù)的圖形表示
常用來表述定量數(shù)據(jù)統(tǒng)計(jì)圖形有:直方圖、折線圖和散點(diǎn)圖。
(一) 直方圖
對(duì)于一個(gè)定量數(shù)據(jù),直方圖是一個(gè)常見的而且非常重要的圖形。它的橫坐標(biāo)代表變量分組,縱指標(biāo)代表各變量值出現(xiàn)的頻數(shù),這樣,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖。
(二) 折線圖
折線圖是利用線段的升降來說明現(xiàn)象變動(dòng)的一種統(tǒng)計(jì)圖,它主要用于表示現(xiàn)象的分配情況、現(xiàn)象在時(shí)間上的變化和兩個(gè)現(xiàn)象之間的依存關(guān)系等。
(三) 散點(diǎn)圖
散點(diǎn)圖能反映兩個(gè)變量的關(guān)系,判斷其變化的方向是否相同
應(yīng)特別注意各種圖表的生成方式和運(yùn)用。
第三節(jié) 用統(tǒng)計(jì)表來表示數(shù)據(jù)
統(tǒng)計(jì)表和統(tǒng)計(jì)圖是顯示統(tǒng)計(jì)數(shù)據(jù)的兩種方式。在現(xiàn)實(shí)生活中,統(tǒng)計(jì)表和統(tǒng)計(jì)圖形一樣充斥在我們的生活總。它通過對(duì)枯燥數(shù)據(jù)的整理,利用一些簡(jiǎn)單的表格,讓我們一目了然地了解某些事物的現(xiàn)象。
統(tǒng)計(jì)表是一種用密集的形式歸納數(shù)據(jù)的方法,它主要利用行和列中的數(shù)據(jù)來表述現(xiàn)象特征。人們利用統(tǒng)計(jì)表的主要目的有:
一是在文章中使用它以支持自己的觀點(diǎn);二是利用它組織數(shù)據(jù)。
把整理匯總得出的統(tǒng)計(jì)數(shù)據(jù)資料,按照一定的結(jié)構(gòu)和順序,有系統(tǒng)地排列在一定的表格內(nèi),就形成一張統(tǒng)計(jì)表。
統(tǒng)計(jì)表的主要優(yōu)點(diǎn)是:能使統(tǒng)計(jì)資料條理化、系統(tǒng)化,能清晰的表達(dá)統(tǒng)計(jì)資料的內(nèi)容,且簡(jiǎn)明易懂、節(jié)省篇幅,便于對(duì)表中資料進(jìn)行對(duì)比,并易于檢查數(shù)字的完整性和正確性。
(1) 統(tǒng)計(jì)表的結(jié)構(gòu)
統(tǒng)計(jì)表一般由五個(gè)部分組成,即表頭、行標(biāo)題、列標(biāo)題、數(shù)字資料和表外附加構(gòu)成。
①總標(biāo)題:統(tǒng)計(jì)表的名稱。簡(jiǎn)明扼要,一般放在表格上方中間位置
②橫行標(biāo)題和縱欄標(biāo)題:縱欄:表明標(biāo)志和指標(biāo)的名稱 ,一般置于表格上方;橫行標(biāo)題:表明調(diào)查單位和分組的名稱,一般置于表格左邊。
③統(tǒng)計(jì)數(shù)字(指標(biāo)數(shù)值)。主詞欄:表中資料所說明的對(duì)象,位于表的左邊;賓詞欄:各種指標(biāo),位于表的右側(cè)。
(2)統(tǒng)計(jì)表的種類
①按用途不同分類
a. 調(diào)查表:用來搜集統(tǒng)計(jì)資料的表格;
b. 整理表:用于匯總或整理調(diào)查資料,以及表現(xiàn)統(tǒng)計(jì)匯總或整理結(jié)果的表格;
c. 分析表:用于對(duì)整理所得的統(tǒng)計(jì)資料進(jìn)行定量分析的表格。
②按總體分組不同分類
a. 簡(jiǎn)單表:對(duì)總體未經(jīng)任何分組,僅是簡(jiǎn)單地列出統(tǒng)計(jì)資料所屬時(shí)間或單位的表格。
b. 簡(jiǎn)單分組表:對(duì)總體僅按一個(gè)標(biāo)志進(jìn)行分組的統(tǒng)計(jì)表。
c. 復(fù)合分組表:對(duì)總體按兩個(gè)或兩個(gè)以上標(biāo)志進(jìn)行層疊分組。
③按統(tǒng)計(jì)資料的時(shí)間和空間分類
a. 空間數(shù)列表:指同一時(shí)間條件下,不同空間范圍的統(tǒng)計(jì)表。它說明在靜態(tài)條件下,客觀社會(huì)經(jīng)濟(jì)現(xiàn)象在不同空間范圍的分布狀況。
b. 時(shí)間數(shù)列表:指同一空間條件下,不同時(shí)間范圍的統(tǒng)計(jì)表。它說明在動(dòng)態(tài)條件下,客觀社會(huì)經(jīng)濟(jì)現(xiàn)象發(fā)展變動(dòng)狀況。
c. 時(shí)空結(jié)合表:是同時(shí)反映社會(huì)經(jīng)濟(jì)現(xiàn)象在不同空間和不同時(shí)間內(nèi)的數(shù)量分布的統(tǒng)計(jì)表。
(3)統(tǒng)計(jì)表的設(shè)計(jì)
總的要求:簡(jiǎn)練、明確、實(shí)用、美觀,便于比較。
①統(tǒng)計(jì)表設(shè)計(jì)應(yīng)注意事項(xiàng)
a. 統(tǒng)計(jì)表應(yīng)設(shè)計(jì)成由縱橫交叉線條組成的長(zhǎng)方形表格,長(zhǎng)與寬之間保持適當(dāng)?shù)谋壤?/p>
b. 線條繪制。表的上下端應(yīng)以粗線繪制,表內(nèi)縱橫線以細(xì)線繪制。表格左右兩端一般不劃線,采用“開口式”。
c. 合計(jì)欄的設(shè)置。統(tǒng)計(jì)表各縱列若須合計(jì)時(shí),一般應(yīng)將合計(jì)列在最后一行,各橫行若須要合計(jì)時(shí),可將合計(jì)列在最前一欄或最后一欄。
d. 欄數(shù)的編號(hào)。如果欄數(shù)較多,應(yīng)當(dāng)按順序編號(hào),習(xí)慣上主詞欄以“甲、乙、丙、丁……”為序號(hào),賓詞欄編以(1)、(2)、(3)、(4)……為序號(hào)。
②統(tǒng)計(jì)表內(nèi)容設(shè)計(jì)應(yīng)注意事項(xiàng)
a. 標(biāo)題設(shè)計(jì):標(biāo)題簡(jiǎn)明扼要。
b. 指標(biāo)數(shù)值:數(shù)字填寫整齊,對(duì)準(zhǔn)位數(shù)。當(dāng)數(shù)字因小可略而不計(jì)時(shí),可寫上“0”;當(dāng)缺某項(xiàng)數(shù)字資料時(shí),可用“…”表示;不應(yīng)有數(shù)字時(shí)用符號(hào)“-”表示。
c. 計(jì)量單位:當(dāng)全表只有一種計(jì)量單位時(shí),可以把它寫在表頭的右上方。如果表中各欄的指標(biāo)數(shù)值計(jì)量單位不同,可以橫行標(biāo)題后添一列計(jì)量單位。
d. 注解或資料來源。
第四節(jié) 用數(shù)字來概括數(shù)據(jù)
針對(duì)一組數(shù)據(jù)的分布特征,我們可以從兩個(gè)方面來考查它:一是該組數(shù)據(jù)的集中趨勢(shì),即該組數(shù)據(jù)的數(shù)值向其中心值的靠攏程度。二是該組數(shù)據(jù)的離散程度,它反映的是該組數(shù)據(jù)的各個(gè)數(shù)值遠(yuǎn)離其中心的趨勢(shì)和程度。
一.定性數(shù)據(jù)的數(shù)字特征
由于定性數(shù)據(jù)主要是計(jì)數(shù),比較簡(jiǎn)單,對(duì)定性數(shù)據(jù)的集中趨勢(shì)常用的方法就是計(jì)算比例、百分比、中位數(shù)和眾數(shù)。
中位數(shù)是將總體各單位標(biāo)志值按大小順序排列,處于中間位置的那個(gè)數(shù)(如果樣本量為奇數(shù)),或者中間兩個(gè)數(shù)目的平均(如果樣本量為偶數(shù))。
眾數(shù)就是數(shù)據(jù)中出現(xiàn)次數(shù)或出現(xiàn)頻率最多的數(shù)值。在定性數(shù)據(jù)中,由于記錄的是頻數(shù),因此眾數(shù)用得多些。
二.定量數(shù)據(jù)的數(shù)字特征
反映定量數(shù)據(jù)特征的統(tǒng)計(jì)量常用的有:
反映數(shù)據(jù)集中趨勢(shì)的水平度量:平均數(shù)、中位數(shù)、眾數(shù)和分位數(shù)等
反映數(shù)據(jù)離散程度的差異度量:極差、四分位差、標(biāo)準(zhǔn)差和方差
(一) 水平的度量
1. 平均數(shù)
平均數(shù)也稱為均值,是把某一組數(shù)據(jù)進(jìn)行算術(shù)平均,用以表述某一事物的平均水平,它在統(tǒng)計(jì)中叫做均值。
簡(jiǎn)單平均數(shù):把一個(gè)變量的所有觀測(cè)值相加再除以觀測(cè)值的數(shù)目
加權(quán)平均數(shù):如果原始數(shù)據(jù)為分組數(shù)據(jù),則采用加權(quán)平均數(shù)公式計(jì)算,其中的權(quán)數(shù)f為各組的頻數(shù)。
2. 中位數(shù)
數(shù)字按順序排列后,處于中間位置的數(shù)即是。如總位數(shù)為奇數(shù),中間數(shù)即是;若為偶數(shù),則是中間兩位數(shù)的平均值。
3. 眾數(shù)
數(shù)組中出現(xiàn)次數(shù)最多的數(shù)。
4. 用哪個(gè)值代表一組數(shù)據(jù)
平均數(shù)、中位數(shù)和眾數(shù)是描述數(shù)據(jù)水平的三個(gè)主要統(tǒng)計(jì)量,要合理使用則需要了解它們的不同特點(diǎn)和應(yīng)用場(chǎng)合。平均數(shù)易為多數(shù)人理解和接受,實(shí)際中用的也較多,但主要缺點(diǎn)是更容易受少數(shù)極端數(shù)值的影響,對(duì)于嚴(yán)重偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差。中位數(shù)和眾數(shù)提供的信息不像平均數(shù)那樣多,但它們也有優(yōu)點(diǎn),比如不受極端值的影響,具有統(tǒng)計(jì)上的穩(wěn)健性,當(dāng)數(shù)據(jù)為偏態(tài)分布,特別是偏斜程度較大時(shí),可以考慮選擇中位數(shù)和眾數(shù),這時(shí)它們的代表性要比平均數(shù)好。
(二) 差異的度量
對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象不僅需要對(duì)現(xiàn)象的集中趨勢(shì)進(jìn)行分析(平均數(shù)、中位數(shù)、眾數(shù)),而且還需要進(jìn)行差異程度分析即離散程度分析。研究事物現(xiàn)象的差異性,從差異性的事物現(xiàn)象中,尋求解決差異性的一些方法。
1. 極差( Range)
極差又稱全距,是最簡(jiǎn)單的離散指標(biāo),它是一組數(shù)據(jù)中的最大值和最小值之差。
計(jì)算極差非常簡(jiǎn)單,含義也很直觀。但是,它僅僅受最大值和最小值的影響,不能反映一組數(shù)據(jù) 分布的情況,而且它非常容易受數(shù)據(jù)中極端值的影響。因此,它不能準(zhǔn)確地描述數(shù)據(jù)的分散程度。
2. 方差和標(biāo)準(zhǔn)差
為了反映數(shù)據(jù)中的每一個(gè)觀察值與平均水平的差異程度就必須引入方程和標(biāo)準(zhǔn)差的概念。
方差:將各個(gè)變量值和其均值離差平方的平均數(shù),作為樣本數(shù)據(jù),它反映了樣本中各個(gè)觀測(cè)值到其均值的平均離散程度。其計(jì)算公式為:
標(biāo)準(zhǔn)差是方差的平方根,它與方差相比更具量綱性,而且與變量值的計(jì)量單位相同,使用的范圍比方差更廣泛。其計(jì)算公式為:
式中是總體標(biāo)準(zhǔn)差,s為樣本標(biāo)準(zhǔn)差??傮w自由度為n,樣本自由度為n-1,兩種有差異,是因?yàn)?,自由度是指一組數(shù)據(jù)中可以自由取值的個(gè)數(shù),當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為 n時(shí),其樣本均值 是確定的,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)不能自由取值。所以,樣本的標(biāo)準(zhǔn)差只能除以n-1 ,而不能除以n .
在一個(gè)統(tǒng)計(jì)樣本中,其標(biāo)準(zhǔn)差越大,說明它的各個(gè)觀測(cè)值分布的越分散,它的趨中程度就越差。反之,其標(biāo)準(zhǔn)差越小,說明它的各個(gè)觀測(cè)值分布的越集中,它的趨中程度就越好。
3. 離散系數(shù)
離散系數(shù)也稱變異系數(shù)、標(biāo)準(zhǔn)差系數(shù),它是將一組數(shù)據(jù)的標(biāo)準(zhǔn)差除以其均值,用來測(cè)度數(shù)據(jù)離散程度的相對(duì)數(shù)。其計(jì)算公式為:
4. 標(biāo)準(zhǔn)分?jǐn)?shù)
標(biāo)準(zhǔn)分?jǐn)?shù)也稱標(biāo)準(zhǔn)化值或Z分?jǐn)?shù),它是變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值,用以測(cè)定某一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的相對(duì)位置。其計(jì)算公式為:
標(biāo)準(zhǔn)分?jǐn)?shù)最大的用途是可以把兩組數(shù)據(jù)中的兩個(gè)不同均值,不同標(biāo)準(zhǔn)差的數(shù)據(jù)進(jìn)行對(duì)比,以判定它們?cè)诟鹘M中的位置。見課本P271例題.標(biāo)準(zhǔn)分?jǐn)?shù)對(duì)比的兩個(gè)數(shù)據(jù)在各自數(shù)組中的相對(duì)位置。
凡本站注明“稿件來源:新科教育”的所有圖文音視頻,版權(quán)均屬新科所有,任何媒體、網(wǎng)站或個(gè)人未經(jīng)本網(wǎng)協(xié)議授權(quán)不得轉(zhuǎn)或以其他方式復(fù)制發(fā)表。已獲得本站協(xié)議
授權(quán)的媒體、網(wǎng)站,在下載使用時(shí)必須注明“稿件來源:新科教育”,違者本站將依法追究責(zé)任。