解放軍文職招聘考試第五講 樣本及抽樣分布-解放軍文職人員招聘-軍隊文職考試-紅師教育
發(fā)布時間:2017-05-30 11:07:37第五講 樣本及抽樣分布一 基本概念總體 含義1:研究對象的全體,例如一批燈泡。含義2:研究對象的某數(shù)量指標(例如燈泡的壽命,隨機變量)X的取值全體,總體的分布是指隨機變量X的分布。個體 組成總體的某個基本單元,例如一個個的燈泡,也指基本單元的數(shù)量指標。樣本 從總體中抽取的n個個體,n又稱樣本容量。簡單隨機樣本 樣本中的n個個體相互獨立,且與總體同分布的樣本,簡稱樣本。樣本的實驗結(jié)果稱為樣本觀測值。樣本空間 樣本的所能可能結(jié)果。統(tǒng)計量 樣本的不含任何參數(shù)的函數(shù)。二 重要統(tǒng)計量樣本均值 (而稱為樣本均值的觀測值)樣本方差注:三、抽樣分布統(tǒng)計量的分布:大多數(shù)情況下,針對正態(tài)分布樣本而言,以下不說明均指正態(tài)分布。1、分布: 如果r.v X的密度函數(shù)為則稱X服從參數(shù)為n的分布,記作又稱自由度,指獨立變量的個數(shù)。如果,則。定理5.1 如果,則與獨立。例5.1 (993) 天平上重復稱量重量為a的物品,每次稱量結(jié)果獨立同服從正態(tài)分布N(),若以表示n次稱量的算術(shù)平均,則為使n的最小值應不小于自然數(shù) 16 。解:因為,故,。例5.2 已知且求a,b。解:同理例5.3 (983) 是N (0,)的樣本,則a=,b= 時分布,自由度為2例5.4設(shè)總體X服從正態(tài)分布,從該總體中抽取簡單隨機樣本,其樣本均值為,求統(tǒng)計量的數(shù)學期望E(Y)。2、t-分布 如果與相互獨立,則稱服從自由度(參數(shù))為n的t-分布,記作t (n)。定理5.2 如果則證明:由t-分布的定義知例5.5 (97.4)已知則統(tǒng)計量服從分布,參數(shù)為9。解:因為由t-分布的定義知例5.6 (944) 設(shè),(A) (B)(C) (D)則服從t (n-1)的隨機變量是(B)。注:(C)、(D)的分布自由度為n ,題中條件自由度為n-1,而(A)不符合定理2結(jié)論。例5.7(993)是正態(tài)總體樣本,證明Z ~ t (2 )證:設(shè),則,且三者相互獨立,與S2獨立。練習:1)設(shè)已知,則統(tǒng)計量服從 (t) 分布,參數(shù)為 n 。2)設(shè),,,,求a = 。3、F-分布 設(shè)與相互獨立,則稱為服從第一自由度為n第二自由度為m的F-分布。定理5.3 設(shè)與相互獨立,則例5.8 (013) 則統(tǒng)計量~分位數(shù):(連續(xù)型)設(shè)有r.v ,對于滿足的稱為r.v 的上側(cè)a分位數(shù),顯然對于標準正態(tài)分布的上側(cè)a分位數(shù)而言,。類似地可以定義的下側(cè)a分位數(shù),即若則稱為r.v 的下側(cè)a分位數(shù)。顯然和間滿足,并且對于正態(tài)分布和t分布,由于它們是對稱的,故。因此列分位數(shù)表時,一般正態(tài)分布和t分布(用表示t分布的上側(cè)a分位數(shù))只給出上側(cè)a分位數(shù)表;而對于F-分布,由于有關(guān)系式,也只須給出上側(cè)a分位數(shù)表:但對于分布,沒有這些性質(zhì),必須同時給出與。注:實際計算時,可令,相應的自由度記為,這時可避免查下側(cè)分位數(shù)??杉有裕憾椃植肌⒉此煞植?、正態(tài)分布和分布具有可加性。第六講 參數(shù)估計一、矩估計若統(tǒng)計量T作為總體參數(shù)(或g( ))的估計時,T就稱為(或g( ))的估計量。定義6.1矩估計量 設(shè)是總體X的樣本,X的分布函數(shù) 依賴于參數(shù),假定X的r階矩為(或r階中心矩)相應的樣本矩記為 如下的k個議程(6.1)的解,稱為未知參數(shù)的矩估計。例6.1 (971) 設(shè)總體X的密度是未知參數(shù),是總體X的樣本,求的矩估計。解:總體只有一個未知參數(shù),只須建立一個(一階矩)方程式建立方程例6.2 設(shè)是總體的樣本,求a,b的矩估計。解:總體有兩個未知參數(shù),須建立兩個方程。由于練習:設(shè)。二、最(極)大似然估計設(shè)總體X的密度函數(shù)是參數(shù)或參數(shù)向量,是該總體的樣本,對給定的一組觀測值,其聯(lián)合密度是的函數(shù),又稱似然函數(shù),記為:其中為參數(shù)集,若存在 使就稱是的最大似然估計值,而是的最大似然估計量。注:1)對給定的觀測值,是的函數(shù),最大似然估計的原理是選擇使觀測值出現(xiàn)的 概率 達到最大的作為的估計。2)最大似然估計具有不變性,即若是的最大似然估計,則的最大似然估計為。但是,矩估計不具有不變性,例如假定的矩估計,一般情形下,的矩估計不是。例6.3 設(shè)總體X具有有是已知的正整數(shù),求未知參數(shù)的最大似然估計。解:對給定的觀測值,其似然函數(shù)為:當時,對數(shù)似函數(shù)為:(6.3)令的最大似然估計量為。注:在(6.3)式中,對求偏導數(shù)與無關(guān)的量均歸為常數(shù)。例6.4 的最大似然估計量。解:又因為的最大似然估計量分別為根據(jù)極大似然估計的不變性,可知p的極大似然估計量為。例6.5 設(shè)的極大似然估計。解:總體密度為時。故對于樣本觀測值,似然函數(shù)為如果的估計取得過大,將變?。ㄒ驗榉帜缸兇螅?,如果取得太小,某,這時故的極大似然估計值為極大似然估計量為例6.6 某單位有M輛自行車,編號為,假定職工存取自行車是隨機的,有人連續(xù)觀測了幾天,將其第i天看到的第一輛車的牌號記為,求M的極大似然估計量。解:設(shè)總體X表示每天存取的牌號,X取值,由于存取車是隨機的,故其分布列為。這可以視為離散型均勻分布,同上題分析知M的極大似然估計量為例6.7 設(shè)某種元件的壽命,其中是未知參數(shù),又設(shè)是X的一組觀測值,求的最大似然估計值.解:似然函數(shù)對數(shù)似然函數(shù),是的單調(diào)增加函數(shù),越大越大,但如果大于某,則其值=0,故時達到最大.三、估計量的優(yōu)良性質(zhì):以下假定的估計量(對的估計量也成立)無偏性:一致性:。注:一致估計具有不變性,即若的一致估計量,的函數(shù),則的一致估計量。例6.8 設(shè)是總體X的樣本,則 (C)(A)S是的無偏估計量. (B)S是的最大似然估計量.(C)S是的一致估計量. (D) S與相互獨立的.解:的無偏估計量,無偏估計不具有不變性,因此一般情況下S不是的無偏估計量;盡管最大似然估計具有不變性,但一般情況下的最大似然估計量是一致估計具有不變性,故(C)成立;在正態(tài)分布情況下相互獨立。例6.5續(xù): 是否為的無偏估計(或是否具有無偏性),是否為的一致估計。解:當時當時而的無偏估計。故的一致估計。有效性:的無偏估計,若,稱較有效。例6.9設(shè)從均值為,方差為的總體中分別抽取容量為的兩個獨立樣本,樣本均值分別記為,試證對于任意滿足的常數(shù)。的無偏估計,并確定常數(shù),使T的方差達到最小。解:即的無偏估計量,又而令故處達到最小值,即使T的方差達到最小。二、區(qū)間估計設(shè)是總體X的樣本,總體參數(shù)為對給定的,若統(tǒng)計量,滿足,就稱隨機區(qū)間的置信度為的置信區(qū)間(區(qū)間估計)。具體做法:構(gòu)造樣本的函數(shù),其中的分布與無關(guān),選擇使再將上式轉(zhuǎn)換成即可。例6.10 求的置信度為的置信區(qū)間,如果取得如下觀測值:1.8,2.1,2.0,2.2,1.9,2.2,1.8,求的區(qū)間估計值。解:先考慮的區(qū)間估計,構(gòu)造一個隨機變量且,且其分布易求。,但上式還含有其他參數(shù)(稱為討厭參數(shù)),當已知為,的的置信區(qū)間為,在(934略)中,得到的的區(qū)間估計值為 [4.804,5.196]。當未知時,用s代替,就有,r.v其中,于是由t-分布的對稱性。對于,由于故由分布的非對稱性對于本例,給定的樣本觀測值算得,,故的區(qū)間估計值為:的區(qū)間估計值為:例6.11 (003) 假定0.5, 1.25, 0.8, 2.0是總體X的樣本值,已知,(1)求;(2)求的0.95置信區(qū)間;(3)b的0.95置信區(qū)間。解:(1),(2),故,于是, (1)的95%置信區(qū)間為,由觀測值算的,故的95%置信區(qū)間為。(3)由的嚴格遞增值,及(1)知故由的95%置信區(qū)間為。第七講 假 設(shè) 檢 驗統(tǒng)計假設(shè):對總體的分布形式或分布中的某些參數(shù)所作的某種假設(shè)。檢驗:由樣本構(gòu)造合適的統(tǒng)計量,對統(tǒng)計假設(shè)正確與否所作的判斷。一、基本概念:1、假設(shè)檢驗的一般步驟:1)將實際問題轉(zhuǎn)化成統(tǒng)計假設(shè)檢驗問題。提出原假設(shè) 與備選假設(shè)注:如果,那么意味,意味且2)構(gòu)造合適的統(tǒng)計量3)導出統(tǒng)計量的分布,對給定的顯著水平,確定拒絕域4)根據(jù)樣本觀測值,計算統(tǒng)計量的值,判斷是否落在拒絕域內(nèi),并對實際問題作出問答。2、檢驗類型:單邊檢驗與雙邊檢驗;一個總體與兩總體檢驗;均值與方差檢驗。3、兩類錯誤。二、應用舉例例7.1 某味精廠生產(chǎn)的味精每袋重X(克)服從,根據(jù)要求每袋重100克,由以往生產(chǎn)經(jīng)驗知X的均方差為基本穩(wěn)定,現(xiàn)從某天包裝的味精中隨機抽取9袋,測得它們的重為99.3,98.7,100.5,101.2,99.3,99.7,99.5,102.1,100.5,試問這天包裝的味精是否合格?解:是正態(tài)總體參數(shù)的假設(shè)檢驗問題,方差已知,參數(shù)將分成兩部對應了實際問題中的包裝合格與不合格(雙邊檢驗問題),即(包括)含等號的為原假設(shè),于是由于方差已知,用統(tǒng)計量,即取=0.05拒絕域,經(jīng)計算,接受原假設(shè),認為包裝機正常,包裝合格。例7.2 燈泡的使用壽命服從分布,假定燈泡的額定壽命是960小時,從某批生產(chǎn)者的燈泡中隨機抽驗了10只,測得壽命為:950,960,960,950,950,960,940,970,950,960試問這批燈泡是否合格()?解:這是一個正態(tài)總體,方差未知,均值的單邊假設(shè)檢驗問題,燈泡合格對應了,燈泡不合格對應了,于是其中拒絕域,臨界值由觀測值算得 原假設(shè)成立,這批燈泡合格。例7.3 某化工廠為了提高某種化學藥品的得率,提出了兩種工藝方案,為了研究哪一種方案好,分別用兩種工藝各進行了10次試驗,數(shù)據(jù)如下:假設(shè)得率分別服從,問方案乙是否比方案甲顯著提高得率?(取=0.01)解:這是兩個正態(tài)總體均值的檢驗問題。有顯著提高:,無顯著提高(單邊檢驗)。對于兩個正態(tài)總體均值的檢驗,大綱只給出兩總體方差相等時的檢驗問題,故可以先進行方差相等的(雙邊)檢驗。,,而:接受原假設(shè),即:再檢驗(單邊)假設(shè):查表: 拒絕域 而拒絕原假設(shè),認為,乙方案的結(jié)果顯著提高。注:兩正態(tài)總體方差未知,但相等的檢驗統(tǒng)計量:獨立,為比較的差的差衡量,故又如本例給出兩總體的具體觀測值,且,這時可令從而檢驗統(tǒng)計量其中,這就避開了檢驗方差是否相等的檢驗。
解放軍文職招聘考試第六章樣本及抽樣分布-解放軍文職人員招聘-軍隊文職考試-紅師教育
發(fā)布時間:2017-05-30 11:07:06第六章 樣本及抽樣分布2、了解經(jīng)驗分布函數(shù)和直方圖的作法,知道格林汶科定理;3、理解樣本均值、樣本方差和樣本矩的概念并會計算;4、理解統(tǒng)計量的概念,掌握幾種常用統(tǒng)計量的分布及其結(jié)論;5、理解分位數(shù)的概念,會計算幾種重要分布的分位數(shù)。分布;分位數(shù)的理解和計算。6.0 前 言 5分鐘前面五章我們研究了概率論的基本內(nèi)容,從中得知:概率論是研究隨機現(xiàn)象的統(tǒng)計規(guī)律性的一門數(shù)學分支。它是從一個數(shù)學模型出發(fā)(比如隨機變量的分布)去研究它的性質(zhì)和統(tǒng)計規(guī)律性;而我們下面將要研究的數(shù)理統(tǒng)計,也是研究大量隨機現(xiàn)象的統(tǒng)計規(guī)律性,并且是應用十分廣泛的一門數(shù)學分支。所不同的是數(shù)理統(tǒng)計是以概率論為理論基礎(chǔ),利用觀測隨機現(xiàn)象所得到的數(shù)據(jù)來選擇、構(gòu)造數(shù)學模型(即研究隨機現(xiàn)象)。對研究對象的客觀規(guī)律性做出種種合理性的估計、判斷和預測,為決策者和決策行動提供理論依據(jù)和建議。數(shù)理統(tǒng)計的內(nèi)容很豐富,這里我們主要介紹數(shù)理統(tǒng)計的基本概念,重點研究參數(shù)估計和假設(shè)檢驗。6.1 隨機樣本 25分鐘一、總體與樣本1.總體、個體在數(shù)理統(tǒng)計學中,我們把所研究的全部元素組成的集合稱為總體;而把組成總體的每個元素稱為個體。例如:在研究某批燈泡的平均壽命時,該批燈泡的全體就組成了總體,而其中每個燈泡就是個體;在研究華北工學院男大學生的身高和體重的分布情況時,該校的全體男大學生組成了總體,而每個男大學生就是個體。但在數(shù)理統(tǒng)計里,由于我們關(guān)心的不是每個個體的種種具體特性,而僅僅是它的某一項或幾項數(shù)量指標(可以是向量)和該數(shù)量指標X在總體的分布情況。在上述例子中X是表示燈泡的壽命或男大學生的身高和體重。在實驗中,抽取了若干個個體就觀察到了的這樣或那樣的數(shù)值,因而這個數(shù)量指標是一個隨機變量(或向量),而的分布就完全描寫了總體中我們所關(guān)心的那個數(shù)量指標的分布狀況。由于我們關(guān)心的正是這個數(shù)量指標,因此我們以后就把總體和數(shù)量指標可能取值的全體組成的集合等同起來。我們對總體的研究,就是對相應的隨機變量的分布的研究,所謂總體的分布也就是數(shù)量指標的分布,因此,的分布函數(shù)和數(shù)字特征分別稱為總體的分布函數(shù)和數(shù)字特征。定義1:把研究對象的某項或幾項數(shù)量指標的值的全體稱為總體;總體中的每個元素稱為個體。根據(jù)總體中所包括個體的總數(shù),將總體分為:有限總體和無限總體。Ex1:考察一塊試驗田中小麥穗的重量:=所有小麥穗重量的全體(無限總體);個體 每個麥穗重對應的分布:Ex2:考察一位射手的射擊情況:=此射手反復地無限次射下去所有射擊結(jié)果全體;每次射擊結(jié)果都是一個個體(對應于靶上的一點)個體數(shù)量化1在總體中的比例為命中率0在總體中的比例為非命中率總體由無數(shù)個0,1構(gòu)成,其分布為兩點分布2.樣本與樣本空間。為了對總體的分布進行各種研究,就必需對總體進行抽樣觀察。抽樣 從總體中按照一定的規(guī)則抽出一部分個體的行動。一般地,我們都是從總體中抽取一部分個體進行觀察,然后根據(jù)觀察所得數(shù)據(jù)來推斷總體的性質(zhì)。按照一定規(guī)則從總體中抽取的一組個體稱為總體的一個樣本,顯然,樣本為一隨機向量。為了能更多更好的得到總體的信息,需要進行多次重復、獨立的抽樣觀察(一般進行次),若對抽樣要求①代表性:每個個體被抽到的機會一樣,保證了的分布相同,與總體一樣。②獨立性:相互獨立。那么,符合 代表性 和 獨立性 要求的樣本稱為簡單隨機樣本。易知,對有限總體而言,有放回的隨機樣本為簡單隨機樣本,無放回的抽樣不能保證的獨立性;但對無限總體而言,無放回隨機抽樣也得到簡單隨機樣本,我們本書則主要研究簡單隨機樣本。對每一次觀察都得到一組數(shù)據(jù)(),由于抽樣是隨機的,所以觀察值()也是隨機的。為此,給出如下定義:定義2:設(shè)總體的分布函數(shù)為,若是具有同一分布函數(shù)的相互獨立的隨機變量,則稱()為從總體(從分布函數(shù))中得到的容量為的簡單隨機樣本,簡稱樣本。把它們的觀察值()稱為樣本值。定義3:把樣本()的所有可能取值構(gòu)成的集合稱為樣本空間,顯然一個樣本值()是樣本空間的一個點。二、樣本的分布:設(shè)總體的分布函數(shù)為,密度函數(shù)為,()是的一個樣本,則其分布函數(shù)(聯(lián)合分布)、概率密度函數(shù)(聯(lián)合概率密度函數(shù))分別為:=; =()Ex3:設(shè)總體為其一個簡單隨機樣本,則樣本空間樣本聯(lián)合分布6.2 分布函數(shù)與概率密度函數(shù)的近似解 20分鐘在概率論中,我們介紹了幾種常用的分布函數(shù)與密度函數(shù)以及它們的性質(zhì),當時我們總假定它們都是先給定的,而在實際中,所遇到的用于描述隨機現(xiàn)象的隨機變量,事先并不知道其分布函數(shù)與概率密度函數(shù),甚至連其分布類型也一無所知,那么,怎么樣才能確定它的分布函數(shù)與密度函數(shù)呢?一般地,利用樣本及樣本值,建立一定的概率模型,用由此獲得的概率統(tǒng)計信息來對總體的和進行估計和推斷,這就是:一、經(jīng)驗分布函數(shù)。設(shè)()是來自總體的樣本,()是樣本的一個觀察值,設(shè)這個數(shù)值由小到大的順序排列后為: ,對 R 定義:稱是總體的經(jīng)驗分布函數(shù)。顯然,是單調(diào)非降右連續(xù)的跳躍函數(shù)(階梯函數(shù)),在點處有間斷,在每個間斷點的躍度為,(=1,2,3, ,)且,=0,=1,它滿足分布函數(shù)的三個性質(zhì),所以必是一個分布函數(shù)。一般地,隨著的增大,越來越接近的分布函數(shù),關(guān)于這一點,格列汶科(Gilvenko)在1953年給了理論上的論證,即:定理1.(Gilvenko-Th):若總體的分布函數(shù)為,經(jīng)驗分布函數(shù)為,則對 R,有:定理表明,以概率1致收斂于,即:可以用來近似,這也是利用樣本來估計和判斷總體的基本理論和依據(jù)。Eg4:某廠從一批熒光燈中抽出10個,測其壽命的數(shù)據(jù)(單位千時)如下:95.5, 18.1, 13.1, 26.5, 31.7, 33.8, 8.7, 15.0, 48.8, 48.3解:將數(shù)據(jù)由小到大排列得:8.7,13.1,15.0,18.1,26.5,31.7,33.8,48.8,49.3,95.5則經(jīng)驗分布函數(shù)為:二、利用直方圖求密度函數(shù)的近似解:設(shè)()為來自總體的一個樣本,其樣本觀察值為(),將該組數(shù)值分成組,可作分點:(各組距可以不相等),則各組為:(,],(,, ,(,,若樣本觀察值中每個數(shù)值落在各組中的頻數(shù)分別為,,, ,,則頻率分別為:, ;以各組為底邊,以相應組的頻率除以組距為高,建立個小矩形,即得總體的直方圖。由上分析可知:直方圖中每一矩形的面積等于相應組的頻率設(shè)總體的密度函數(shù)為,則:總體(真實值)落在第組(,的概率為:。由Bernoulli大數(shù)定理可知:當n很大時,樣本觀察值(單個)落在該區(qū)間的頻率趨近于此概率;即:( ,上矩形的面積接近于在此區(qū)間上曲邊梯形的面積,當n無限增大時,分組組距越來越小,直方圖就越接近總體的密度函數(shù)的圖象。(這與定積分的意義具有同樣的道理)。6.3 樣本的數(shù)字特征 40分鐘0、引言由第三章節(jié)知:隨機變量的數(shù)字特征,能夠反映隨機事件的某些重要的概率特征,從第一節(jié)可知,樣本也是一組隨機變量(隨機向量),為了詳細刻劃樣本觀察值中所包含總體的信息及樣本值的分布情況,下面我們研究樣本的數(shù)字特征。一、樣本均值與樣本方差(隨機變量)設(shè)()是來自總體的一個樣本,()是相應的樣本觀察值。定義1,稱為樣本均值。稱為樣本方差。稱為樣本標準差。樣本均值與樣本方差分別刻劃了樣本的位置特征及樣本的離散性特征。二、樣本矩設(shè)總體的分布函數(shù)為,密度為,若,則稱為總體的階原點矩;若,則稱為總體的階中心矩。把總體的各階中心矩和原點矩統(tǒng)稱為總體矩(數(shù)值) 表示總體的數(shù)字特征。特別地:=;是總體的期望和方差。仿此,下面給出樣本矩的定義:定義2:設(shè)()是來自總體的一個樣本,()為其樣本值,則樣本的階原點矩(隨機變量)定義為:,=1,2,3 ;樣本值的階中心矩(隨機變量)定義為:,=1,2,3 ;由上述定義可知:樣本均值、樣本方差、樣本均方差、樣本矩都是關(guān)于樣本的函數(shù),而樣本本身又是隨機變量(隨機向量),因此,上述關(guān)于樣本的數(shù)字特征也是隨機變量,其值分別為:;=;;; ;=1,2,3 ;這些值也分別稱為樣本均值、樣本方差、樣本標準差、樣本階原點矩、樣本階中心矩。特別地, ,但與卻不同,由與的計算式可知:,當時,=,所以常把記為。并常利用來計算S(標準差)。Eg5:從某班級的期末考試成績中,隨機抽取10名同學的成績分別為:100,85,70,65,90,95,63,50,77,86(1)試寫出總體,樣本,樣本值,樣本容量;(2)求樣本均值,樣本方差及二階原點矩解:(1)總體:該班級的期末考試成績;樣本:(,,, ,)樣本值:(100,85,70,65,90,95,63,50,77,86)樣本容量: =10(2)(100+85+ +86)=78.1三、課后作業(yè):1、仔細閱讀P122-132;2、作業(yè):P146 3,43、預習:抽樣分布6.4 抽 樣 分 布 100分鐘0、引言有了總體和樣本的概念,能否直接利用樣本來對總體進行推斷呢?一般來說是不能的,需要根據(jù)研究對象的不同,構(gòu)造出樣本的各種不同函數(shù),然后利用這些函數(shù)對總體的性質(zhì)進行統(tǒng)計推斷,為此,我們首先介紹數(shù)理統(tǒng)計的另一重要概念 統(tǒng)計量。一、統(tǒng)計量(隨機變量)定義1:設(shè)()是來自總體的一個樣本,()是的函數(shù),若為實值函數(shù),且中不含任何未知參數(shù),則稱()是一個統(tǒng)計量。事實上 6.3中的樣本均值、樣本方差、樣本矩都是統(tǒng)計量;再如是來自總體的一個樣本,則都是統(tǒng)計量,而就不是統(tǒng)計量。由 6.1知:()是隨機變量,而統(tǒng)計量是樣本()的函數(shù),所以統(tǒng)計量也是隨機變量(隨機變量的函數(shù)為隨機變量)。我們把統(tǒng)計量的分布稱為抽樣分布。而統(tǒng)計量是我們對總體的分布函數(shù)或數(shù)字特征進行統(tǒng)計推斷的最重要的基本概念,所以尋求統(tǒng)計量的分布成為數(shù)理統(tǒng)計的基本問題之一。然而要求出一個統(tǒng)計量的精確分布是十分困難的。而在實際問題中,大多總體都服從正態(tài)分布:而對于正態(tài)分布,我們可以求出一些重要統(tǒng)計量的精確分布,這就是:二、幾種常用的抽樣分布:(正態(tài)分布中的幾種統(tǒng)計量的分布)把分布,分布,分布,統(tǒng)稱為 統(tǒng)計三大分布 。1、正態(tài)分布由正態(tài)分布的性質(zhì),可得如下結(jié)論:定理:設(shè)相互獨立,,,是關(guān)于的任一確定的線性函數(shù)(), 則也服從正態(tài)分布,即:。從而有:若()是來自總體的一個樣本,為樣本均值,則,由上述結(jié)論可知:的期望與的期望相同,而的方差卻比的方差小的多,即的取值將更向集中。2、 分布1)、定義:設(shè)()是來自總體 的一個樣本,則稱統(tǒng)計量:所服從的分布是自由度為(指上式中所含獨立變量的個數(shù))的分布。記作:的概率密度函數(shù)為: ,其中:,顯然, ,且,即符合密度函數(shù)性質(zhì)。事實上,2) 分布的性質(zhì)I、分布的可加性:設(shè),,且與相互獨立,則:+II、若,則,,事實上,因為,則:,,所以:;3) 結(jié)論:設(shè)()為來自總體的一個樣本,,為已知常數(shù),則:I ) 統(tǒng)計量 (當=0時也成立)II) 樣本均值與樣本方差相互獨立,且統(tǒng)計量。對I,事實上若,則,所以;對II,參閱有關(guān)數(shù)理統(tǒng)計的課本。3、分布1) 定義:設(shè),,且與相互獨立,則稱隨機變量:所服從的分布是自由度為的分布,記為,分布又稱為學生氏(Student)分布。分布的概率密度函數(shù)為: 。2) 分布的特點(性質(zhì))。I、關(guān)于=0對稱;II、在=0達最大值;III、的軸為水平漸近線;IV、;即時,分布,一般地,當 30時,分布與非常接近。V、當較小時,分布與有較大的差異,且對有,其中。即分布的尾部比的尾部具有更大的概率。VI、若,則 時,3) 結(jié)論:I)設(shè)()是來自總體的一個樣本,則統(tǒng)計量:,事實上,由,又,且與相互獨立,則與相互獨立,由分布的定義,所以II)設(shè)()是來自總體的一個樣本,(是來自總體的一個樣本,且它們是相互獨立的,則統(tǒng)計量,其中,,,事實上,,,且與相互獨立,所以:,即:;又,,且它們相互獨立,由分布的可加性,則 。由分布的定義:4、 分布1) 定義:設(shè),,且與相互獨立,則稱隨機變量所服從的分布是自由度為的分布,記作:,其中:為第一自由度,為第二自由度。由定義,顯然有:;若,則。的概率密度函數(shù)為:說明:先求出 的聯(lián)合密度函數(shù),再令,求出()的聯(lián)合,注意到獨立,所以的邊緣密度函數(shù),也即的密度函數(shù)。2) 分布的性質(zhì)(特點)I.密度曲線不對稱(偏態(tài))II.若,且與獨立,則:III.若,則IV.當時,當時,,注:(利用)3) 結(jié)論:設(shè)()是來自總體的一個樣本,(是來自總體的一個樣本,且它們是相互獨立,則,事實上,,,由分布的定義,則:,四、分位數(shù):定義:設(shè)為某變量的分布函數(shù), 若有使,則稱為此概率分布的分位數(shù)(分位點)。1、的分位數(shù)滿足:。2、分布的分位數(shù) 滿足:,由附表6查其值:當時,或。3、分布的分位數(shù)滿足:,由附表5可查出其值。由于時,分布接近于,所以當時,可查分布分位數(shù)表,且滿足:。4、分布的分位數(shù)滿足:,由分布性質(zhì),有:=。5、分位數(shù)的其它表示法。1)若使,則稱為的上側(cè)分位數(shù),顯然:為原分布的1-分位數(shù),這是因為。例:若,滿足:,則2)若,使,;則稱為的雙側(cè)分位數(shù),顯然,為的分位數(shù),為的1-分位數(shù)。例:設(shè),求,使得,解:五、課后作業(yè):1、認真閱讀P132-145;2、作業(yè):P148 10,12,163、預習:參數(shù)估計的概念與點估計的求法。
解放軍文職招聘考試第六章樣本及抽樣分布2-解放軍文職人員招聘-軍隊文職考試-紅師教育
發(fā)布時間:2017-05-30 11:27:23第六章樣本及抽樣分布[本章要求]1. 理解數(shù)理統(tǒng)計的思想方法,會用這種方法做題,以至于深入研究其它知識。2. 掌握本章介紹的u分布,分布,t分布和F分布。3. 掌握單個總體的t分布和兩個總體的t分布。[內(nèi)容提要與疑難解析]一、數(shù)理統(tǒng)計的內(nèi)容及思想方法數(shù)理統(tǒng)計分為三個階段,初級階段也就是本科要學的內(nèi)容,有參數(shù)估計、假設(shè)檢驗、方差分析、回歸分析。中級階段也就是碩士研究生要學的內(nèi)容,有多元統(tǒng)計、正交設(shè)計、隨機過程、時間序列分析。高級階段也就是科研人員研究的問題有抽樣理論、質(zhì)量控制、可靠性理論、統(tǒng)計決策。數(shù)理統(tǒng)計是以概率為基礎(chǔ),以統(tǒng)計為手段利用抽樣方法對樣本進行測試,并根據(jù)對測試結(jié)果的分析研究得出總體情況的判斷的一門科學。在研究樣本時有的是在大規(guī)模生產(chǎn)線上抽樣,有的是破壞性的研究,因此要避免浪費人力、物力及資源,必須用局部代替全局。用局部的各種值估計全局的各種值,用局部具有的性質(zhì)代替全局的性質(zhì),這種作法可能會有誤差,但大量取樣時,這個誤差不會太大,甚至于取樣個數(shù)趨于無窮時,這個誤差為零的概率為1。二、有關(guān)的概念1.總體、個體:研究對象的某項數(shù)量指標的值的全體??傮w中每個元素稱為個體。2.簡單隨機抽樣:從總體中一個個體,稱為一次試驗。每個個體在一次試驗中被抽到的機會均相等,而且從總體中抽取一個個體后,余下部分的分布和原總體的分布是一樣的。當總體中有無限個個體時,認為是不放回取樣 ;當總體中有有限個個體時,認為是放回取樣。3.樣本、樣本值、容量:從總體中用簡單隨機抽樣的方法抽出n個個體,這n個個體相互之間是相互獨立的,即抽取第一個時不影響第二個,抽取第二個時不受第一個影響,同時也不影響第三個。每一個個體可以看作一個隨機變量,因為看作第一個個體在總體中哪一個都有資格同時也都有可能被抽到,因此不是固定的。且每一個都與總體同分布,其他個體也是如此,這n個個體稱為一個樣本,容量為n,用來表示,當取得具體值時用表示,如同函數(shù)和函數(shù)值一樣。但學習了一段時間之后,也就不區(qū)分了,一律用小寫表示,表示雙重含義,也就自然了。4.樣本矩:定義為樣本的k階原點矩,k=1時稱為樣本均值,即,定義為樣本的k階中心矩,k=2時是方差的極大似然估計,稱為不常用的樣本方差而稱為常用的樣本方差。5.統(tǒng)計量:用樣本作成的實函數(shù)形式(一般是連續(xù)函數(shù)形式),不含未知參數(shù)。上述的樣本矩都是統(tǒng)計量。到參數(shù)估計和假設(shè)檢驗中,出現(xiàn)了含有未知參數(shù)的統(tǒng)計量,是否與統(tǒng)計量的本意相矛盾,其實是建立了除被估計參數(shù)之外不含有未知參數(shù)的統(tǒng)計量,這是權(quán)宜之計。三、幾種統(tǒng)計分布1.u分布在中抽取一個樣本,它們相互獨立,且與總體同分布,故,,2. 分布在抽取一個樣本,作平方和,相互獨立, 也獨立,于是分布的自由度為n。常用的是(n-1).3.t分布t分布是由標準正態(tài)作分子,分布除以其自由度后再開方作分母,即t=,其中,~(n),t的自由度為n。常用的是 ,兩個總體的t分布,,,,, ,,,其中4. F分布, ,相互獨立,則 ,上述四個分布的密度函數(shù)不必深究,知道其定義、性質(zhì)、查表就可以。U分布和t分布關(guān)于y軸對稱,分布和F分布只在x軸正方向。四、幾種分布中應注意的問題1.單個總體中已知方差u的分布,為知方差時的t分布,表面看來只是與 s 的區(qū)分,其實是兩個不同的分布,使用時一定注意條件。而且還要注意查表的不同,正態(tài)分布查表是 ,而t分布查表是 .2. 分布的期望和方差的推導過程。因為,,而 , ,=.,(相互獨立,之間也獨立),其中 , , 令,,故 ,3. 分布自由度的確定是根據(jù)分布中有無相互制約的隨機變量而確定,例如,是由于中,;因此少了一個自由度,而,中沒有這個約束條件,故自由度為n。分布自由度有如下性質(zhì),若與獨立,其和+=4. t分布自由度超過45,可以用正態(tài)分布代替,分布當自由度超過45,由一個關(guān)系式轉(zhuǎn)換成正態(tài)分布 。 。5. f分布當很大時,在表中不出現(xiàn),可以倒數(shù)關(guān)系轉(zhuǎn)換[典型例題]例1 在總體隨機抽一容量為5的樣本,(1).求樣本均值與總體均值之差的絕對值大于1的概率。(2).求概率 (3). 求概率解 (1).X~N(12,4),(2).= (3).例2已知。解 由,可知由X分子是標準正態(tài),分母是分布組成,即.例3 設(shè)為來自泊松分布的一個樣本,分別為樣本均值和樣本方差,求 ,。解 ====例4 設(shè)在總體中抽取一容量為16的樣本,這里均為未知,(1).求 其中為樣本方差,(2).求。解 (1).==(2).,例5 設(shè)是一樣本值,令=0,=,證明遞推公式=證明 :,故 ,兩邊分別除以k得例 6 設(shè)總體X~是來自總體的一個樣本,為樣本均值,試問樣本大小應取多大,才能使以下各式成立:(1).(2).(3).解 (1). =,(2). X~設(shè)故取n=255(3). ,查標準正態(tài)表0.95對應1.96,n,取n=16例7設(shè)且相互獨立,記為前幾個樣本的均值與方差,求證:T=解 ,,