【知識干貨】2020公衛(wèi)執(zhí)業(yè)醫(yī)師衛(wèi)生統(tǒng)計學考點匯總。為幫助大家了解,醫(yī)學教育網(wǎng)編輯搜集相關資料如下:
T檢驗背景及應用介紹
t檢驗是用t分布理論來推論差異發(fā)生的概率,從而比較兩個平均數(shù)的差異是否顯著。它與f檢驗、卡方檢驗并列。t檢驗是戈斯特為了觀測釀酒質(zhì)量而發(fā)明的。戈斯特在位于都柏林的健力士釀酒廠擔任統(tǒng)計學家,基于Claude Guinness聘用從牛津大學和劍橋大學出來的最好的畢業(yè)生以將生物化學及統(tǒng)計學應用到健力士工業(yè)程序的創(chuàng)新政策。戈斯特于1908年在Biometrika上公布t檢驗,但因其老板認為其為商業(yè)機密而被迫使用筆名(學生)。實際上,跟他合作過的統(tǒng)計學家是知道“學生”的真實身份是戈斯特的。
生存分析的概念
將事件的結(jié)果和出現(xiàn)此結(jié)果所經(jīng)歷的時間結(jié)合起來分析的統(tǒng)計分析方法。 研究生存現(xiàn)象和響應時間數(shù)據(jù)及其統(tǒng)計規(guī)律的一門學科。
對一個或多個非負隨機變量(生存時間)進行統(tǒng)計分析研究。 對生存時間進行分析和推斷,研究生存時間和結(jié)局與眾多影響因素間關系及其程度的統(tǒng)計分析方法。 在綜合考慮相關因素(內(nèi)因和外因)的基礎上,對涉及生物學、醫(yī)學(臨床、流行病)、工程(可靠性)、保險精算學、公共衛(wèi)生學、社會學和人口學(老齡問題、犯罪、婚姻)、經(jīng)濟學(市場學)等領域中,與事件(死亡,疾病發(fā)生、發(fā)展和緩解,失效,狀態(tài)持續(xù))發(fā)生的時間(也叫壽命、存活時間或失效時間,統(tǒng)稱生存時間)有關的問題提供相關的統(tǒng)計規(guī)律的分析與推斷方法的學科。
應用標準化法注意事項:
①標準化法的應用范圍很廣。當某個分類變量在兩組中分布不同時,這兩個分類變量就成為兩組頻率比較的混雜因素,標準化的目的是消除混雜因素。
②標準化后的標準化率,已經(jīng)不再反映當時當?shù)氐膶嶋H水平,只表示相互比較的資料間的相對水平。
③標準化法實質(zhì)是找一個標準,使兩組得意在一個共同的平臺上進行比較。選擇不同的標準,算出的標準化率也會不同,比較的結(jié)果也未必相同,因此報告比較結(jié)果時必須說明所選用的標準和理由。
④兩樣本標準化率是樣本值,存在抽樣誤差。比較兩樣本標準化率,當樣本含量較小時,還應作假設檢驗。
頻數(shù)表與頻數(shù)分布圖
(一)基本概念:
頻數(shù) ( frequency ) : 指在一個抽樣資料中,某變量值出現(xiàn)的次數(shù)。
頻數(shù)分布表( frequency distribution table ): 將各數(shù)值變量的值及其相應的頻數(shù)列表,簡稱頻數(shù)表。頻率是表示頻數(shù)出現(xiàn)機率的指標,可用百分數(shù)或小數(shù)表示,頻率為100%或1。
頻數(shù)分布圖( frequency distribution figure ) : 根據(jù)頻數(shù)分布表,以變量值為橫坐標,頻數(shù)為縱坐標,繪制的直方圖。
(二)連續(xù)型變量頻數(shù)表的編制方法:
⒈求全距( Range ,簡記 R ): 是一組資料中最大值(Xmax)與最小值(Xmin)之差,亦稱極差。
2.定組距: 將全距分為若干段,稱為組段。組與組之間的距離,稱為組距;用小寫i 表示。
原則:(1)“組段”數(shù)一般為10-15個;
(2)“組距”一般為R/10取整;
(3)為計算方便根據(jù)組距采取取整數(shù)方法
3.寫組段: 即將全距分為若干段的過程。
原則:(1)第一組段要包括Xmin,最末組段包括 Xmax ;
(2)每組段均用下限值加 “~ ”表示,最終組段同時注明上下限。
4.列表劃記: 根據(jù)預定的組段和組距,用劃記的方法整理原始資料。
(三)頻數(shù)表的用途:
1.揭示頻數(shù)的分布特征:集中趨勢與離散趨勢結(jié)合能全面反映頻數(shù)的分布特征
2.揭示頻數(shù)的分布類型
對稱分布 : 集中部位在中部,兩端漸少,左右兩側(cè)的基本對稱,為對稱(正態(tài))分布。
正偏 : 集中部位偏于較小值一側(cè)(左側(cè)),較大值方向漸減少,為正偏態(tài)分布。
負偏 :集中部位偏于較大值一側(cè)(右側(cè)),較小值方向漸減少,為負偏態(tài)分布。
3.便于發(fā)現(xiàn)某些特大或特小的可疑值。
4.樣本含量足夠大時,以頻率作為概率的估計值。
5.作為陳述資料的形式。
實驗設計的基本要素(Elements of experimental design)
n 處理因素 (treatment factor)、受試對象 (subject)和實驗效應(experimental effect)是實驗設計的3個基本要素.
n 例如,用兩種藥物治療糖尿病病人,觀察比較兩組病人血糖、尿糖的下降情況,這里所用的藥物為處理因素、糖尿病病人為受試對象,血糖值、尿糖值為實驗效應。它們始終貫穿于整個實驗研究過程中,從各方面影響著實驗研究的結(jié)果,在實驗設計中必須予以足夠重視。
一、受試對象(subject)
n 受試對象是處理因素作用的客體,實質(zhì)上就是根據(jù)研究目的確定的觀察目標總體。醫(yī)學研究的受試對象有人和動物,在實驗進行前必須對研究對象的條件作嚴格的規(guī)定,以保證同質(zhì)性。
n 選擇受試對象應遵循的基本原則:對處理因素敏感;反應必須穩(wěn)定。
(一)動物的選擇
實驗研究中,動物的選擇比較靈活,但要緊緊圍繞著實驗目的選擇動物。
如SARS疫苗的動物實驗,普遍采用的動物模型是恒河猴。
(二)病例的選擇
臨床試驗中,由于受試對象是人,病例的選擇不像動物選擇那樣靈活,在選擇時必須遵循醫(yī)德要求,還必須明確病例的納入標準(inclusion criteria)和排除標準(exclusion criteria )。如對于病人必須有明確的診斷標準,對具體病程、病型、病情、年齡、性別等應有統(tǒng)一的文字規(guī)定,以便執(zhí)行和檢查。
二、處理因素
在實驗過程中,影響實驗結(jié)果的因素是多方面的,根據(jù)研究目的可分為處理因素和非處理因素兩類。
(一)處理因素:
根據(jù)研究目的確定的欲施加或欲觀察的、并能引起受試對象直接或間接效應的因素。
這種干預可以是主動施加的,如藥物的種類、劑量、濃度、作用時間等;也可以是客觀存在的,如觀察培養(yǎng)基在空氣中的污染程度與季節(jié)的關系。
(二)非處理因素:
是指除處理因素外的其它對結(jié)果有影響或干擾,但研究者并不想通過實驗考察其作用大小的因素。
(三)選擇處理因素應遵循的基本原則
1.要分清處理因素和非處理因素
n 處理因素是根據(jù)研究目的確定的主要因素,一般為研究者所重視,但不能忽略非處理因素的存在,應找出并加以控制,否則會使實驗結(jié)果產(chǎn)生混雜效應。
n 例如,研究藥物治療加飲食療法治療糖尿病的效果時,處理因素為藥物治療加飲食療法;而合理的作息時間、運動和其它輔助治療措施也能緩解癥狀,有助于康復,但不是本次研究的處理因素,而是非處理因素。研究者應采取各種措施,盡可能使非處理因素在所比較的各組中基本相同,以便充分顯示處理因素的作用。
2.保持處理因素恒定不變
n 如在進行藥物療效的試驗觀察中,所使用藥物的生產(chǎn)廠家、批號、藥品標準等在整個試驗過程中必須一致。
n 又如欲觀察某種手術的效果,其手術的操作程序應規(guī)格化,主刀醫(yī)師的熟練程度也應盡量接近。
三、實驗效應(experimental effect)
n 實驗效應 是處理因素作用于受試對象的反應和結(jié)局,它是通過實驗觀察指標定量或定性地來表達。如果指標選擇不當,未能準確地反應處理因素的作用,那么獲得的研究結(jié)果就缺乏科學性,因此選擇好實驗指標是關系研究成敗的重要環(huán)節(jié)。
(一)選擇觀察指標的基本原則
1.客觀性 觀察指標有主觀指標和客觀指標之分。
n 主觀指標 是指由病人回答或醫(yī)生判斷來描述觀察結(jié)果,易受心理因素影響,如“疼痛”的觀察。
n 客觀指標 是借助儀器或試驗等進行測量和檢驗來反映客觀結(jié)果。盡可能選擇客觀的、定量的指標。
2.準確度和精密度
n 準確度是指所觀察結(jié)果的真實程度,即觀測值與真值的接近程度,屬系統(tǒng)誤差
n 精密度是指所觀察結(jié)果的深度,即重復觀測時,觀測值與平均值的接近程度,屬隨機誤差。
實驗效應指標既要準確又要精密,而首先是準確可靠。
3.靈敏性
應盡量選擇高靈敏性的指標,即選擇高靈敏性的方法對觀察指標進行測量。靈敏度高的方法,往往費用昂貴,應根據(jù)實驗經(jīng)費,選擇既相對廉價,靈敏度又高的測量方法。
4.特異性
為了更好地揭示研究問題的本質(zhì),觀察指標還應具備一定的特異性。例如,在診斷糖尿病時,測定血糖的特異性就比測定尿糖的特異性要高。
實驗效應指標應當同時兼顧其靈敏性和特異性,盡量使靈敏性和特異性都高。
5.指標的觀察
在臨床試驗過程中,由于對某些非處理因素未加嚴格控制,使這些非處理因素對試驗效應產(chǎn)生干擾,這種干擾所造成的系統(tǒng)誤差叫偏倚(bias),偏倚歪曲了處理因素的真實效應。
隊列研究意義:
大多數(shù)慢性病都是歷時多年的一個過程所形成。在此期間發(fā)生的許多事件都可能起致病作用。對一群人在某種病尚未明顯發(fā)生前,對某個(或某些)可能起病因作用或保護作用的事件的后果進行隨訪監(jiān)測,是一種從“困”觀“果”的研究方法。
隊列研究(又譯為定群研究、群組研究)就是這樣研究病因的一種流行病學方法。研究對象是加入研究時未患所研究疾病的一群人,根據(jù)是否暴露于所研究的病因(或保護因子)或暴露程度而劃分為不同組別,然后在一定期間內(nèi)隨訪觀察不同組別的該病(或多種疾病)的發(fā)病率或死亡率。如果暴露組(或大劑量組)的率顯著高于未暴露組(或小劑量組)的率,則可認為這種暴露與疾病存在聯(lián)系,并在符合一些條件時有可能是因果聯(lián)系。
各組除了暴露有無或程度不同之外,其他可能影響患病或死亡的重要因素應具有可比性(均衡性)。但并不要求除暴露狀況外一切方面都可比,這在觀察性研究中實際上是做不到的。有些因素可在數(shù)據(jù)分析中得到控制。
隊列研究所觀察的結(jié)局是可疑病因引起的效應(發(fā)病或死亡),除了所研究的一種病,還可能與其他多種疾病也有聯(lián)系,這樣就可觀察一個因素的多種效應,而這正是隊列法不可取代的用途。
根據(jù)作為觀察終點的事件在研究開始時是否已經(jīng)發(fā)生,可把隊列研究分為前瞻性與回顧性兩類。
另有一種雙向型的隊列研究,適于研究對人體兼有短期與長期效應的因素,可用回顧性隊列法研究前者而用前瞻性隊列法研究后者。
還有一種把病例對照法與前瞻法結(jié)合起來的設計。其特點是用隊列法建起隊列(研究對象)并隨訪發(fā)現(xiàn)其中發(fā)生的病例,然后用病例對照法調(diào)查病例及隊列中適于作對照的一部分人的暴露史。這里,病例與對照都來自一個界定明確、有基線資料記錄的隊列,暴露史的質(zhì)量較高,還可以有病例尚未發(fā)病時的實驗室檢驗記錄,而且可以省去對占絕對多數(shù)的未發(fā)病成員的暴露史調(diào)查。
隊列研究從方法上來說并不比病例對照法復雜,但實際進行起來卻問題較多,因為觀察人數(shù)多、期限長,組織工作復雜,開支龐大。但是,隊列法是一種重要的醫(yī)學觀察方法,已經(jīng)為解決現(xiàn)代醫(yī)學的一些迫切問題(例如癌癥和心血管病)做出重要貢獻,所以作為臨床醫(yī)生也應該對其原理有所了解,而且這對于科學思維能力和批判地閱讀能力的培養(yǎng),也是大有裨益的。
病例|對照匹配
匹配(matching)或稱配比,即要求對照在某些因素或特征上與病例保持一致,目的是對兩組進行比較時排除匹配因素的干擾。如以年齡做匹配因素,使兩組在年齡構成上類似或一樣,在分析比較兩組資料時,可避免由于兩組年齡構成的差別對疾病和因素關系的影響,從而更真實地反映研究因素與疾病的關系。匹配分為頻數(shù)匹配與個體匹配。
(1)頻數(shù)匹配(frequency matching):
明確或估計出匹配變量每一層的病例數(shù),然后從備選對照中選擇對照,直至達到每層所要求的數(shù)目,不一定要求絕對數(shù)相等,重要的是比例相同。例如,病例組中男女各半,則對照組中也應一樣。
(2)個體匹配(individual matching):
即以病例和對照個體為單位進行匹配。1:1匹配,為每一個病例配一名對照,又稱配對(pair matching),1:2、1:3、…、1:R匹配時,直接稱為匹配。
定量指標一般要求在一定范圍內(nèi)匹配。例如年齡匹配,病例為50~59歲組,則對照亦應為50~59歲組。或者要求對照在±2歲、±3歲或±5歲等范圍內(nèi)匹配,如要求對照與病例的年齡之差在±3歲之內(nèi),則一個39歲的病例,其對照的年齡應當在36~42歲之間。
在病例對照研究中采用匹配的目的,首先在于提高研究效率,增加分析指標的精確度(即可信區(qū)間變窄)。其次在于控制混雜因素的作用。匹配的特征或變量必須是已知的混雜因子,或有充分的理由懷疑為混雜因子,否則不應匹配。
匹配的同時也增加了選擇對照的難度。而且一旦對某個因素做了匹配,我們將不能再分析該因素與疾病的關系,也不能充分分析它與其他因素的交互作用。把不必要的項目列入匹配,企圖使病例與對照盡量一致,就可能徒然丟失信息,增加工作難度,結(jié)果反而降低了研究效率。這種情況稱為匹配過頭(over-matching),應當注意避免。一般除性別、年齡之外,對其他因素是否進行匹配,須持慎重態(tài)度,以防止匹配過頭,徒增費用和難度。
應用直線回歸注意:
1、作回歸分析要有實際意義,不能把毫無關聯(lián)的兩種現(xiàn)象,隨意進行回歸分析,忽視事物現(xiàn)象間的內(nèi)在聯(lián)系和規(guī)律;如對兒童身高與小樹的生長數(shù)據(jù)進行回歸分析既無道理也無用途。另外,即使兩個變量間存在回歸關系時,也不一定是因果關系,必須結(jié)合專業(yè)知識作出合理解釋和結(jié)論。
2、直線回歸分析的資料,一般要求應變量Y是來自正態(tài)總體的隨機變量,自變量X可以是正態(tài)隨機變量,也可以是精確測量和嚴密控制的值。若稍偏離要求時,一般對回歸方程中參數(shù)的估計影響不大,但可能影響到標準差的估計,也會影響假設檢驗時P值的真實性。
3、進行回歸分析時,應先繪制散點圖(scatter plot)。若提示有直線趨勢存在時,可作直線回歸分析;若提示無明顯線性趨勢,則應根據(jù)散點分布類型,選擇合適的曲線模型(curvilinear modal),經(jīng)數(shù)據(jù)變換后,化為線性回歸來解決。一般說,不滿足線性條件的情形下去計算回歸方程會毫無意義,最好采用非線性回歸方程的方法進行分析。
4、繪制散點圖后,若出現(xiàn)一些特大特小的離群值(異常點),則應及時復核檢查,對由于測定、記錄或計算機錄入的錯誤數(shù)據(jù),應予以修正和剔除。否則,異常點的存在會對回歸方程中的系數(shù)a、b的估計產(chǎn)生較大影響。
5、回歸直線不要外延。直線回歸的適用范圍一般以自變量取值范圍為限,在此范圍內(nèi)求出的估計值稱為內(nèi)插(interpolation);超過自變量取值范圍所計算的稱為外延(extrapolation)。若無充足理由證明,超出自變量取值范圍后直線回歸關系仍成立時,應該避免隨意外延
定量資料頻數(shù)分布簡介:
將數(shù)據(jù)按照某種標準(標志)劃分成不同的組別,每個組別稱為一個組段。組段之間的距離稱為組距,一般為等距。各組段的觀察值個數(shù)稱為頻數(shù),將分組標志和相應的頻數(shù)列表,即得到頻數(shù)分布表,簡稱頻數(shù)表。
從頻數(shù)表便于觀察離群值和異常值,還可以看出頻數(shù)分布的兩個重要特征:集中趨勢和離散趨勢。集中趨勢是指觀察值向中央部分集中的傾向;離散趨勢是指觀察值的分散情況。
頻數(shù)表還可以揭示頻數(shù)分布的類型,即對稱分布和偏態(tài)分布。對稱分布是指集中位置在中間,左右兩側(cè)的頻數(shù)基本對稱。偏態(tài)分布,又稱不對稱型分布,指頻數(shù)分布不對稱,集中位置偏向一側(cè)。若集中位置偏向數(shù)值較小的一側(cè),稱為正偏態(tài);若集中位置偏向數(shù)值較大的一側(cè),稱為負偏態(tài)。
頻數(shù)表可以較直觀地揭示數(shù)據(jù)分布的集中趨勢和離散趨勢,而統(tǒng)計指標可從數(shù)量上較準確地描述其集中位置和離散程度。定量資料的頻數(shù)分布類型不同,描述其集中位置和離散程度的指標也不同。
“【知識干貨】2020公衛(wèi)執(zhí)業(yè)醫(yī)師衛(wèi)生統(tǒng)計學考點匯總”的內(nèi)容由醫(yī)學教育網(wǎng)編輯搜集整理,供大家參考,更多有關公共衛(wèi)生知識的內(nèi)容,敬請關注醫(yī)學教育網(wǎng)公共衛(wèi)生知識欄目。