應用直線回歸的五點注意事項:
1、作回歸分析要有實際意義,不能把毫無關聯(lián)的兩種現象,隨意進行回歸分析,忽視事物現象間的內在聯(lián)系和規(guī)律;如對兒童身高與小樹的生長數據進行回歸分析既無道理也無用途。另外,即使兩個變量間存在回歸關系時,也不一定是因果關系,必須結合專業(yè)知識作出合理解釋和結論。
2、直線回歸分析的資料,一般要求應變量Y是來自正態(tài)總體的隨機變量,自變量X可以是正態(tài)隨機變量,也可以是精確測量和嚴密控制的值。若稍偏離要求時,一般對回歸方程中參數的估計影響不大,但可能影響到標準差的估計,也會影響假設檢驗時P值的真實性。
3、進行回歸分析時,應先繪制散點圖(scatterplot)。若提示有直線趨勢存在時,可作直線回歸分析;若提示無明顯線性趨勢,則應根據散點分布類型,選擇合適的曲線模型,經數據變換后,化為線性回歸來解決。一般說,不滿足線性條件的情形下去計算回歸方程會毫無意義,最好采用非線性回歸方程的方法進行分析。
4、繪制散點圖后,若出現一些特大特小的離群值(異常點),則應及時復核檢查,對由于測定、記錄或計算機錄入的錯誤數據,應予以修正和剔除。否則,異常點的存在會對回歸方程中的系數a、b的估計產生較大影響。
5、回歸直線不要外延。直線回歸的適用范圍一般以自變量取值范圍為限,在此范圍內求出的估計值稱為內插(interpolation);超過自變量取值范圍所計算的稱為外延(extrapolation)。若無充足理由證明,超出自變量取值范圍后直線回歸關系仍成立時,應該避免隨意外延。