課程內(nèi)容
《回歸直線及方程》
問題提出
1、兩個(gè)變量之間的相關(guān)關(guān)系的含義如何?成正相關(guān)和負(fù)相關(guān)的兩個(gè)相關(guān)變量的散點(diǎn)圖分別有什么特點(diǎn)?
自變量取值一定時(shí),因變量的取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系。
正相關(guān)的散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域,負(fù)相關(guān)的散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域。
2、觀察人體的脂肪含量百分比和年齡的樣本數(shù)據(jù)的散點(diǎn)圖,這兩個(gè)相關(guān)變量成正相關(guān)。我們需要進(jìn)一步考慮的問題是,當(dāng)人的年齡增加時(shí),體內(nèi)脂肪含量到底是以什么方式增加呢?對此,我們從理論上作些研究。
知識(shí)探究(一):回歸直線
思考1:一組樣本數(shù)據(jù)的平均數(shù)是樣本數(shù)據(jù)的中心,那么散點(diǎn)圖中樣本點(diǎn)的中心如何確定?它一定是散點(diǎn)圖中的點(diǎn)嗎?
思考2:在各種各樣的散點(diǎn)圖中,有些散點(diǎn)圖中的點(diǎn)是雜亂分布的,有些散點(diǎn)圖中的點(diǎn)的分布有一定的規(guī)律性,年齡和人體脂肪含量的樣本數(shù)據(jù)的散點(diǎn)圖中的點(diǎn)的分布有什么特點(diǎn)?
這些點(diǎn)大致分布在一條直線附近。
思考3:如果散點(diǎn)圖中的點(diǎn)的分布,從整體上看大致在一條直線附近,則稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線。對具有線性相關(guān)關(guān)系的兩個(gè)變量,其回歸直線一定通過樣本點(diǎn)的中心嗎?
思考4:在樣本數(shù)據(jù)的散點(diǎn)圖中,能否用直尺準(zhǔn)確畫出回歸直線?
思考5:對一組具有線性相關(guān)關(guān)系的樣本數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn),設(shè)其回歸方程為y=bx+a,可以用哪些數(shù)量關(guān)系來刻畫各樣本點(diǎn)與回歸直線的接近程度?
思考6:為了從整體上反映n個(gè)樣本數(shù)據(jù)與回歸直線的接近程度,你認(rèn)為選用哪個(gè)數(shù)量關(guān)系來刻畫比較合適?
思考7:根據(jù)有關(guān)數(shù)學(xué)原理分析,當(dāng)
時(shí)總體偏差為最小,這樣就得到了回歸方程,這種求回歸方程的方法叫做最小二乘法?;貧w方程y=bx+a中,a,b的幾何意義分別是什么?
思考8:利用計(jì)算器或計(jì)算機(jī)可求得年齡和人體脂肪含量的樣本數(shù)據(jù)的回歸方程為y=0.577x-0.448,由此我們可以根據(jù)一個(gè)人的年齡預(yù)測其體內(nèi)脂肪含量的百分比的回歸值。若某人37歲,則其體內(nèi)脂肪含量的百分比約為多少?