Цэс
Үнэгүй
гэр  /  Шал/ Регрессийн шинжилгээ, хамаарлын төрлүүд. Регрессийн шинжилгээ нь санамсаргүй хэмжигдэхүүний хувьсагчдаас хамаарлыг судлах статистик арга юм.

Регрессийн шинжилгээний хамаарлын төрлүүд. Регрессийн шинжилгээ нь санамсаргүй хэмжигдэхүүний хувьсагчдаас хамаарлыг судлах статистик арга юм.

Регрессийн шинжилгээний аргыг үнэ цэнийн харилцааг бий болгох, уялдуулах зорилгоор тодорхой параметрийн цувралд хамаарах бүтээгдэхүүний техник, эдийн засгийн үзүүлэлтүүдийг тодорхойлоход ашигладаг. Энэ аргыг үндсэн хэрэглээний шинж чанарыг тусгасан нэг буюу хэд хэдэн техник, эдийн засгийн үзүүлэлтүүдээр тодорхойлогддог бүтээгдэхүүний түвшин, үнийн харьцаанд дүн шинжилгээ хийх, зөвтгөхөд ашигладаг. Регрессийн шинжилгээ нь бүтээгдэхүүний техникийн болон эдийн засгийн үзүүлэлтүүдээс үнийн хамаарлыг тодорхойлсон эмпирик томъёог олох боломжийг олгодог.

P=f(X1X2,...,Xn),

Энд P нь бүтээгдэхүүний нэгж үнийн утга, руб.; (X1, X2, ... Xn) - бүтээгдэхүүний техник, эдийн засгийн үзүүлэлтүүд.

Регрессийн шинжилгээний арга - ашигласан норматив-параметрийн аргуудын хамгийн дэвшилтэт арга нь орчин үеийн мэдээллийн технологи, системийг ашиглахад суурилсан тооцоолол хийхэд үр дүнтэй байдаг. Түүний хэрэглээ нь дараах үндсэн алхмуудыг агуулна.

  • бүтээгдэхүүний параметрийн бүлгийн ангиллыг тодорхойлох;
  • бүтээгдэхүүний үнэд хамгийн их нөлөөлдөг параметрүүдийг сонгох;
  • параметрүүд өөрчлөгдөх үед үнийн өөрчлөлтийн хоорондын холболтын хэлбэрийг сонгох, зөвтгөх;
  • хэвийн тэгшитгэлийн системийг байгуулах, регрессийн коэффициентийг тооцоолох.

Үнэ нь тэнцүүлэх боломжтой бүтээгдэхүүний үндсэн мэргэшлийн бүлэг нь параметрийн цуваа бөгөөд тэдгээрийн дотор бүтээгдэхүүнийг хэрэглэх, ашиглалтын нөхцөл, шаардлагаас хамааран өөр өөр загварт бүлэглэж болно. Параметрийн цуваа үүсгэх үед автомат ангиллын аргууд Бүтээгдэхүүний нийт массаас нэгэн төрлийн бүлгийг ялгах боломжийг олгодог ашиглаж болно. Техникийн болон эдийн засгийн үзүүлэлтүүдийг сонгохдоо дараахь үндсэн шаардлагуудыг үндэслэнэ.

  • сонгосон параметрүүд нь стандарт, техникийн үзүүлэлтүүдэд бүртгэгдсэн параметрүүдийг багтаасан болно; техникийн үзүүлэлтүүдээс гадна (хүч, даац, хурд гэх мэт) бүтээгдэхүүний цуваа, нарийн төвөгтэй байдлын коэффициент, нэгдмэл байдлын үзүүлэлтүүдийг ашигладаг;
  • Сонгосон параметрүүдийн багц нь цувралд багтсан бүтээгдэхүүний загвар, технологи, ашиглалтын шинж чанарыг хангалттай бүрэн тодорхойлж, үнийн хувьд нэлээд нягт хамааралтай байх ёстой;
  • параметрүүд нь харилцан хамааралтай байх ёсгүй.

Үнэд ихээхэн нөлөөлдөг техник, эдийн засгийн үзүүлэлтүүдийг сонгохын тулд хос корреляцийн коэффициентийн матрицыг тооцоолно. Параметрүүдийн хоорондын хамаарлын коэффициентийн хэмжээнээс хамааран тэдгээрийн холболтын ойр байдлыг дүгнэж болно. Үүний зэрэгцээ тэгтэй ойролцоо хамаарал нь параметрийн үнэд өчүүхэн нөлөө үзүүлж байгааг харуулж байна. Техникийн болон эдийн засгийн үзүүлэлтүүдийн эцсийн сонголтыг компьютерийн технологи, зохих стандарт програмыг ашиглан алхам алхмаар регрессийн шинжилгээний явцад явуулдаг.

Үнийн практикт дараахь багц функцийг ашигладаг.

шугаман

P = ao + alXl + ... + antXn,

шугаман хүч

P = ao + a1X1 + ... + anXn + (an+1Xn) (an+1Xn) +... + (an+nXn2) (an+nXn2)

урвуу логарифм

P = a0 + a1: X1 + ... + an: Xn-д,

хүч

P = a0 (X1^a1) (X2^a2) .. (Xn^an)

заалт

P = e^(a1+a1X1+...+anXn)

гипербол

P = ao + a1:X1 + a2:X2 + ... + ap:Xn,

энд P бол үнийн тэгшитгэл; X1 X2,..., Xn - цувралын бүтээгдэхүүний техник, эдийн засгийн үзүүлэлтүүдийн утга; a0, a1 ..., а - регрессийн тэгшитгэлийн тооцоолсон коэффициентүүд.

Үнэ, техникийн болон эдийн засгийн үзүүлэлтүүдийн хоорондын хамаарлын хэлбэрээс хамааран үнийн практик ажилд бусад регрессийн тэгшитгэлийг ашиглаж болно. Үнэ болон техникийн болон эдийн засгийн олон параметрүүдийн хоорондын холболтын функцын төрлийг компьютерийн боловсруулалтын явцад урьдчилан тохируулах эсвэл автоматаар сонгох боломжтой. Үнэ болон олон тооны параметрүүдийн хоорондын хамаарлын ойролцоо байдлыг олон корреляцийн коэффициентийн утгаар үнэлдэг. Нэгтэй ойрхон байгаа нь ойр дотно харилцаатай байгааг илтгэнэ. Регрессийн тэгшитгэлийг ашиглан өгөгдсөн параметрийн цувралын бүтээгдэхүүний үнийн тэнцвэржүүлсэн (тооцоолсон) утгыг олж авна. Тэнцвэржүүлэх үр дүнг үнэлэхийн тулд тооцоолсон үнийн утгын бодит хэмжээнээс хазайх харьцангуй утгыг тооцоолно.

Tsr = Rf - Rr: R x 100

Энд Рф, Рр - бодит ба тооцоолсон үнэ.

CR-ийн утга нь 8-10% -иас хэтрэхгүй байх ёстой. Тооцоолсон утгууд нь бодит хэмжээнээс ихээхэн хазайсан тохиолдолд дараахь зүйлийг судлах шаардлагатай.

  • параметрийн хувьд цувралын бусад бүтээгдэхүүнээс эрс ялгаатай бүтээгдэхүүнийг агуулж болох тул параметрийн цуваа үүсэх зөв байдал. Тэдгээрийг хасах ёстой;
  • техникийн болон эдийн засгийн үзүүлэлтүүдийг зөв сонгох. Үнэтэй бага хамааралтай параметрүүдийн багц боломжтой. Энэ тохиолдолд параметрүүдийг үргэлжлүүлэн хайх, сонгох шаардлагатай.

Регрессийн шинжилгээ хийх журам, аргачлал, тэгшитгэлийн үл мэдэгдэх параметрүүдийг олох, олж авсан үр дүнгийн эдийн засгийн үнэлгээг математик статистикийн шаардлагын дагуу гүйцэтгэдэг.

Хэрэв хүчин зүйл ба гүйцэтгэлийн шинж чанаруудын хоорондын хамаарал байгаа бол эмч нар ихэвчлэн нийтлэг хүлээн зөвшөөрөгдсөн хэмжилтийн нэгж эсвэл судлаач өөрөө тогтоосон хэмжүүр болж өөрчлөгдөхөд нэг шинж чанарын үнэ цэнэ ямар хэмжээгээр өөрчлөгдөж болохыг тогтоох шаардлагатай болдог.

Жишээлбэл, 1-р ангийн сурагчдын биеийн жин (охид эсвэл хөвгүүд) 1 см-ээр нэмэгдвэл биеийн жин хэрхэн өөрчлөгдөх вэ? Эдгээр зорилгоор регрессийн шинжилгээний аргыг ашигладаг.

Ихэнхдээ регрессийн шинжилгээний аргыг бие бялдрын хөгжлийн хэм хэмжээ, стандартыг боловсруулахад ашигладаг.

  1. Регрессийн тодорхойлолт. Регресс гэдэг нь нэг шинж чанарын дундаж утгаас эхнийхтэй нь хамааралтай өөр нэг шинж чанарын дундаж утгыг тодорхойлох боломжийг олгодог функц юм.

    Энэ зорилгоор регрессийн коэффициент болон бусад хэд хэдэн параметрүүдийг ашигладаг. Жишээлбэл, намар-өвлийн улиралд агаарын сарын дундаж температурын тодорхой утгуудад ханиадны тоог дунджаар тооцоолж болно.

  2. Регрессийн коэффициентийг тодорхойлох. Регрессийн коэффициент гэдэг нь тодорхой хэмжлийн нэгжээр өөр холбогдох шинж чанар өөрчлөгдөхөд нэг шинж чанарын утга дунджаар өөрчлөгддөг үнэмлэхүй утга юм.
  3. Регрессийн коэффициентийн томъёо. R y/x = r xy x (σ y / σ x)
    энд R у/х - регрессийн коэффициент;
    r xy - x ба y шинж чанаруудын хоорондын хамаарлын коэффициент;
    (σ y ба σ x) - x ба y шинж чанарын стандарт хазайлт.

    Бидний жишээн дээр;
    σ x = 4.6 (намар-өвлийн улиралд агаарын температурын стандарт хазайлт;
    σ y = 8.65 (халдварт ба ханиадны өвчний тооны стандарт хазайлт).
    Тиймээс R y/x нь регрессийн коэффициент юм.
    R у/х = -0.96 x (4.6 / 8.65) = 1.8, i.e. Агаарын сарын дундаж температур (х) 1 градусаар буурахад намар-өвлийн улиралд халдварт, ханиадны өвчлөл (у) дунджаар 1.8 тохиолдлоор өөрчлөгдөнө.

  4. Регрессийн тэгшитгэл. y = M y + R y/x (x - M x)
    энд y нь шинж чанарын дундаж утга бөгөөд өөр шинж чанарын дундаж утга өөрчлөгдөх үед тодорхойлох ёстой (x);
    x нь өөр шинж чанарын мэдэгдэж буй дундаж утга;
    R y / x - регрессийн коэффициент;
    M x, M y - x ба y шинж чанарын мэдэгдэж буй дундаж утгууд.

    Тухайлбал, халдварт болон ханиадны өвчний дундаж тоог (y) агаарын сарын дундаж температурын (х) ямар ч дундаж утгаараа тусгай хэмжилтгүйгээр тодорхойлж болно. Тэгэхээр x = - 9°, R y/x = 1.8 өвчин, M x = -7°, M y = 20 өвчин бол у = 20 + 1.8 х (9-7) = 20 + 3 .6 = 23.6 болно. өвчин.
    Энэ тэгшитгэлийг хоёр шинж чанар (х ба у) хооронд шугаман хамаарал байгаа тохиолдолд хэрэглэнэ.

  5. Регрессийн тэгшитгэлийн зорилго. Регрессийн тэгшитгэлийг регрессийн шугам барихад ашигладаг. Сүүлийнх нь өөр нэг шинж чанарын утга (x) өөрчлөгдсөн тохиолдолд тусгай хэмжилтгүйгээр нэг шинж чанарын дундаж утгыг (y) тодорхойлох боломжтой болгодог. Эдгээр өгөгдөл дээр үндэслэн графикийг байгуулав - регрессийн шугам, энэ нь ханиадны тоог тооцоолсон утгуудын хоорондох сарын дундаж температурын аль ч утгаараа ханиадны дундаж тоог тодорхойлоход ашиглаж болно.
  6. Регрессийн Сигма (томъёо).
    Энд σ Rу/х - регрессийн сигма (стандарт хазайлт);
    σ y - y шинж чанарын стандарт хазайлт;
    r xy - x ба y шинж чанаруудын хоорондын хамаарлын коэффициент.

    Тэгэхээр, хэрэв σ y - ханиадны тооны стандарт хазайлт = 8.65; r xy - ханиадны тоо (y) ба намар-өвлийн улирлын агаарын сарын дундаж температур (x) хоорондын хамаарлын коэффициент - 0.96, дараа нь

  7. Регрессийн сигма даалгавар. Үүссэн шинж чанарын олон янз байдлын хэмжүүрийн тайлбарыг өгнө (y).

    Жишээлбэл, энэ нь намар-өвлийн улиралд сарын дундаж агаарын температурын тодорхой утгаараа ханиадны олон янз байдлыг тодорхойлдог. Тиймээс агаарын температурын дундаж хэмжээ x 1 = -6 ° -ийн ханиадны тоо 15.78 өвчнөөс 20.62 өвчний хооронд хэлбэлзэж болно.
    x 2 = -9 ° үед ханиадны дундаж тоо 21.18 өвчнөөс 26.02 өвчин гэх мэт байж болно.

    Регрессийн сигма нь үр дүнгийн шинж чанарын утгуудын регрессийн шугам дээр зурсан дундаж утгаас хазайлтыг тусгасан регрессийн хуваарийг бүтээхэд ашиглагддаг.

  8. Регрессийн масштабыг тооцоолох, зурахад шаардлагатай өгөгдөл
    • регрессийн коэффициент - R у/х;
    • регрессийн тэгшитгэл - y = M y + R y/x (x-M x);
    • регрессийн сигма - σ Rx/y
  9. Тооцооллын дараалал ба регрессийн масштабын график дүрслэл.
    • томъёог ашиглан регрессийн коэффициентийг тодорхойлно (3-р зүйлийг үз). Жишээлбэл, дундаж өндөр 1 см-ээр өөрчлөгдвөл биеийн жин дунджаар (хүйсээс хамаарч тодорхой насанд) хэр зэрэг өөрчлөгдөхийг тодорхойлох шаардлагатай.
    • регрессийн тэгшитгэлийн томьёог ашиглан (4-р зүйлийг үз), жишээлбэл, биеийн жин дунджаар ямар байхыг (y, y 2, y 3 ...) * тодорхой өндрийн утгыг (x, x 2, x 3) тодорхойлно. ..).
      ________________
      * "y"-ийн утгыг "x"-ийн хамгийн багадаа гурван мэдэгдэж буй утгыг тооцоолох хэрэгтэй.

      Үүний зэрэгцээ тодорхой нас, хүйсийн биеийн жин ба өндрийн дундаж утгыг (M x ба M y) мэддэг.

    • σ y ба r xy-ийн харгалзах утгуудыг мэдэж, тэдгээрийн утгыг томъёонд орлуулж регрессийн сигма тооцоолно (6-р зүйлийг үз).
    • мэдэгдэж байгаа x 1, x 2, x 3 утгууд ба харгалзах дундаж утгууд y 1, y 2 y 3, түүнчлэн хамгийн бага (y - σ rу/х) ба хамгийн том (y + σ rу) дээр үндэслэнэ. /х) утгууд (y) регрессийн хуваарийг байгуулна.

      Регрессийн хуваарийг графикаар илэрхийлэхийн тулд эхлээд график дээр x, x2, x3 (ординат тэнхлэг) утгуудыг тэмдэглэнэ. регрессийн шугамыг байгуулна, жишээлбэл, биеийн жингийн (y) өндрөөс (x) хамаарал.

      Дараа нь харгалзах 1, y 2, y 3 цэгүүдэд регрессийн сигмагийн тоон утгыг тэмдэглэнэ, жишээлбэл. график дээр 1, y 2, y 3 гэсэн хамгийн бага ба хамгийн том утгыг ол.

  10. Регрессийн масштабын практик хэрэглээ. Ялангуяа бие бялдрын хөгжилд зориулсан нормативын хэмжүүр, стандартыг боловсруулж байна. Стандарт хэмжүүрийг ашиглан та хүүхдийн хөгжлийг бие даан үнэлж болно. Энэ тохиолдолд, жишээлбэл, тодорхой өндөрт хүүхдийн биеийн жин нь биеийн жингийн дундаж тооцоолсон нэгжийн регрессийн нэг сигма дотор байвал бие бялдрын хөгжлийг зохицолтой гэж үнэлдэг - (y) өгөгдсөн өндрийн хувьд (x) ( y ± 1 σ Ry/x).

    Хэрэв хүүхдийн биеийн жин тодорхой өндөрт регрессийн хоёр дахь сигма дотор байвал бие бялдрын хөгжил нь биеийн жингийн хувьд тэнцвэргүй гэж тооцогддог: (y ± 2 σ Ry/x)

    Хэрэв тодорхой өндрийн жин нь регрессийн гурав дахь сигма (y ± 3 σ Ry / x) дотор байвал биеийн жин илүүдэл ба хангалтгүйгээс болж бие бялдрын хөгжил огцом тэнцвэргүй болно.

5 настай хөвгүүдийн бие бялдрын хөгжлийн статистик судалгааны үр дүнгээс үзэхэд тэдний дундаж өндөр (х) 109 см, биеийн жин (y) нь 19 кг байна. Өндөр ба биеийн жингийн хоорондын хамаарлын коэффициент нь +0.9, стандарт хазайлтыг хүснэгтэд үзүүлэв.

Шаардлагатай:

  • регрессийн коэффициентийг тооцоолох;
  • регрессийн тэгшитгэлийг ашиглан x1 = 100 см, x2 = 110 см, x3 = 120 см өндөртэй 5 настай хөвгүүдийн хүлээгдэж буй биеийн жин ямар байхыг тодорхойлох;
  • регрессийн сигма-г тооцоолох, регрессийн хуваарь байгуулах, түүний шийдлийн үр дүнг графикаар харуулах;
  • зохих дүгнэлт гаргах.

Асуудлын нөхцөл, түүнийг шийдвэрлэх үр дүнг нэгтгэн хүснэгтэд үзүүлэв.

Хүснэгт 1

Асуудлын нөхцөл Асуудлыг шийдвэрлэх үр дүн
регрессийн тэгшитгэл регрессийн сигма регрессийн хэмжүүр (хүлээгдэж буй биеийн жин (кг))
М σ r xy R y/x X У σ R x/y y - σ Rу/х y + σ Rу/х
1 2 3 4 5 6 7 8 9 10
Өндөр (x) 109 см ± 4.4 см +0,9 0,16 100 см 17.56 кг ± 0.35 кг 17.21 кг 17.91 кг
Биеийн жин (y) 19 кг ± 0.8 кг 110 см 19.16 кг 18.81 кг 19.51 кг
120 см 20.76 кг 20.41 кг 21.11 кг

Шийдэл.

Дүгнэлт.Тиймээс биеийн жингийн тооцоолсон утгын хүрээнд регрессийн хэмжүүр нь өндрийн бусад утгыг тодорхойлох эсвэл хүүхдийн бие даасан хөгжлийг үнэлэх боломжийг олгодог. Үүнийг хийхийн тулд регрессийн шугамын перпендикулярыг сэргээнэ.

  1. Власов В.В. Эпидемиологи. - М.: GEOTAR-MED, 2004. - 464 х.
  2. Лисицын Ю.П. Нийгмийн эрүүл мэнд, эрүүл мэнд. Их дээд сургуулиудад зориулсан сурах бичиг. - М.: GEOTAR-MED, 2007. - 512 х.
  3. Эмч В.А., Юрьев В.К. Нийгмийн эрүүл мэнд, эрүүл мэндийн тусламж үйлчилгээний лекцийн курс: 1-р хэсэг. Нийгмийн эрүүл мэнд. - М.: Анагаах ухаан, 2003. - 368 х.
  4. Миняев В.А., Вишняков Н.И. болон бусад Нийгмийн анагаах ухаан, эрүүл мэндийн байгууллага (2 боть гарын авлага). - Санкт-Петербург, 1998. -528 х.
  5. Кучеренко В.З., Агарков Н.М. болон бусад Нийгмийн эрүүл ахуй, эрүүл мэндийн байгууллага (Сургалт) - Москва, 2000. - 432 х.
  6. С.Гланц. Анагаах ухаан, биологийн статистик. Англи хэлнээс орчуулга - М., Практика, 1998. - 459 х.

Статистик загварчлалд регрессийн шинжилгээ нь хувьсагчдын хоорондын хамаарлыг үнэлэхэд ашигладаг судалгаа юм. Энэхүү математикийн арга нь хамааралтай хувьсагч ба нэг буюу хэд хэдэн бие даасан хувьсагчийн хоорондын хамааралд анхаарлаа төвлөрүүлдэг олон хувьсагчдыг загварчлах, шинжлэх бусад олон аргуудыг агуулдаг. Бүр тодруулбал, регрессийн шинжилгээ нь бие даасан хувьсагчийн аль нэг нь өөрчлөгдөхөд бусад бие даасан хувьсагчид тогтмол хэвээр байвал хамааралтай хувьсагчийн ердийн утга хэрхэн өөрчлөгдөхийг ойлгоход тусалдаг.

Бүх тохиолдолд зорилтот үнэлгээ нь бие даасан хувьсагчдын функц бөгөөд үүнийг регрессийн функц гэж нэрлэдэг. Регрессийн шинжилгээнд хамааралтай хувьсагчийн өөрчлөлтийг регрессийн функцээр тодорхойлох нь бас сонирхолтой бөгөөд магадлалын тархалтыг ашиглан тайлбарлаж болно.

Регрессийн шинжилгээний асуудлууд

Энэхүү статистик судалгааны аргыг урьдчилан таамаглахад өргөн ашигладаг бөгөөд энэ нь түүний хэрэглээ ихээхэн давуу талтай боловч заримдаа энэ нь хуурмаг, хуурамч харилцаанд хүргэж болзошгүй тул жишээлбэл, корреляци гэсэн үг биш тул дээрх асуудалд болгоомжтой ашиглахыг зөвлөж байна. учир шалтгааны.

Регрессийн шинжилгээнд параметрийн шугаман болон энгийн хамгийн бага квадратын регресс зэрэг олон тооны аргуудыг боловсруулсан. Тэдний мөн чанар нь регрессийн функцийг өгөгдлөөс тооцоолсон хязгаарлагдмал тооны үл мэдэгдэх параметрүүдээр тодорхойлсон явдал юм. Параметрийн бус регресс нь түүний функц нь хязгааргүй хэмжээст байж болох тодорхой багц функцүүдийн дотор орших боломжийг олгодог.

Статистикийн судалгааны аргын хувьд регрессийн шинжилгээ нь практикт өгөгдөл үүсгэх үйл явцын хэлбэр, регрессийн аргатай хэрхэн холбогдож байгаагаас хамаардаг. Мэдээллийн процесс үүсгэх жинхэнэ хэлбэр нь ихэвчлэн үл мэдэгдэх тоо байдаг тул өгөгдлийн регрессийн шинжилгээ нь процессын талаарх таамаглалаас тодорхой хэмжээгээр хамаардаг. Хэрэв хангалттай өгөгдөл байгаа бол эдгээр таамаглалыг заримдаа туршиж үзэх боломжтой. Регрессийн загварууд нь хамгийн их үр ашигтай ажиллахгүй байж болох ч таамаглал бага зэрэг зөрчигдсөн үед ч ашигтай байдаг.

Нарийвчилсан утгаараа регресс нь ангилалд хэрэглэгддэг салангид хариултын хувьсагчдаас ялгаатай нь үргэлжилсэн хариу урвалын хувьсагчдыг тусгайлан тооцож болно. Үргэлжилсэн гаралтын хувьсагчийн тохиолдлыг холбогдох асуудлаас ялгахын тулд хэмжигдэхүүн регресс гэж нэрлэдэг.

Өгүүллэг

Регрессийн хамгийн эртний хэлбэр бол хамгийн бага квадратын арга юм. Үүнийг 1805 онд Лежендре, 1809 онд Гаусс хэвлүүлсэн. Лежендре, Гаусс нар одон орны ажиглалтаар нарны эргэн тойрон дахь биетүүдийн тойрог замыг тодорхойлох асуудалд (голдуу сүүлт од, гэхдээ хожим шинээр нээгдсэн жижиг гаригууд) энэ аргыг ашигласан. Гаусс 1821 онд хамгийн бага квадратын онолыг хөгжүүлж, Гаусс-Марков теоремын хувилбарыг нийтлэв.

"Регресс" гэсэн нэр томьёог 19-р зуунд Фрэнсис Гальтон биологийн үзэгдлийг тодорхойлох зорилгоор гаргаж ирсэн. Өвөг дээдсийнхээ удам угсааны өндөр нь ердийн дундаж руу уруудах хандлагатай байдаг гэсэн санаа байв. Гальтоны хувьд регресс нь зөвхөн энэ биологийн утгыг агуулж байсан боловч хожим түүний ажлыг Удни Йоли, Карл Пирсон нар үргэлжлүүлж, илүү ерөнхий статистикийн контекст болгон авчирсан. Юле, Пирсон нарын бүтээлд хариу үйлдэл ба тайлбарлагч хувьсагчдын хамтарсан хуваарилалтыг Гауссынх гэж үздэг. Энэ таамаглалыг Фишер 1922, 1925 оны баримт бичигт няцаасан. Фишер хариултын хувьсагчийн нөхцөлт тархалт нь Гауссынх боловч хамтарсан тархалт байх шаардлагагүй гэж үзсэн. Үүнтэй холбогдуулан Фишерийн санал нь Гауссын 1821 оны томъёололд илүү ойртсон. 1970 оноос өмнө регрессийн шинжилгээний үр дүнг гаргахад заримдаа 24 цаг зарцуулдаг байсан.

Регрессийн шинжилгээний аргууд нь идэвхтэй судалгааны талбар хэвээр байна. Сүүлийн хэдэн арван жилд хүчирхэг регрессийн шинэ аргуудыг боловсруулсан; харилцан уялдаатай хариу үйлдэл бүхий регресс; өөр өөр төрлийн дутуу өгөгдлийг багтаасан регрессийн аргууд; параметрийн бус регресс; Байесийн регрессийн аргууд; таамаглагч хувьсагчдыг алдаагаар хэмждэг регрессүүд; ажиглалтаас илүү таамаглагчтай регресс, регресстэй учир шалтгаан-үр дагаврын дүгнэлт.

Регрессийн загварууд

Регрессийн шинжилгээний загварууд нь дараах хувьсагчдыг агуулна.

  • Үл мэдэгдэх параметрүүд нь скаляр эсвэл вектор байж болох бета-г тодорхойлсон.
  • Бие даасан хувьсагчид, X.
  • Хамааралтай хувьсагчид, Y.

Регрессийн шинжилгээг ашигладаг шинжлэх ухааны янз бүрийн салбарууд хамааралтай болон бие даасан хувьсагчдын оронд өөр өөр нэр томъёог ашигладаг боловч бүх тохиолдолд регрессийн загвар нь Y-г X ба β-ийн функцтэй холбодог.

Ойролцоогоор ихэвчлэн E(Y | X) = F(X, β) гэж бичдэг. Регрессийн шинжилгээ хийхийн тулд f функцийн төрлийг тодорхойлох шаардлагатай. Илүү бага тохиолдолд энэ нь өгөгдөлд тулгуурладаггүй Y ба X хоорондын харилцааны талаархи мэдлэг дээр суурилдаг. Хэрэв ийм мэдлэг байхгүй бол уян хатан эсвэл тохиромжтой F хэлбэрийг сонгоно.

Хамаарах хувьсагч Y

Үл мэдэгдэх β параметрийн векторыг k урттай гэж үзье. Регрессийн шинжилгээ хийхийн тулд хэрэглэгч Y хамааралтай хувьсагчийн талаарх мэдээллийг өгөх ёстой.

  • Хэрэв (Y, X) хэлбэрийн N өгөгдлийн цэг ажиглагдвал N< k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.
  • Хэрэв яг N = K ажиглагдаж, F функц нь шугаман бол Y = F(X, β) тэгшитгэлийг ойролцоогоор биш яг шийдэж болно. Энэ нь X нь шугаман хамааралгүй байх үед өвөрмөц шийдэлтэй N үл мэдэгдэх (β элемент) бүхий N тэгшитгэлийн багцыг шийдэж байгаатай тэнцэнэ. Хэрэв F шугаман бус байвал шийдэл байхгүй эсвэл олон шийдэл байж болно.
  • Хамгийн түгээмэл нөхцөл бол N > өгөгдлийн цэгүүд ажиглагддаг. Энэ тохиолдолд өгөгдөлд хамгийн сайн тохирох β-ийн өвөрмөц утгыг тооцоолох хангалттай мэдээлэл байгаа бөгөөд өгөгдлийн хэрэглээг β-д хэт тодорхойлогдсон систем гэж үзэх боломжтой регрессийн загвар.

Сүүлчийн тохиолдолд регрессийн шинжилгээ нь дараахь хэрэгслүүдээр хангадаг.

  • Үл мэдэгдэх β параметрүүдийн шийдлийг олох нь жишээлбэл, хэмжсэн болон таамагласан Y утгын хоорондох зайг багасгах болно.
  • Тодорхой статистикийн таамаглалын дагуу регрессийн шинжилгээ нь үл мэдэгдэх параметрүүд β болон хамааралтай хувьсагчийн таамагласан утгуудын талаарх статистик мэдээллийг өгөхийн тулд илүүдэл мэдээллийг ашигладаг.

Шаардлагатай бие даасан хэмжилтийн тоо

β 0, β 1 ба β 2 гэсэн гурван үл мэдэгдэх параметртэй регрессийн загварыг авч үзье. Туршилт хийгч X бие даасан хувьсагчийн векторын ижил утга дээр 10 хэмжилт хийв гэж бодъё. Энэ тохиолдолд регрессийн шинжилгээ нь өвөрмөц багц утгыг үүсгэдэггүй. Таны хийж чадах хамгийн сайн зүйл бол хамааралтай хувьсагчийн Y-ийн дундаж ба стандарт хазайлтыг тооцоолох явдал юм. Үүний нэгэн адил X-ийн хоёр өөр утгыг хэмжсэнээр та хоёр үл мэдэгдэх регрессийн хангалттай өгөгдлийг олж авах боломжтой, гэхдээ гурав ба түүнээс дээш үл мэдэгдэх тоогоор биш.

Хэрэв туршилт хийгчийн хэмжилтийг бие даасан Х векторын гурван өөр утгын дагуу хийсэн бол регрессийн шинжилгээ нь β дахь үл мэдэгдэх гурван параметрийн өвөрмөц багц тооцоог гаргаж өгөх болно.

Ерөнхий шугаман регрессийн хувьд дээрх мэдэгдэл нь X T X матриц урвуу байх ёстой гэсэн шаардлагатай тэнцүү байна.

Статистикийн таамаглал

Хэмжилтийн тоо N нь үл мэдэгдэх параметрүүдийн тоо k ба хэмжилтийн алдаа ε i-ээс их байвал хэмжилтэнд агуулагдах илүүдэл мэдээллийг дүрмээр тарааж, үл мэдэгдэх параметрүүдийн статистикийн таамаглалд ашигладаг. Энэхүү илүүдэл мэдээллийг эрх чөлөөний регрессийн зэрэг гэж нэрлэдэг.

Үндсэн таамаглал

Регрессийн шинжилгээний сонгодог таамаглалд дараахь зүйлс орно.

  • Түүвэрлэлт нь дүгнэлтийн таамаглалыг илэрхийлдэг.
  • Алдааны нэр томьёо нь тайлбарлагч хувьсагчдаас шалтгаалдаг дундаж утга нь тэгтэй санамсаргүй хэмжигдэхүүн юм.
  • Бие даасан хувьсагчдыг алдаагүй хэмждэг.
  • Бие даасан хувьсагчийн хувьд (урьдчилан таамаглагчид) тэдгээр нь шугаман хамааралгүй, өөрөөр хэлбэл аливаа таамаглагчийг бусдын шугаман хослол хэлбэрээр илэрхийлэх боломжгүй юм.
  • Алдаа нь харилцан хамааралгүй, өөрөөр хэлбэл диагональуудын алдааны ковариацын матриц ба тэг биш элемент бүр нь алдааны дисперс юм.
  • Алдааны хэлбэлзэл нь ажиглалтын дагуу тогтмол байна (гомоскедастик). Хэрэв тийм биш бол жинлэсэн хамгийн бага квадрат эсвэл бусад аргыг ашиглаж болно.

Хамгийн бага квадратын тооцооллын эдгээр хангалттай нөхцлүүд нь шаардлагатай шинж чанартай байдаг, ялангуяа эдгээр таамаглалууд нь параметрийн тооцоолол нь бодитой, тууштай, үр дүнтэй байх болно, ялангуяа шугаман тооцоологчдын ангилалд тооцсон тохиолдолд. Нотлох баримт нь нөхцөлийг хангах нь ховор гэдгийг анхаарах нь чухал юм. Өөрөөр хэлбэл, таамаглал нь буруу байсан ч гэсэн аргыг ашигладаг. Таамаглалаас гарсан өөрчлөлтийг заримдаа загвар хэр ашигтай болохыг хэмжих хэмжүүр болгон ашиглаж болно. Эдгээр таамаглалын ихэнхийг илүү дэвшилтэт аргуудаар зөөлрүүлж болно. Статистикийн шинжилгээний тайланд ихэвчлэн түүврийн өгөгдлийн туршилтын дүн шинжилгээ, загварын ашиг тусын аргачлал орно.

Нэмж дурдахад хувьсагч нь зарим тохиолдолд цэгийн байршилд хэмжсэн утгыг илэрхийлдэг. Статистикийн таамаглалыг зөрчсөн хувьсагчид орон зайн чиг хандлага, орон зайн автокорреляци байж болно. Газарзүйн жигнэсэн регресс нь ийм өгөгдөлтэй харьцах цорын ганц арга юм.

Шугаман регрессийн нэг онцлог нь хамааралтай хувьсагч нь Yi нь параметрүүдийн шугаман хослол юм. Жишээлбэл, энгийн шугаман регресс нь нэг бие даасан хувьсагч болох x i болон β 0 ба β 1 гэсэн хоёр параметрийг n-цэгийг загварчлахад ашигладаг.

Олон шугаман регрессийн хувьд олон бие даасан хувьсагч эсвэл тэдгээрийн функцууд байдаг.

Популяциас санамсаргүй түүвэр авах үед түүний параметрүүд нь түүврийн шугаман регрессийн загварыг олж авах боломжийг олгодог.

Энэ тал дээр хамгийн алдартай нь хамгийн бага квадратын арга юм. Энэ нь үлдэгдэл квадратын нийлбэрийг багасгах параметрийн тооцоог авахад ашиглагддаг. Энэ төрлийн функцийг багасгах (шугаман регрессийн ердийн зүйл) нь параметрийн тооцооллыг олж авахын тулд шийдэгдсэн параметр бүхий олон тооны хэвийн тэгшитгэл ба шугаман тэгшитгэлийн багцад хүргэдэг.

Популяцийн алдаа нь ерөнхийдөө тархдаг гэсэн цаашдын таамаглалын дагуу судлаач эдгээр стандарт алдааны тооцоог ашиглан итгэлийн интервал үүсгэж, түүний параметрүүдийн талаар таамаглалын тест хийх боломжтой.

Шугаман бус регрессийн шинжилгээ

Функц нь параметрүүдийн хувьд шугаман биш байх жишээ нь квадратуудын нийлбэрийг давтагдах процедурыг ашиглан багасгах ёстойг харуулж байна. Энэ нь шугаман болон шугаман бус хамгийн бага квадратуудын аргуудын ялгааг тодорхойлдог олон хүндрэлийг танилцуулж байна. Тиймээс шугаман бус аргыг ашиглах үед регрессийн шинжилгээний үр дүн заримдаа урьдчилан таамаглах боломжгүй байдаг.

Эрчим хүчний тооцоо ба дээжийн хэмжээ

Загвар дахь бие даасан хувьсагчийн тоотой харьцуулсан ажиглалтын тоотой холбоотой тогтмол аргууд ерөнхийдөө байдаггүй. Эхний дүрмийг Добра, Хардин нар санал болгосон бөгөөд N = t^n шиг харагдаж байна, энд N нь түүврийн хэмжээ, n нь бие даасан хувьсагчдын тоо, t нь загвар нь хүссэн нарийвчлалд хүрэхэд шаардлагатай ажиглалтын тоо юм. зөвхөн нэг бие даасан хувьсагч. Жишээлбэл, судлаач 1000 өвчтөн (N) агуулсан өгөгдлийн багцыг ашиглан шугаман регрессийн загварыг бий болгодог. Хэрэв судлаач шугамыг (m) үнэн зөв тодорхойлохын тулд таван ажиглалт хийх шаардлагатай гэж үзвэл загвар нь дэмжих боломжтой бие даасан хувьсагчийн дээд тоо 4 байна.

Бусад аргууд

Хэдийгээр регрессийн загварын параметрүүдийг ихэвчлэн хамгийн бага квадратын аргаар тооцдог ч хамаагүй бага ашиглагддаг өөр аргууд байдаг. Жишээлбэл, эдгээр нь дараахь аргууд юм.

  • Байесийн аргууд (жишээлбэл, Байесийн шугаман регресс).
  • Хувийн регресс нь хувийн алдааг багасгах нь илүү тохиромжтой гэж үзсэн тохиолдолд хэрэглэгддэг.
  • Хамгийн бага үнэмлэхүй хазайлтууд нь тоон регрессэд хүргэдэг хэт давчуу үзүүлэлтүүд байгаа тохиолдолд илүү бат бөх байдаг.
  • Олон тооны ажиглалт, тооцоолол шаарддаг параметрийн бус регресс.
  • Өгөгдсөн оролтын зайнаас утга учиртай зайны хэмжүүрийг олж сурсан зайны сургалтын хэмжүүр.

Програм хангамж

Бүх томоохон статистикийн програм хангамжийн багцууд хамгийн бага квадратын регрессийн шинжилгээ хийдэг. Энгийн шугаман регресс болон олон тооны регрессийн шинжилгээг зарим хүснэгтийн програмууд болон зарим тооны машинуудад ашиглаж болно. Хэдийгээр олон статистикийн програм хангамжийн багцууд нь параметрийн бус, бат бөх регрессийн төрөл бүрийн төрлийг гүйцэтгэж чаддаг ч эдгээр аргууд нь стандартчилагдаагүй; өөр өөр програм хангамжийн багцууд өөр өөр аргыг хэрэгжүүлдэг. Регрессийн тусгай программ хангамжийг шалгалтын дүн шинжилгээ, мэдрэлийн дүрслэл зэрэг салбарт ашиглахаар боловсруулсан.

Регресс гэж юу вэ?

Хоёр тасралтгүй хувьсагчийг авч үзье x=(x 1 , x 2 , .., x n), y=(y 1 , y 2 , ..., y n).

Хоёр хэмжээст тархалтын график дээр цэгүүдийг байрлуулж, бидэнд байгаа гэж хэлье шугаман хамаарал, хэрэв өгөгдлийг шулуун шугамаар ойролцоолсон бол.

Хэрэв бид үүнд итгэдэг бол y-аас хамаарна x, өөрчлөлтүүд y-ийн өөрчлөлтөөс болж үүсдэг x, бид регрессийн шугамыг тодорхойлж болно (регресс yдээр x), эдгээр хоёр хувьсагчийн хоорондох шугаман хамаарлыг хамгийн сайн тодорхойлдог.

Регресс гэдэг үгийн статистик хэрэглээ нь Сэр Фрэнсис Гальтон (1889)-ийн нэрлэсэн дундаж утга руу регресс гэж нэрлэгддэг үзэгдлээс гаралтай.

Хэдийгээр өндөр аавууд өндөр хүүтэй байдаг ч хөвгүүдийн дундаж өндөр нь өндөр аавынхаас намхан байдгийг тэрээр харуулсан. Хөвгүүдийн дундаж өндөр нь хүн амын дундах бүх эцгийн дундаж өндөр рүү "буцаж", "учирсан". Тиймээс дунджаар өндөр аавууд намхан (гэхдээ нэлээд өндөр) хүүтэй, намхан аавууд өндөр (гэхдээ нэлээд намхан) хүүтэй байдаг.

Регрессийн шугам

Энгийн (хосоор) шугаман регрессийн шугамыг тооцоолох математикийн тэгшитгэл:

xбие даасан хувьсагч эсвэл урьдчилан таамаглагч гэж нэрлэдэг.

Ю- хамааралтай хувьсагч эсвэл хариултын хувьсагч. Энэ бол бидний хүлээж буй үнэ цэнэ юм y(дунджаар) хэрэв бид үнэ цэнийг мэддэг бол x, өөрөөр хэлбэл нь "урьдчилан таамагласан үнэ цэнэ" y»

  • а- үнэлгээний шугамын чөлөөт гишүүн (уулзвар); энэ бол утга учир юм Ю, Хэзээ x=0(Зураг 1).
  • б- тооцоолсон шугамын налуу буюу налуу; энэ нь хэмжээг илэрхийлнэ Юнэмэгдүүлбэл дунджаар нэмэгддэг xнэг нэгжийн хувьд.
  • аТэгээд бТооцоолсон шугамын регрессийн коэффициент гэж нэрлэдэг боловч энэ нэр томъёог зөвхөн ашигладаг б.

Хос шугаман регрессийг нэгээс олон бие даасан хувьсагчийг багтаахын тулд өргөтгөж болно; энэ тохиолдолд гэж нэрлэдэг олон регресс.

Зураг 1. a огтлолцол ба налуу b-ийг харуулсан шугаман регрессийн шугам (х нэг нэгжээр нэмэгдэхэд Y хэмжээ нэмэгдэнэ)

Хамгийн бага квадрат арга

Бид ажиглалтын түүврийг ашиглан регрессийн шинжилгээ хийдэг аТэгээд б- популяци дахь шугаман регрессийн шугамыг тодорхойлдог α ба β гэсэн үнэн (ерөнхий) параметрүүдийн түүврийн тооцоо.

Коэффицентийг тодорхойлох хамгийн энгийн арга аТэгээд ббайна хамгийн бага квадрат арга(MNC).

Үлдэгдлийг (шугамаас цэг бүрийн босоо зай, жишээлбэл, үлдэгдэл = ажиглагдсан) харах замаар тохирлыг үнэлдэг. y- урьдчилан таамагласан y, будаа. 2).

Үлдэгдэл квадратуудын нийлбэр хамгийн бага байхаар хамгийн сайн тохирох шугамыг сонгосон.

Цагаан будаа. 2. Цэг бүрийн хувьд үлдэгдэл дүрслэгдсэн (босоо тасархай шугам) шугаман регрессийн шугам.

Шугаман регрессийн таамаглал

Тэгэхээр ажиглагдсан утга бүрийн хувьд үлдэгдэл нь зөрүү ба харгалзах таамагласан утгатай тэнцүү байна.Үлдэгдэл бүр эерэг эсвэл сөрөг байж болно.

Шугаман регрессийн цаана байгаа дараах таамаглалуудыг шалгахын тулд та үлдэгдлийг ашиглаж болно.

  • Үлдэгдэл нь ихэвчлэн тэг дунджаар тархсан;

Хэрэв шугаман байдал, хэвийн байдал ба/эсвэл тогтмол дисперсийн таамаглал эргэлзээтэй байвал бид эдгээр таамаглалыг хангасан шинэ регрессийн шугамыг хувиргаж эсвэл тооцоолж болно (жишээлбэл, логарифмын хувиргалт ашиглах гэх мэт).

Аномаль утгууд (хачирхалтай) ба нөлөөллийн цэгүүд

"Нөлөөтэй" ажиглалт нь орхигдуулсан тохиолдолд нэг буюу хэд хэдэн загварын параметрийн тооцоог өөрчилдөг (өөрөөр хэлбэл налуу эсвэл огтлолцол).

Хэт хэтийн үзүүлэлт (өгөгдлийн багц дахь ихэнх утгуудтай нийцэхгүй байгаа ажиглалт) нь "нөлөөтэй" ажиглалт байж болох бөгөөд хоёр хувьсах тархалтын график эсвэл үлдэгдэл графикийг шалгах замаар хялбархан илрүүлж болно.

Гадны болон "нөлөөлөх" ажиглалтын (цэг) аль алинд нь загваруудыг оруулаагүй, оруулалгүйгээр ашигладаг бөгөөд тооцооллын өөрчлөлтөд (регрессийн коэффициент) анхаарлаа хандуулдаг.

Шинжилгээ хийхдээ та үл тоомсорлох нь олж авсан үр дүнд нөлөөлж болзошгүй тул хэт давсан үзүүлэлт эсвэл нөлөөллийн цэгүүдийг автоматаар хаяж болохгүй. Эдгээр гажуудлын шалтгааныг үргэлж судалж, дүн шинжилгээ хий.

Шугаман регрессийн таамаглал

Шугаман регрессийг байгуулахдаа регрессийн шугамын ерөнхий налуу β тэгтэй тэнцүү гэсэн тэг таамаглалыг шалгана.

Хэрэв шугамын налуу нь тэг байвал ба хоёрын хооронд шугаман хамаарал байхгүй: өөрчлөлт нь нөлөөлөхгүй

Жинхэнэ налуу нь тэг гэсэн тэг таамаглалыг шалгахын тулд та дараах алгоритмыг ашиглаж болно.

Коэффициентийн стандарт алдаа нь эрх чөлөөний зэрэгтэй тархалтад хамаарах харьцаатай тэнцүү туршилтын статистикийг тооцоол.


,

- үлдэгдлийн тархалтыг тооцоолох.

Ихэвчлэн ач холбогдлын түвшинд хүрсэн тохиолдолд тэг таамаглалыг үгүйсгэдэг.


хоёр талт туршилтын магадлалыг өгдөг эрх чөлөөний зэрэгтэй хуваарилалтын хувь хаана байна

Энэ нь 95% магадлалтай ерөнхий налууг агуулсан интервал юм.

Том түүврийн хувьд бид ойролцоогоор 1.96 утгатай байж болно (өөрөөр хэлбэл туршилтын статистик хэвийн тархалттай байх болно)

Шугаман регрессийн чанарыг үнэлэх: тодорхойлох коэффициент R 2

Шугаман хамаарлаас болоод бид энэ нь өөрчлөгдөнө гэж найдаж байна , мөн үүнийг регрессээс үүдэлтэй эсвэл тайлбарласан өөрчлөлт гэж нэрлэнэ. Үлдэгдэл өөрчлөлт нь аль болох бага байх ёстой.

Хэрэв энэ нь үнэн бол ихэнх өөрчлөлтийг регрессээр тайлбарлах бөгөөд цэгүүд нь регрессийн шугамд ойрхон байх болно, өөрөөр хэлбэл. мөр нь өгөгдөлд сайн тохирч байна.

Регрессээр тайлбарлагдах нийт дисперсийн эзлэх хувийг нэрлэнэ тодорхойлох коэффициент, ихэвчлэн хувиар илэрхийлж, тэмдэглэнэ R 2(хосолсон шугаман регрессийн хувьд энэ нь хэмжигдэхүүн юм r 2, корреляцийн коэффициентийн квадрат) нь регрессийн тэгшитгэлийн чанарыг субъектив байдлаар үнэлэх боломжийг олгодог.

Энэ ялгаа нь регрессээр тайлбарлах боломжгүй дисперсийн хувийг илэрхийлнэ.

Үнэлгээ хийх албан ёсны тест байхгүй; бид регрессийн шугамын тохирох байдлыг тодорхойлохын тулд субъектив дүгнэлтэд найдах ёстой.

Урьдчилан таамаглахад регрессийн шугамыг ашиглах

Та регрессийн шугамыг ашиглан ажиглалтын хязгаарын төгсгөлд байгаа утгын утгыг таамаглах боломжтой (эдгээр хязгаараас хэтрүүлэн бүү гарга).

Бид тухайн утгыг регрессийн шугамын тэгшитгэлд залгах замаар тодорхой утгатай ажиглалтын дундажийг таамагладаг.

Тиймээс, хэрэв бид урьдчилан таамаглах юм бол энэ таамагласан утга болон түүний стандарт алдааг ашиглан жинхэнэ популяцийн дундаж утгын итгэлцлийн интервалыг тооцоол.

Өөр өөр утгуудын хувьд энэ процедурыг давтах нь энэ шугамын итгэлийн хязгаарыг бий болгох боломжийг танд олгоно. Энэ нь жишээлбэл 95% итгэлийн түвшинд үнэн шугамыг агуулсан хамтлаг эсвэл хэсэг юм.

Энгийн регрессийн төлөвлөгөө

Энгийн регрессийн загвар нь нэг тасралтгүй таамаглагчийг агуулна. Хэрэв 7, 4, 9 гэх мэт таамаглагч P утгатай 3 ажиглалт байгаа бөгөөд дизайн нь эхний дарааллын P эффектийг агуулж байвал дизайны матриц X болно.

X1-ийн P-г ашиглан регрессийн тэгшитгэл нь байна

Y = b0 + b1 P

Хэрэв энгийн регрессийн загвар нь квадрат эффект гэх мэт P дээр илүү өндөр эрэмбийн нөлөөг агуулж байвал дизайны матриц дахь X1 баганын утгууд хоёр дахь зэрэгт нэмэгдэнэ.

тэгшитгэл нь хэлбэрийг авна

Y = b0 + b1 P2

Сигма-хязгаарлагдмал болон хэт параметртэй кодлох аргууд нь энгийн регрессийн загварууд болон зөвхөн тасралтгүй таамаглагчдыг агуулсан бусад загварт хамаарахгүй (учир нь ангилсан таамаглагч байдаггүй). Сонгосон кодчилолын аргаас үл хамааран тасралтгүй хувьсагчдын утгыг зохих ёсоор нэмэгдүүлж, X хувьсагчийн утга болгон ашигладаг. Энэ тохиолдолд дахин кодчилол хийхгүй. Нэмж дурдахад, регрессийн төлөвлөгөөг тайлбарлахдаа дизайны X матрицыг авч үзэхгүй байж, зөвхөн регрессийн тэгшитгэлтэй ажиллах боломжтой.

Жишээ нь: Энгийн регрессийн шинжилгээ

Энэ жишээнд хүснэгтэд үзүүлсэн өгөгдлийг ашигласан болно:

Цагаан будаа. 3. Анхны өгөгдлийн хүснэгт.

Санамсаргүй байдлаар сонгогдсон 30 мужийн 1960 болон 1970 оны хүн амын тооллогын харьцуулалтаас цуглуулсан мэдээлэл. Тойргийн нэрсийг ажиглалтын нэрээр толилуулж байна. Хувьсагч бүрийн талаарх мэдээллийг доор харуулав.

Цагаан будаа. 4. Хувьсах үзүүлэлтүүдийн хүснэгт.

Судалгааны асуудал

Энэ жишээний хувьд ядуурлын түвшин болон ядуурлын шугамаас доогуур байгаа гэр бүлийн хувь хэмжээг урьдчилан таамаглах зэрэг хоорондын хамаарлыг шинжлэх болно. Тиймээс бид 3 (Pt_Poor) хувьсагчийг хамааралтай хувьсагч гэж үзэх болно.

Бид таамаглал дэвшүүлж болно: хүн амын тоо, ядуурлын шугамаас доогуур байгаа гэр бүлийн хувь хэмжээ нь хоорондоо холбоотой. Ядуурал нь гадагш чиглэсэн шилжилт хөдөлгөөнд хүргэдэг гэж үзэх нь үндэслэлтэй юм шиг санагддаг, тиймээс ядуурлын шугамаас доогуур хүмүүсийн хувь болон хүн амын өөрчлөлтийн хооронд сөрөг хамаарал байх болно. Тиймээс бид 1 (Pop_Chng) хувьсагчийг урьдчилан таамаглах хувьсагч гэж үзэх болно.

Үр дүнг харах

Регрессийн коэффициентүүд

Цагаан будаа. 5. Pop_Chng дээрх Pt_Poor-ийн регрессийн коэффициентүүд.

Pop_Chng мөр ба Парам баганын огтлолцол дээр. Pop_Chng дээрх Pt_Poor-ийн регрессийн стандарт бус коэффициент нь -0.40374. Энэ нь хүн амын нэг нэгж буурах тутамд ядуурлын түвшин .40374 болж нэмэгддэг гэсэн үг. Энэхүү стандарт бус коэффициентийн дээд ба доод (анхдагч) 95%-ийн итгэлийн хязгаарт тэгийг оруулаагүй тул регрессийн коэффициент нь p түвшинд чухал ач холбогдолтой.<.05 . Обратите внимание на не стандартизованный коэффициент, который также является коэффициентом корреляции Пирсона для простых регрессионных планов, равен -.65, который означает, что для каждого уменьшения стандартного отклонения численности населения происходит увеличение стандартного отклонения уровня бедности на.65.

Хувьсах тархалт

Өгөгдөл дэх хэт их хэтийн үзүүлэлтүүд байгаа тохиолдолд корреляцийн коэффициентүүд нь мэдэгдэхүйц хэтрүүлсэн эсвэл дутуу үнэлэгдэж болно. Pt_Poor хамааралтай хувьсагчийг дүүрэг тус бүрээр нь судалъя. Үүний тулд Pt_Poor хувьсагчийн гистограммыг байгуулъя.

Цагаан будаа. 6. Pt_Poor хувьсагчийн гистограмм.

Таны харж байгаагаар энэ хувьсагчийн тархалт нь ердийн тархалтаас эрс ялгаатай байна. Гэсэн хэдий ч хоёр мужид (баруун хоёр багана) ядуурлын шугамаас доогуур байгаа гэр бүлүүдийн хувь хэвийн тархалтаас доогуур байгаа хэдий ч тэд "хамгийн хүрээнд" байгаа бололтой.

Цагаан будаа. 7. Pt_Poor хувьсагчийн гистограмм.

Энэ дүгнэлт нь зарим талаараа субъектив юм. Үндсэн дүрэм бол ажиглалт (эсвэл ажиглалт) нь интервалд (стандарт хазайлтаас ± 3 дахин их) багтахгүй бол хэт давсан үзүүлэлтүүдийг харгалзан үзэх ёстой. Энэ тохиолдолд хүн амын гишүүдийн хоорондын хамааралд томоохон нөлөө үзүүлэхгүй байхын тулд хэт давтагдах болон үл хамаарах шинжилгээг давтан хийх нь зүйтэй.

Тархалтын график

Хэрэв таамаглалуудын аль нэг нь өгөгдсөн хувьсагчдын хоорондын хамаарлын талаархи априори бол түүнийг харгалзах тархалтын график дээр турших нь зүйтэй.

Цагаан будаа. 8. Тархалтын диаграм.

Тархалтын график нь хоёр хувьсагчийн хооронд тодорхой сөрөг хамаарлыг (-.65) харуулж байна. Энэ нь мөн регрессийн шугамын 95% -ийн итгэлцлийн интервалыг харуулж байна, өөрөөр хэлбэл регрессийн шугам нь хоёр тасархай муруйны хооронд байх магадлал 95% байна.

Ач холбогдолын шалгуур

Цагаан будаа. 9. Ач холбогдолын шалгуурыг агуулсан хүснэгт.

Pop_Chng регрессийн коэффициентийн тест нь Pop_Chng нь Pt_Poor, p -тэй хүчтэй холбоотой болохыг баталж байна.<.001 .

Доод шугам

Энэ жишээ нь энгийн регрессийн загварыг хэрхэн шинжлэхийг харуулсан. Стандарт бус болон стандартчилагдсан регрессийн коэффициентүүдийн тайлбарыг мөн танилцуулав. Хамаарах хувьсагчийн хариу урвалын тархалтыг судлахын ач холбогдлын талаар ярилцаж, урьдчилан таамаглагч болон хамааралтай хувьсагчийн хоорондын хамаарлын чиглэл, хүчийг тодорхойлох аргачлалыг үзүүлэв.

A) Энгийн шугаман регрессийн график шинжилгээ.

Энгийн шугаман регрессийн тэгшитгэл y=a+bx. Y ба X санамсаргүй хэмжигдэхүүнүүдийн хооронд хамаарал байгаа бол y = ý +  утга,

Энд ý - ý = f(x) тэгшитгэлээс олж авсан y-ийн онолын утга,

 – онолын ý тэгшитгэлийн бодит (туршилтын) өгөгдлөөс хазайсан алдаа.

Дундаж ý утгын x-ээс хамаарах тэгшитгэл буюу ý = f(x)-ийг регрессийн тэгшитгэл гэнэ. Регрессийн шинжилгээ нь дөрвөн үе шатаас бүрдэнэ.

1) асуудлыг тодорхойлж, холболтын шалтгааныг тогтоох.

2) судалгааны объектын хязгаарлалт, статистикийн мэдээлэл цуглуулах.

3) цуглуулсан өгөгдлийн шинжилгээ, шинж чанарт үндэслэн холболтын тэгшитгэлийг сонгох.

4) тоон утгын тооцоо, корреляцийн холболтын шинж чанар.

Хэрэв хоёр хувьсагч нь нэг хувьсагчийн өөрчлөлт нь нөгөө хувьсагчийн системчилсэн өөрчлөлттэй тохирч байхаар хамааралтай бол эдгээр хувьсагч нь мэдэгдэж байгаа бол тэдгээрийн хоорондын хамаарлын тэгшитгэлийг сонгохдоо регрессийн шинжилгээг ашиглана. Регрессийн шинжилгээнээс ялгаатай нь корреляцийн шинжилгээ нь X ба Y хоорондын харилцааны ойр байдлыг шинжлэхэд ашиглагддаг.

Регрессийн шинжилгээнд шулуун шугам олох талаар авч үзье.

Онолын регрессийн тэгшитгэл.

"Энгийн регресс" гэсэн нэр томъёо нь нэг хувьсагчийн утгыг өөр нэг хувьсагчийн талаарх мэдлэг дээр үндэслэн тооцдог болохыг харуулж байна. Энгийн олон хувьсагчийн регрессээс ялгаатай нь хоёр, гурав ба түүнээс дээш хувьсагчийн мэдлэг дээр үндэслэн хувьсагчийг тооцоолоход ашигладаг. Энгийн шугаман регрессийн график шинжилгээг авч үзье.

Хөдөлмөр эрхлэлтийн өмнөх болон хөдөлмөрийн бүтээмжийг шалгах тестийн үр дүн гарсан гэж бодъё.

Сонгон шалгаруулалтын үр дүн (100 оноо), x

Бүтээмж (20 оноо), y

График дээрх цэгүүдийг зурснаар бид тараах диаграмм (талбар) олж авна. Бид үүнийг сонгон шалгаруулах туршилтын үр дүн, хөдөлмөрийн бүтээмжид дүн шинжилгээ хийхэд ашигладаг.

Тархалтын график ашиглан регрессийн шугамд дүн шинжилгээ хийцгээе. Регрессийн шинжилгээнд дор хаяж хоёр хувьсагч үргэлж тодорхойлогддог. Нэг хувьсагчийн системчилсэн өөрчлөлт нь нөгөө хувьсагчийн өөрчлөлттэй холбоотой байдаг. үндсэн зорилго регрессийн шинжилгээөөр хувьсагчийн утга мэдэгдэж байгаа бол нэг хувьсагчийн утгыг тооцоолохоос бүрдэнэ. Бүрэн даалгаврын хувьд хөдөлмөрийн бүтээмжийг үнэлэх нь чухал юм.

Бие даасан хувьсагчрегрессийн шинжилгээнд өөр хувьсагчийг шинжлэхэд үндэс болгон ашигладаг хэмжигдэхүүн. Энэ тохиолдолд эдгээр нь сонгон шалгаруулах туршилтын үр дүн юм (X тэнхлэгийн дагуу).

Хамааралтай хувьсагчтооцоолсон утга (Y тэнхлэгийн дагуу) гэж нэрлэдэг. Регрессийн шинжилгээнд зөвхөн нэг хамааралтай хувьсагч, нэгээс олон бие даасан хувьсагч байж болно.

Энгийн регрессийн шинжилгээний хувьд хамаарлыг хоёр координатын системээр (х ба у) төлөөлж болох ба X тэнхлэг нь бие даасан хувьсагч, Y тэнхлэг нь хамааралтай хувьсагч болно. График дээр хос утгыг дүрслэхийн тулд бид огтлолцох цэгүүдийг зурдаг. Хуваарь гэж нэрлэдэг тархалтын график. Үүний бүтээн байгуулалт нь регрессийн шинжилгээний хоёр дахь шат бөгөөд эхнийх нь дүн шинжилгээ хийсэн утгыг сонгох, түүврийн өгөгдлийг цуглуулах явдал юм. Тиймээс статистикийн шинжилгээнд регрессийн шинжилгээг ашигладаг. Диаграм дахь түүвэр өгөгдлийн хоорондын хамаарал нь шугаман байна.

Х хувьсагч дээр тулгуурлан у хувьсагчийн хэмжээг тооцоолохын тулд тархалтын график дээрх цэгүүдийн байршилд үндэслэн х ба у хоёрын хоорондын хамаарлыг хамгийн сайн илэрхийлэх шулууны байрлалыг тодорхойлох шаардлагатай. Бидний жишээнд энэ бол гүйцэтгэлийн шинжилгээ юм. Тархалтын цэгүүдээр татсан шугам - регрессийн шугам. Харааны туршлага дээр үндэслэн регрессийн шугамыг бий болгох нэг арга бол гар аргаар хийх арга юм. Манай регрессийн шугамыг хөдөлмөрийн бүтээмжийг тодорхойлоход ашиглаж болно. Регрессийн шугамын тэгшитгэлийг олох үед

Хамгийн бага квадратын тестийг ихэвчлэн ашигладаг. Хамгийн тохиромжтой шугам бол квадрат хазайлтын нийлбэр хамгийн бага байх шугам юм

Өсөлтийн шугамын математик тэгшитгэл нь арифметик прогрессийн өсөлтийн хуулийг илэрхийлнэ.

цагт = АбX.

Ю = А + бX– нэг параметртэй өгөгдсөн тэгшитгэл нь холболтын тэгшитгэлийн хамгийн энгийн төрөл юм. Энэ нь дундаж утгуудын хувьд хүлээн зөвшөөрөгддөг. хоорондын харилцааг илүү нарийвчлалтай илэрхийлэх XТэгээд цагт, нэмэлт пропорциональ коэффициентийг нэвтрүүлсэн б, энэ нь регрессийн шугамын налууг заана.

B) Онолын регрессийн шугамыг байгуулах.

Үүнийг олох үйл явц нь муруйн төрлийг сонгох, зөвтгөх, параметрүүдийг тооцоолохоос бүрдэнэ. А, б, -тайгэх мэт. Барилга угсралтын процессыг тэгшлэх гэж нэрлэдэг бөгөөд шалны дэвсгэрээр санал болгож буй муруйг нийлүүлэх. дүн шинжилгээ, янз бүрийн. Ихэнх тохиолдолд эдийн засгийн асуудалд эерэг бүхэл тооны олон гишүүнтээр илэрхийлэгддэг муруйн гэр бүл, тэгшитгэлийг ашигладаг.

1)
- шулуун шугамын тэгшитгэл;

2)
- гиперболын тэгшитгэл;

3)
- параболын тэгшитгэл;

Энд ý нь онолын регрессийн шугамын ординатууд.

Тэгшитгэлийн төрлийг сонгосны дараа та энэ тэгшитгэлээс хамаарах параметрүүдийг олох хэрэгтэй. Жишээлбэл, сарнилын талбайн цэгүүдийн байршлын шинж чанар нь онолын регрессийн шугам шулуун болохыг харуулсан.

Тарсан график нь регрессийн шинжилгээ ашиглан хөдөлмөрийн бүтээмжийг илэрхийлэх боломжийг олгодог. Эдийн засгийн шинжлэх ухаанд регрессийн шинжилгээг эцсийн бүтээгдэхүүнд нөлөөлөх олон шинж чанарыг урьдчилан таамаглахад ашигладаг (үнийг харгалзан үздэг).

B) Шулуун шугамыг олох хамгийн жижиг хүрээнүүдийн шалгуур.

Тархалтын график дахь тохирох регрессийн шугамын хувьд бидний хэрэглэж болох нэг шалгуур нь квадрат алдааны нийлбэр хамгийн бага байх мөрийг сонгоход суурилдаг.

Шулуун шугамд тараах цэгүүдийн ойролцоо байдлыг сегментүүдийн ординатаар хэмждэг. Эдгээр цэгүүдийн хазайлт нь эерэг ба сөрөг байж болох ч туршилтын шугамаас онолын шугамын хазайлтын квадратуудын нийлбэр нь үргэлж эерэг бөгөөд хамгийн бага байх ёстой. Бүх тархалтын цэгүүд регрессийн шугамын байрлалтай давхцахгүй байгаа нь туршилтын болон онолын өгөгдлүүдийн хооронд зөрүү байгааг харуулж байна. Иймээс олдсоноос бусад регрессийн шугам нь туршилтын болон туршилтын өгөгдлүүдийн хооронд бага хэмжээний хазайлт өгч чадахгүй гэж бид хэлж чадна. Тиймээс онолын тэгшитгэлийг олсон ý болон регрессийн шугамын хувьд бид хамгийн бага квадратын шаардлагыг хангана.

Энэ нь холболтын тэгшитгэлийг ашиглан хийгддэг
параметрүүдийг олохын тулд томъёог ашиглах АТэгээд б. Онолын үнэ цэнийг авч байна
тэгшитгэлийн зүүн талыг тэмдэглэнэ е, бид функцийг авна
үл мэдэгдэх параметрүүдээс АТэгээд б. Үнэ цэнэ АТэгээд бхамгийн бага функцийг хангана еба хэсэгчилсэн дифференциал тэгшитгэлээс олно
Тэгээд
. Энэ шаардлагатай нөхцөлГэсэн хэдий ч эерэг квадрат функцийн хувьд энэ нь олоход хангалттай нөхцөл юм АТэгээд б.

Параметрийн томьёог хэсэгчилсэн дериватив тэгшитгэлээс гаргаж авцгаая АТэгээд б:



Бид тэгшитгэлийн системийг олж авна:

Хаана
- арифметик дундаж алдаа.

Тоон утгыг орлуулснаар бид параметрүүдийг олно АТэгээд б.

Нэг ойлголт байдаг
. Энэ бол ойролцоолох хүчин зүйл юм.

Хэрэв д < 33%, то модель приемлема для дальнейшего анализа;

Хэрэв д> 33%, дараа нь бид гипербола, парабола гэх мэтийг авна. Энэ нь янз бүрийн нөхцөл байдалд дүн шинжилгээ хийх эрхийг өгдөг.

Дүгнэлт: Ойролцоо коэффициентийн шалгуурын дагуу хамгийн тохиромжтой шугам нь хамгийн тохиромжтой шугам юм.

, мөн бидний асуудлын өөр ямар ч регрессийн шугам нь хамгийн бага хазайлтыг өгдөггүй.

D) Үнэлгээний квадрат алдаа, тэдгээрийн ердийн байдлыг шалгах.

Судалгааны параметрийн тоо 30-аас бага хүн амтай холбоотой ( n < 30), для проверки типичности параметров уравнения регрессии используется т-Оюутны t-тест. Энэ нь бодит утгыг тооцдог т-шалгуур:

Эндээс

Хаана – үлдэгдэл язгуурын дундаж квадрат алдаа. Хүлээн авсан т аТэгээд т бшүүмжлэлтэй харьцуулахад т кОюутны хүснэгтээс хүлээн зөвшөөрөгдсөн ач холбогдлын түвшинг харгалзан үзнэ ( = 0.01 = 99% эсвэл  = 0.05 = 95%). П = е = к 1 = м– судалж буй тэгшитгэлийн параметрийн тоо (чөлөөний зэрэг). Жишээлбэл, хэрэв y = а + bx; м = 2, к 2 = е 2 = х 2 = n – (м+ 1), хаана n- судлагдсан шинж чанаруудын тоо.

т а < т к < т б .

Дүгнэлт: ердийн байдлыг шалгасан регрессийн тэгшитгэлийн параметрүүдийг ашиглан харилцааны математик загварыг бий болгосон.
. Энэ тохиолдолд шинжилгээнд ашигласан математик функцийн параметрүүд (шугаман, гипербол, парабол) нь харгалзах тоон утгыг хүлээн авдаг. Ийм аргаар олж авсан загваруудын семантик агуулга нь тэдгээр нь үүссэн шинж чанарын дундаж утгыг тодорхойлдог явдал юм.
хүчин зүйлийн тэмдгээс X.

D) Муруй шугаман регресс.

Хувьсагчдын хооронд өөрчлөгдөж буй хамаарал үүсэх үед муруй шугаман хамаарал ихэвчлэн үүсдэг. Өсөлт (бууралт)-ын эрчим нь X-ийн түвшнээс хамаарна.Муруйн хамаарлын янз бүрийн хэлбэрүүд байдаг. Жишээлбэл, газар тариалангийн ургац ба хур тунадасны хамаарлыг авч үзье. Байгалийн ижил нөхцөлд хур тунадас нэмэгдэхийн хэрээр ургац эрчимтэй нэмэгдэж байгаа боловч тодорхой хязгаар хүртэл байна. Чухал цэгийн дараа хур тунадас хэтэрч, ургац гамшгийн хэмжээгээр буурдаг. Энэ жишээнээс харахад харилцаа нь эхлээд эерэг, дараа нь сөрөг байсан. Чухал цэг нь X атрибутын оновчтой түвшин бөгөөд энэ нь Y атрибутын хамгийн их буюу хамгийн бага утгатай тохирч байна.

Эдийн засгийн шинжлэх ухаанд үнэ ба хэрэглээ, бүтээмж, туршлага хоёрын хооронд ийм хамаарал ажиглагддаг.

Параболик хамаарал.

Хэрэв өгөгдөл нь хүчин зүйлийн шинж чанарын өсөлт нь үр дүнгийн шинж чанарыг нэмэгдүүлэхэд хүргэдэг бол хоёр дахь эрэмбийн тэгшитгэлийг (парабол) регрессийн тэгшитгэл болгон авна.

. a,b,c коэффициентүүдийг хэсэгчилсэн дифференциал тэгшитгэлээс олно.

Бид тэгшитгэлийн системийг олж авдаг:

Муруй шугаман тэгшитгэлийн төрлүүд:

,

,

Бид хөдөлмөрийн бүтээмж болон сонгон шалгаруулалтын шалгалтын онооны хооронд муруй шугаман хамаарал байгаа гэж үзэх эрхтэй. Энэ нь онооны систем нэмэгдэхийн хэрээр гүйцэтгэл нь зарим түвшинд буурч эхлэх тул шулуун загвар нь муруй хэлбэртэй болж магадгүй гэсэн үг юм.

Гурав дахь загвар нь гипербол байх ба бүх тэгшитгэлд x хувьсагчийг илэрхийллээр солино.