Meniul

Găsiți matricea coeficienților de corelare a perechilor selectivi. Matricea Dana de coeficienți de corelație asociată

Etaje

Datele economice sunt caracteristicile cantitative ale oricăror obiecte sau procese economice. Acestea sunt formate sub acțiunea multor factori, nu toate fiind disponibile controlului extern. Factorii necontrolați pot lua valori aleatorii dintr-un anumit set de valori și, prin urmare, determină randomitatea datelor pe care le definesc. Una dintre sarcinile principale din cercetarea economică este analiza dependențelor dintre variabile.

Având în vedere relația dintre semne, este necesar să se aloce în primul rând două tipuri de legături:

  • funcțional - Caracterizată printr-o corespondență completă între modificarea factorului și schimbarea productivității: fiecare semn al factorului caracteristic corespunde valorilor destul de definite ale caracteristicilor rezultate. Acest tip de comunicare este exprimat ca o dependență de formulă. Dependența funcțională poate asocia un rezultat al unui rezultat cu unul sau mai mulți factori. Astfel, valoarea salariilor cu salarii pe bază de timp depinde de numărul de ore petrecute de ore;
  • corelație - Nu există o corespondență completă între modificarea a două semne, efectul factorilor individuali se manifestă numai în medie, cu observarea în masă a datelor reale. Impactul simultan asupra semnului studiat al unui număr mare de factori diverși duce la faptul că aceeași valoare a factorului de semnare corespunde unei întregi distribuții a valorilor caracteristicilor efective, Deoarece în fiecare caz particular, alte note de factor pot schimba puterea și direcția impactului acestora.

Ar trebui să se țină cont de faptul că, în prezența dependenței funcționale dintre semne, puteți, cunoașterea valorii factorului semnului, pentru a determina cu exactitate valoarea semnului productiv.Dacă există o dependență de corelație, numai tendința de schimbare a semnului productiv Când modificați valoarea factorului semnului.

Studierea relației dintre semne, ele sunt clasificate în direcție, formă, numărul de factori:

  • către Comunicațiile sunt împărțite de către drept și verso. Cu o conexiune directă, direcția modificărilor din caracteristica productivă coincide cu direcția modificărilor factorului. Când feedback-ul, direcția modificărilor din caracteristica productivă este opusul direcției de schimbare factori de semnal. De exemplu, cu atât este mai mare calificarea lucrătorului, cu atât este mai mare nivelul de performanță a activității sale (conexiune directă). Cu cât este mai mare productivitatea muncii, cu atât costul unității de produse ( părere);
  • informa (Tipul funcției) Împărțirea comunicării liniar (drept) și neliniar (curbilinar). Comunicarea liniară este afișată linia directă, o curbă neliniară (parabola OH, hiperbolă etc.). Cu o conexiune liniară cu o creștere a valorii unui factor, apare o creștere uniformă a valorii caracteristicilor productive;
  • prin numărul de factori care acționează asupra rezultatului Comunicațiile sunt împărțite de către un singur factor (pereche) și multifactor.

Studierea dependenței variației caracteristicilor din condițiile învecinate și este conținutul teoriei de corelare.

La efectuarea analizei de corelare, întregul set de date este considerat multe variabile (factori), fiecare dintre care conține p. observații.

Când studiați relația dintre doi factori, ele sunt de obicei denumite X \u003d. (X R. x 2...., x n) și Y \u003d (y (, 2, ..., u și).

Covariararea - Aceasta este statistică măsurați interacțiunea Două variabile. De exemplu, valoarea pozitivă a covarianței randamentului a două valori mobiliare arată că rentabilitatea acestor valori mobiliare tind să se schimbe într-o singură direcție.

Covariance între două variabile X. și Y. calculate după cum urmează:

unde- valorile reale ale variabilelor

X. și r;

Dacă variabile aleatoare Hee y. Independent, covarianță teoretică este zero.

Covarianță depinde de unitățile în care sunt măsurate variabilele Chill. Y, este o valoare anormală. Prin urmare, pentru măsurarea forțele de comunicare Între două variabile, se utilizează o altă caracteristică statistică, numită coeficientul de corelație.

Pentru două variabile X. și Y Coeficientul corelației pereche

determinată după cum urmează:

unde SSY - Estimări ale dispersiei cantităților Hee y. Aceste estimări sunt caracterizate gradul de împrăștiere Valori x (, x 2, ..., x n (în 1, în 2, u n) în jurul său mijlociu x (U. respectiv), sau variabilitate (variabilitate) a acestor variabile pe mai multe observații.

Dispersie (Evaluarea dispersiei) este determinată de formula

În general, pentru a obține o evaluare fără comprimată a dispersiei, cantitatea de pătrate ar trebui împărțită în numărul de grade de libertate de evaluare (etc), Unde p - Eșantionare r - Numărul de conexiuni suprapuse pe eșantion. Deoarece eșantionul a fost deja utilizat o dată pentru a determina media X Numărul de conexiuni impuse în acest caz este egal cu unul (P \u003d. 1), și numărul de grade de libertate de evaluare (adică numărul de elemente independente ale eșantionului) este egal (P - 1).

Este mai natural să se măsoare gradul de împrăștiere a variabilelor în aceleași unități în care variabila însăși este măsurată. Această sarcină rezolvă un indicator, numit deviația rivală (deviație standard) Or. eroare standardvariabil X. (variabil Y) și determinată de raport

Componentele din numărator cu formula (3.2.1) exprimă interacțiunea a două variabile și determină semnul de corelare (pozitiv sau negativ). Dacă, de exemplu, există o relație puternică pozitivă între variabile (o creștere a unei variabile cu o creștere a celui de-al doilea), fiecare va fi un număr pozitiv. În mod similar, dacă există o relație negativă puternică între variabile, toate componentele din numărător vor fi numere negative, ceea ce duce la o valoare de corelație negativă.

Denuminator de expresie pentru coeficientul de corelație pereche [vezi Formula (3.2.2)] Pur și simplu normalizează numitorul astfel încât coeficientul de corelație să se dovedească a fi un număr ușor interpretat care nu are dimensiuni și ia valori de la -1 la +1.

Numeratorul expresiei pentru coeficientul de corelație, care este dificil de interpretat din cauza unităților neobișnuite de măsurare, este covarianță hee. În ciuda faptului că, uneori, este folosit ca o caracteristică independentă (de exemplu, în teoria finanțelor pentru descrierea schimbărilor comune a acțiunilor pe două schimburi), este mai convenabil să se utilizeze coeficientul de corelație. Corelarea și covarianța sunt în esență aceleași informații, dar corelația prezintă aceste informații într-o formă mai convenabilă.

Pentru o estimare calitativă a coeficientului de corelație, se aplică diverse scări, cel mai adesea - Sampler. În funcție de valoarea coeficientului de corelație, conexiunea poate avea una dintre estimări:

  • 0,1-0,3 - slab;
  • 0.3-0.5 - vizibil;
  • 0,5-0,7 - moderată;
  • 0,7-0,9 - înălțime;
  • 0.9-1.0 - foarte mare.

Evaluarea gradului de etanșeitate a comunicării utilizând coeficientul de corelație se efectuează, de regulă, pe baza unor informații mai mult sau mai puțin limitate despre fenomenul studiat. În acest sens, este necesar să se evalueze semnificația coeficientului de corelare liniară, care dă capacitatea de a distribui concluziile privind rezultatele eșantionului asupra populației generale.

Evaluarea importanței coeficientului de corelație la volume de probă mici se efectuează utilizând criteriul de 7 ani. În acest caz, valoarea reală (observabilă) a acestui criteriu este determinată de formula

Valoarea calculată prin această formulă este comparată cu o valoare critică a criteriului 7, care este luată din tabelul de valoare / -Criteria de student (a se vedea apendicele 2), ținând cont de nivelul specificat de semnificație a sistemului de operare și Numărul de grade de libertate (P. - 2).

În cazul în care 7 fila 7 7, atunci valoarea coeficientului de corelație este recunoscută ca fiind semnificativă (adică ipoteza zero care aprobă coeficientul de corelare a egalității zero este respins). Și astfel concluzionează că există o relație statistică apropiată între variabilele studiate.

Dacă valoarea g la H. Aproape de zero, legătura dintre variabile este slabă. Dacă corelația dintre valorile aleatorie:

  • Pozitiv, atunci cu o creștere a unei variabile aleatorii, cealaltă tind să crească media;
  • Negativ, atunci cu o creștere a unei variabile aleatorie, cealaltă tinde să scadă în medie. Un instrument grafic convenabil pentru analiza datelor asociate este diagrama împrăștiatăcare reprezintă fiecare observație în spațiul a două dimensiuni corespunzătoare celor doi factori. Diagrama de împrăștiere pe care este descrisă setul de două semne, numit mai mult câmpul de corelație. Fiecare punct al acestei diagrame are coordonate x (. Și g. Pe măsură ce puterea liniară este în creștere, punctul de pe grafic va fi mai aproape de linia dreaptă și valoarea g. Va fi mai aproape de unul.

Coeficienții corelației pereche sunt folosite pentru a măsura puterea conexiunilor liniare a diferitelor perechi de semne de la setul lor. Pentru multe semne matricea coeficienților de corelare a perechilor.

Lăsați întreaga analitate a datelor să fie formată dintr-o variabilă Y \u003d \u003d \u003d (U R. în 2, ..., sUS) și t. Variabile (factori) X Fiecare dintre care conține p. observații. Valori variabile Y. și X Conținut în agregatul observat sunt înregistrate în tabel (Tabelul 3.2.1).

Tabelul 3.2.1.

Variabil

cameră

observații

X tz.

X tp.

Pe baza datelor conținute în acest tabel, calculați coeficienții matricei de corelare pereche r, Este simetric cu privire la diagonala principală:


Analiza matricei de coeficienți de corelare a perechilor este utilizată în construirea unor modele de regresie multiple.

O matrice de corelație nu poate fi descrisă complet între valori. În acest sens, două sarcini sunt luate în considerare în analiza corelației multidimensionale:

  • 1. Determinarea etanșeității conexiunii unei variabile aleatorie cu o combinație de alte valori incluse în analiză.
  • 2. Determinarea etanșeității comunicării între două valori la fixarea sau excluderea efectului altor valori.

Aceste sarcini sunt rezolvate în consecință cu ajutorul coeficienților de corelație multiplă și privați.

Soluția primei sarcini (determinarea etanșeității conectării unei variabile aleatorii cu o combinație de alte valori incluse în analiză) se efectuează utilizând coeficientul de corelație multiplă selectivă Conform formulei

unde R - R. [cm. Formula (3.2.6)]; RJJ - Adăugarea algebrică a elementului aceleiași matrice R.

Piața multiplă de corelare SH J 2. j._J. J + L M Apel numit coeficientul de determinare multiplă selectivă; Arată ce fracțiune de variație (variația aleatorie) a valorii studiate Xj. Explică variația restului variabile aleatoare X (, x 2 ,..., X t.

Coeficienții multipli de corelare și determinare sunt valorile valorilor pozitive în intervalul de la 0 la 1. Când se apropie coeficientul R. 2 la unul, se poate concluziona că relația variabilelor aleatorii este testată, dar nu despre direcția sa. Coeficientul de corelare multiplă poate crește numai dacă modelul include variabile suplimentare și nu va crește dacă excludeți oricare dintre caracteristicile disponibile.

Verificarea semnificației coeficientului de determinare se efectuează prin compararea valorii calculate / "- criteriul lui Fisher

cu tabular F. Rabl. Valoarea tabelului criteriului (a se vedea apendicele 1) este determinată de nivelul specificat de semnificație și de grade de libertate v L \u003d MNV 2 \u003d N-M-L. Coeficient R2. semnificativ diferit de zero dacă se efectuează inegalitatea

Dacă variabilele aleatoare se corelează unul cu celălalt Apoi, influența altor valori este parțial afectată de coeficientul de corelare a perechilor. În acest sens, este necesar să se studieze o corelație privată între valorile în excluderea altor variabile aleatorii (una sau mai multe).

Coeficientul de corelație privat selectiv Determinată de formula

unde R JK, RJJ, R KK - Adăugările algebrice la elementele corespunzătoare ale matricei R. [cm. Formula (3.2.6)].

Coeficientul de corelație privat, precum și coeficientul de perechi Corelație, variază de la -1 la +1.

Exprimarea (3.2.9) furnizată t \u003d. 3 va arăta

Coeficientul G 12 (3) este numit coeficientul de corelație între x ( și x 2 la fix x Este simetric cu privire la indexurile primare 1, 2. Indicele secundar 3 se referă la o variabilă fixă.

Exemplul 3.2.1. Calcularea coeficienților de abur,

corelație multiplă și privată.

În fila. 3.2.2 Oferă informații privind volumele de vânzări și costurile de publicitate a unei societăți, precum și indicele de cheltuieli pentru consumatori pentru un număr de ani curenți.

  • 1. Construiți o diagramă de împrăștiere (câmp de corelație) pentru variabilele "Vânzări" și "Indicele cheltuielilor pentru consumatori".
  • 2. Determinați gradul de influență al indicelui de cheltuieli de consum în volumul vânzărilor (calculați coeficientul de corelare a perechilor).
  • 3. Evaluați importanța coeficientului de corelare a perechii calculate.
  • 4. Construiți matricea coeficienților de corelare a perechilor în trei variabile.
  • 5. Găsiți o estimare a coeficientului de corelație multiplă.
  • 6. Găsiți estimări ale coeficienților de corelare privată.

1. În exemplul nostru, diagrama de împrăștiere este privită în fig. 3.2.1. Pulmonarul norului de puncte de pe diagrama de împrăștiere de-a lungul direcției înclinate vă permite să presupunem o presupunere că există o tendință obiectivă de comunicare liniară directă între valorile variabile X 2. Y.(volumul vânzărilor).

Smochin. 3.2.1.

2. Calcule intermediare la calcularea coeficientului de corelare între variabile X 2. (Indicele cheltuielilor pentru consumatori) și Y.(Vânzări) sunt prezentate în tabel. 3.2.3.

Valori medii variabile aleatoare X 2. și Y, care sunt cei mai simpli indicatori care caracterizează secvența JCJ, x 2. ..., x 16 și y v y 2, ..., în 16, calculează următoarele formule:


Vânzări Y, mii de ruble.

Index

contra

telski.

cheltuieli

Vânzări Y, mii de ruble.

Index

contra

telski.

cheltuieli

Tabelul 3.2.3.

l:, - - h.

(Și - Y) (x, - x)

(x, - x) 2

(U, - - y) 2.

Dispersie caracterizează gradul de împrăștiere a valorilor x V x 2, x:

Luați în considerare acum soluția din Exemplul 3.2.1 în Excel.

Pentru a calcula corelația cu ajutorul Excel, puteți utiliza funcția \u003d Corelate (), specificând adresele a două coloane de numere, așa cum se arată în fig. 3.2.2. Răspunsul este plasat în D8 și egal cu 0,816.

Smochin. 3.2.2.

(Notă. Argumentele funcției corellarea trebuie să fie numere sau nume, matrice sau referințe care conțin numere. Dacă un argument care este o matrice sau referință conține text, valori logice sau celule goale, atunci astfel de valori sunt ignorate; Cu toate acestea, sunt luate în considerare celulele care conțin valori zero.

Dacă o matrice! și ARRAY 2 au un număr diferit de puncte de date, apoi funcția corellarea returnează valoarea erorii # n / d.

Dacă matricea este fie o matrice2, este goală sau dacă despre abaterea standard) a valorilor lor este zero, atunci funcția corellarea returnează valoarea erorii casei / 0!)

Valoarea critică a elevului poate fi obținută și prin funcție sTEARPROBBR 1 Pachet Excel. Ca argumente ale funcției, este necesar să se stabilească numărul de grade de libertate, egale p. - 2 (în exemplul nostru 16 - 2 \u003d 14) și nivelul de semnificație A (în exemplul nostru A \u003d 0,1) (figura 3.2.3). În cazul în care un valoarea reală / -statisticile luate de modulul, mai mult criticaceasta este probabilitatea (1 - a) Coeficientul de corelație este semnificativ diferit de zero.


Smochin. 3.2.3. Valoarea critică / -Statistică este de 1.7613

Excel include un set de instrumente de analiză a datelor (așa-numitul pachet de analiză) conceput pentru a rezolva diverse sarcini statistice. Pentru a calcula matricea coeficienților de corelare a perechilor R. Instrumentul de corelare trebuie utilizat (figura 3.2.4) și setați parametrii de analiză în caseta de dialog corespunzătoare. Răspunsul va fi plasat pe o nouă foaie de lucru (figura 3.2.5).

1 în numele funcției Excel 2010 stuudrobr sa schimbat la tocană

Adâncitură.

Smochin. 3.2.4.


Smochin. 3.2.5.

  • Fondatorii teoriei de corelare sunt statisticile britanice F. Galton (1822-1911) și K. Pearson (1857-1936). Termenul "corelație" a fost împrumutat din știința naturală și denotă "raportul, conformitatea". Ideea corelației ca interdependența dintre variabilele aleatoare este ozinul matematicheologic și teoria statistică a corelației.

Y. X. 1 X. 2 X. 3 X. 4 X. 5 X. 6
Y.
X. 1 0,519
X. 2 -0,273 0,030
X. 3 0,610 0,813 -0,116
X. 4 -0,572 -0,013 -0,022 -0,091
X. 5 0,297 0,043 -0,461 0,120 -0,359
X. 6 0,118 -0,366 -0,061 -0,329 -0,100 -0,290

Analiză interfactory. (între "ICES"!) Coeficienții de corelare arată că o valoare de 0,8 depășește În valoare absolută Numai coeficientul de corelație între o pereche de factori H. 1 –H. 3 (subliniat cu caractere aldine). Factori H. 1 –H. 3, prin urmare, recunoscut de Collinear.

2. După cum se arată în paragraful 1, factorii H. 1 –H. 3 sunt colinear, ceea ce înseamnă că ele se duplică reciproc, iar incluziunea lor simultană în model va duce la interpretarea necorespunzătoare a coeficienților de regresie respectivi. Se poate observa acest factor H. 3 are un mai mare după modulul Rata de corelație cu rezultatul Y.decât factorul H. 1: r y. , X. 1 =0,519; r y. , X. 3 \u003d 0,610; (cm. masa. unu). Aceasta indică o influență mai puternică a factorului H. 3 la schimbare Y.. Factor H. 1, astfel, este exclusă din considerație.

Pentru a construi ecuația de regresie, valorile variabilelor utilizate ( Y., X. 2 , X. 3 , X. 4 , X. 5 , X. 6) Copiați pe o foaie de lucru curată ( arr. 3). Ecuația de regresie Construim cu ajutorul adăugării " Analiza datelor ... regresie"(Meniul" Serviciu"® « Analiza datelor…» ® « Regresie"). Panoul de analiză de regresie cu câmpuri completate este prezentat pe smochin. 2..

Rezultatele analizei de regresie sunt date arr. patru. și transferate la B. masa. 2.. Ecuația de regresie are forma (vezi " Coeficienți »în masa. 2.):

Ecuația de regresie este recunoscută ca fiind semnificativă din punct de vedere statistic, deoarece probabilitatea formării lor aleatorie în forma în care este obținută este de 8,80 × 10 -6 (a se vedea "Semnificație f" în masa. 2.), ceea ce este semnificativ mai mic decât nivelul acceptat de semnificație A \u003d 0,05.

H. 3 , H. 4 , H. 6 sub nivelul adoptat de semnificație A \u003d 0,05 (a se vedea " P-valoare "în masa. 2.), ceea ce indică semnificația statistică a coeficienților și impactul semnificativ al acestor factori pentru schimbarea profitului anual Y..

Probabilitatea formării accidentale a factorilor H. 2 I. H. 5 depășește nivelul acceptat de semnificație A \u003d 0,05 (a se vedea " P-valoare "în masa. 2.), Iar acești coeficienți nu sunt semnificativi din punct de vedere statistic.

smochin. 2. Panoul de analiză a regresiei modelului Y.(X. 2 , X. 3 , X. 4 , X. 5 , X. 6)

masa 2

Y.(X. 2 , X. 3 , X. 4 , X. 5 , X. 6)

Statistici de regresie.
Multiple R. 0,868
R-pătrat. 0,753
Normal r-pătrat 0,694
Eroare standard 242,3
Observații
Analiza dispersiei.
dF. SS. DOMNIȘOARĂ. F. Semnificație F.
Regresie 3749838,2 749967,6 12,78 8,80E-06.
Reziduu 1232466,8 58688,9
TOTAL 4982305,0
Ecuația de regresie
Factori Eroare standard t-Statistici P-valoare
Y-Crossing. 487,5 641,4 0,760 0,456
X2. -0,0456 0,0373 -1,224 0,235
X3. 0,1043 0,0194 5,375 0,00002
X4. -0,0965 0,0263 -3,674 0,001
X5. 2,528 6,323 0,400 0,693
X6. 248,2 113,0 2,197 0,039

(3) În conformitate cu rezultatele verificării semnificației statistice a coeficienților ecuației de regresie efectuate în paragraful anterior, construim un nou model de regresie care conține doar factori informativi la care se numără:

· Factorii ale căror coeficienți sunt semnificativi statistic;

· Factorii ale căror coeficienți t.- stația depășește unitatea (cu alte cuvinte, valoarea absolută a coeficientului este mai mare decât eroarea sa standard).

Primul grup include factori H. 3 , H. 4 , H. 6, la cel de-al doilea factor X. 2. Factor X. 5 este exclusă din considerație ca non-informativă, iar modelul final de regresie va conține factori X. 2 , X. 3 , X. 4 , X. 6 .

Pentru a construi ecuația de regresie, copiați valorile variabilelor utilizate la curat arr. cinci) și efectuați analiza de regresie ( smochin. 3.). Rezultatele sale sunt date în arr. 6. și transferate la B. masa. 3.. Ecuația de regresie are forma:

(cm. " Coeficienți » în masa. 3.).

smochin. 3. Modelul panoului de analiză de regresie Y.(X. 2 , X. 3 , X. 4 , X. 6)

Tabelul 3.

Rezultatele modelului de analiză a regresiei Y.(X. 2 , X. 3 , X. 4 , X. 6)

Statistici de regresie.
Multiple R. 0,866
R-pătrat. 0,751
Normal r-pătrat 0,705
Eroare standard 237,6
Observații
Analiza dispersiei.
dF. SS. DOMNIȘOARĂ. F. Semnificație F.
Regresie 3740456,2 935114,1 16,57 2,14E-06.
Reziduu 1241848,7 56447,7
TOTAL 4982305,0
Ecuația de regresie
Factori Eroare standard t-Statistici P-valoare
Y-Crossing. 712,2 303,0 2,351 0,028
X2. -0,0541 0,0300 -1,806 0,085
X3. 0,1032 0,0188 5,476 0,00002
X4. -0,1017 0,0223 -4,560 0,00015
X6. 227,5 98,5 2,310 0,031

Ecuația de regresie este semnificativă din punct de vedere statistic: probabilitatea formării lor aleatorie este sub nivelul admisibil de semnificație A \u003d 0,05 (vezi " Semnificație f " în masa. 3.).

Coeficienți recunoscuți semnificativi din punct de vedere statistic pentru factori H. 3 , H. 4 , H. 6: probabilitatea formării lor accidentale este sub nivelul admisibil de semnificație A \u003d 0,05 (vezi " P-valoare "în masa. 3.). Acest lucru indică un impact semnificativ al valorii anuale a taxelor de asigurare. X. 3, plăți anuale de asigurare X. 4 și proprietatea X. 6 pentru a schimba profitul anual Y..

Coeficientul de factori H. 2 (suma anuală a rezervelor de asigurare) nu este semnificativă din punct de vedere statistic. Cu toate acestea, acest factor poate fi considerat informativ deoarece t.-Statismul coeficientului său depășește după modulul unitate, deși la concluzii suplimentare față de factor H. 2 ar trebui tratate cu unele partajări de prudență.

4. Estimăm calitatea și acuratețea ultimului ecuație de regresie utilizând câteva caracteristici statistice obținute în timpul analizei de regresie (a se vedea . « Statistici de regresie."In. masa. 3.):

· Coeficient de determinare multiplă

indică faptul că modelul de regresie explică 75,1% din variația profitului anual Y.Mai mult, această variație se datorează schimbării regresiei factorilor incluși în modelul de regresie. X. 2 , X. 3 , X. 4 I. X. 6 ;

· Eroare de regresie standard

mii de ruble.

indică faptul că valorile profitului anual prezis de ecuație Y. diferă de valorile reale, în medie cu 237,6 mii de ruble.

Eroarea medie de aproximare relativă este determinată de formula aproximativă:

unde mii de ruble. - valoarea medie a profitului anual (definită utilizând funcția încorporată " Srnzoke.»; arr. unu).

E. Se arată că valorile profitului anual prezis de ecuația de regresie Y. diferă de valorile reale în medie cu 26,7%. Modelul are o precizie nesatisfăcătoare (când - acuratețea modelului este ridicată, cu - bun cu - satisfăcătoare, atunci când nesatisfăcătoare).

5. Pentru interpretarea economică a coeficienților ecuației de regresie, reducem valorile medii și deviațiile standard ale variabilelor din datele sursă ( masa. patru.) . Valorile medii au fost determinate utilizând funcția încorporată " Srnzoke.", Abateri standard - utilizând funcția încorporată" Standotclona." (cm. arr. unu).

1. Calculați matricea coeficienților de corelare pereche; Analizați etanșeitatea și direcția răspunsului Y. cu fiecare dintre factori H.; Evaluați semnificația statistică a coeficienților de corelare r.(Y., X. i); Alegeți cel mai informativ factor.

2. Construiți un model de regresie cu cel mai informativ factor; Dați interpretarea economică a coeficientului de regresie.

3. Evaluați calitatea modelului utilizând o eroare medie de aproximare relativă, coeficientul de determinare și criteriul FIRHER (ia nivelul de semnificație α \u003d 0,05).

4. Cu o probabilitate de încredere γ \u003d 80% pentru a prezice valoarea medie a indicatorului Y.(Factorii prognozați sunt prezentați în apendicele 6). Reprezintă valori grafice și model grafic. Y., prognozarea rezultatelor.

5. prin activarea prin construirea de modele cu două factori, păstrarea acestora cel mai informativ factor; Construiți un model cu trei factori cu o listă completă de factori.

6. Selectați cele mai bune modele de mai multe modele. Dau interpretarea economică a coeficienților săi.

7. Verificați importanța coeficienților de regresie multiplă cu t.-Crediteria (ia nivelul de semnificație α \u003d 0,05). Calitatea modelului multiplu sa îmbunătățit în comparație cu camera de aburi?

8. Oferiți o evaluare a efectului factorilor asupra rezultatului cu ajutorul coeficienților de elasticitate, a coeficienților beta și a deltei.

Sarcina 2. Modelarea unei serii de timp unidimensionale

Anexa 7 oferă rânduri temporare YT) Indicatori socio-economici de pe teritoriul Altai pentru perioada 2000-2011 este obligat să exploreze dinamica indicatorului corespunzător opțiunii de sarcină.

Opțiune Desemnarea, denumirea, unitatea de măsurare a indicatorului
Y1. Cheltuielile de consum în medie pe cap de locuitor (pe lună), frecați.
Y2. Emisiile de poluanți în aer atmosferic, mii de tone
Y3. Prețurile medii pe piața locuințelor secundare (la sfârșitul anului, pentru metru patrat suprafața totală), frecați
Y4. Volumul serviciilor plătite pe cap de locuitor, frecați
Y5. Numărul mediu anual de persoane angajate în economie, mii de oameni
Y6. Numărul de mașini proprii pentru 1000 de persoane ale populației (la sfârșitul anului), bucăți
Y7. Venitul bancar secundar (pe lună), frecați
Y8. Indicele prețurilor de consum (decembrie până în decembrie al anului precedent),%
Y9. Investiții în active fixe (în prețurile de funcționare), milioane de ruble
Y10. Cifra de afaceri a comerțului cu amănuntul pe cap de locuitor (în prețurile efective), frecați


Procedura de efectuare a muncii

1. Pentru a construi un model liniar al unei serii temporare, parametrii cărora să evalueze MNC. Calculați semnificația coeficientului de regresie.

2. Evaluați adecvarea modelului construit utilizând proprietățile șanselor, independenței și respectării componentei reziduale a legii normale de distribuție.

3. Evaluați acuratețea modelului pe baza utilizării unei erori medii relative de aproximare.

4. Implementarea prognozei indicatorului timp de un an înainte (intervalul de prognoză se calculează în timpul probabilității de încredere de 70%).

5. Trimiteți valori grafice reale ale indicatorului, modelarea și prognozarea rezultatelor.

6. Efectuați calcularea parametrilor logaritmici, polinomiali (polinomul gradului 2), a tendințelor de putere, exponențială și hiperbolice. Pe baza imaginii grafice și a valorii indicelui de determinare, selectați cel mai potrivit tip de tendință.

7. Folosind modelul cel mai bun neliniar, predicția punctului indicatorului în cauză pe an este înainte. Se potrivește cu rezultatul cu un interval de prognoză de încredere construit atunci când utilizați un model liniar.

EXEMPLU

Execuţie munca de testare

Sarcina 1.

Compania este angajată în realizarea autoturismelor uzate. Numele indicatorilor și datele sursă pentru modelul econometric sunt prezentate în tabel:

Prețul vânzărilor, mii e. ( Y.) Prețul noului Auto., MIII ( X1.) Durata de viață, ani ( X2.) Volanul stâng - 1, volan dreapta - 0, ( X3.)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

Necesită:

1. Calculați matricea coeficienților de corelare pereche; Analizați etanșeitatea și direcția conexiunii semnului rezultat Y cu fiecare dintre factorii x; Evaluați semnificația statistică a coeficienților de corelare R (Y, X I); Alegeți cel mai informativ factor.

Utilizați Excel (date / date date / corelație):

Obținem o matrice de coeficienți de corelare pereche între toate variabilele disponibile:

W. X1. X2. X3.
W.
X1. 0,910987
X2. -0,4156 -0,2603
X3. 0,190785 0,221927 -0,30308

Analizăm coeficienții de corelare între caracteristica rezultată Y. și fiecare dintre factori X. J:

\u003e 0, prin urmare, între variabile Y. și H. 1 Există o dependență directă de corelare: cu cât este mai mare prețul noii mașini, cu atât este mai mare prețul implementării.

\u003e 0.7 - Această dependență este aproape.

< 0, значит, между переменными Y. și H. 2 se observă

dependența de corelare inversă: prețul implementării este mai mic pentru auto-

telefoane mobile cu o durată lungă de viață.

- Această dependență este moderată, mai apropiată de slab.

\u003e 0, prin urmare, între variabile Y. și H. 3 Există o dependență directă de corelare: prețul implementării este mai mare pentru mașinile cu volanul stâng.

< 0,4 – эта зависимость слабая.

Pentru a verifica semnificația coeficienților de corelare găsiți, folosim criteriul elevului.

Pentru fiecare coeficient de corelație calculati t.- Formula-statistică și aduceți rezultatele calculelor la coloana suplimentară a tabelului de corespondență:

W. X1. X2. X3. t-Statistici
W.
X1. 0,910987 7,651524603
X2. -0,4156 -0,2603 1,582847988
X3. 0,190785 0,221927 -0,30308 0,673265587

Potrivit tabelului de puncte critice de distribuție a stilului la nivelul semnificației și numărul de grade de libertate definim o valoare critică (apendicele 1 sau funcția de arturboral) .y și viața de serviciu H. 2 fiabile.

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации Y. și locația volanului H. 3 fiabile.

Astfel, se observă cea mai apropiată și mai semnificativă între prețul de vânzare Y. și prețul unei mașini noi H. unu ; factor H. 1 este cea mai informativă.

Numărul de examinare 2.

Opțiunea numărul 5.

Exercitiul 1. Utilizarea tehnologiilor informatice, efectuați o analiză de corelare a indicatorilor economici investigați și construirea unui model de regresie .............................. ..... 3.

1.1 Construirea unui câmp de corelație ............................................. 4.

1.2 Construcția matricei de coeficienți de corelare a perechilor ............... 6

1.3 Construcția și analiza modelelor de regresie cu un singur factor de tipuri liniare și exponențiale de funcții încorporate ale TP MS Excel .......................... .................................................. ........ ... 6.

1.4 Construcția unui model de regresie cu un singur factor liniar .......... 10

1.5 Concluzii ................................................ ................................... 15.

Sarcina 2. Utilizarea tehnologiilor informatice, rezolvați sarcini de programare liniare ........................................... ................18.

a) sarcina de planificare optimă de producție .................. .19

1. Formularea matematică a problemei ........................................... .19

2. Plasarea pe foaia de lucru TP MS Excel al datelor sursă, calculul valorilor restricțiilor, calculul valorilor funcției țintă ............... ... 19.

3. Formularea modelului matematic al problemei în ceea ce privește celulele foii de lucru ale TP MS Excel .......................... ................................................ 20.

4. Căutați. soluție optimă Sarcina suprastructurii "Căutarea soluției" ......................................... ............. ..20.20.

5. Analiza rezultatelor ............................................. .......................21.

b) sarcina de a optimiza planul de transport (sarcina de transport) ... 23

1. Formularea matematică a sarcinii ........................................... .23

2. Plasarea datelor pe fișa de lucru TP MS Excel ..................... ... 24

3. Declarația sarcinii În condițiile foii de lucru Excel pentru a utiliza "Utilitarul de căutare a soluției" ............................ .... 25.

4. Analiza rezultatelor ............................................ ...................... .26

Lista literaturii folosite .............................................. .28.

Sarcina 1. Utilizarea tehnologiilor informatice, efectuați o analiză de corelație a indicatorilor economici investigați și construirea unui model de regresie.

Ca un set de instrumente de studiu utilizați:



Add-on Instrumente MS Excel TP Pachet de analiză;

Funcții încorporate ale bibliotecii statisticilor (statistici) CKM Maple.

Condiții de activitate 1:

Conform datelor selective, investighează efectul factorilor x1, x2 și x3 asupra rezultatului Y.

Construi un câmp de corelație și să facă o ipoteză despre prezența și tipul de comunicare între factorii investigați;

Evaluarea apropierii legăturii dintre factorii investigați, pentru a construi un multifactor (un singur factor) liniarmodelul de regresie al formei y \u003d f (x1, x2 x3) sau forma y \u003d f (x).

Estima:

Adecvarea ecuației de regresie prin valoarea coeficientului determinism R2;

Semnificația coeficienților ecuației de regresie în funcție de criteriul T al elevului la un anumit nivel al probabilității de încredere P \u003d 0,05;

Gradul de rata de accident între fiecare factori x și un semn al y (criteriul pescarului);

Relația dintre indicatorii X1, X2, X3 din fondurile principale și volumul producției brute dintr-o întreprindere a uneia dintre industrii se caracterizează prin următoarele date:

Opțiunea 5.

X 1. 1.5 2.6 3.5 4.8 5.9 6.3 7.2 8.9 9.5 11.1 15.0
X 2. 10.2 15.3 18.4 20.5 24.7 25.6 27.3 28.3 29.6 30.1 31.0
X 3. 1.1 2.3 3.5 4.1 5.7 6.6 7.3 8.5 9.8 10.1 12.0
Y.

Decizia sarcinii 1.

Decizia sarcinii 1 presupune.

1. Construirea câmpului de corelație.

2. Construirea matricei de coeficienți de corelare a perechilor.

3. Construirea și analizarea modelelor de regresie cu un singur factor de tipuri liniare și exponențiale de funcții încorporate ale MS Excel TP.

4. Construirea modelelor de regresie cu un singur factor liniar prin intermediul adăugării "Pachetului de analiză".

5. Concluzii.

Construcția câmpului de corelație.

Plasați cu datele sursă în celulele A3: D15 al desktopului Excel.

Anexa1.1.
Y. X1. X2. X3.
1,5 10,2 1,1
2,6 15,3 2,3
3,5 18,4 3,5
4,8 20,5 4,1
5,9 24,7 5,7
6,3 25,6 6,6
7,2 27,3 7,3
8,9 28,3 8,5
9,5 29,6 9,8
11,1 30,1 10,1
?

Folosind capabilitățile diagramelor MS Excel TP, vom construi un câmp de corelație, adică va imagina o legătură grafică între semnul rezultat Y și fiecare dintre factorii X. Din graficul este clar că există o proporțională directă Dependența se apropie de factorii X.

.

.

Explorăm fără gust și natura relației dintre factori.

Construcția matricei de coeficienți de corelare a perechilor.

Folosind "Pachetul de analiză" TP MS Excel (Service - Analiza datelor - corelație), construiți o matrice a coeficienților de corelare a perechilor. Fereastra de instrument "corelație" este prezentată în figura 1. Matricea coeficienților de corelare a perechilor este prezentată în Figura 2.

Fig.1. -Okly "corelație"

Fig.2. - Matricea coeficienților de corelare a perechilor.

Din această matrice este clar că toți factorii luați în considerare X1 - X3 au o relație strânsă cu un semn eficient al Y. În plus, toți factorii multicollinearii. Prin urmare, construcția unui model multifactor al formei y \u003d f (x1, x2, x3) este imposibilă.

Collinear sunt factori ...

Decizie:

Se crede că două variabile sunt în mod evident colinear, adică. sunt printre ei în dependența liniară, dacă. În modelul nostru, numai coeficientul de regresie liniară asociată între factori și mai mult de 0,7. , Deci, factori și colinear.

4. În modelul de regresie multiplă, determinantul matricei de coeficienți de corelație asociat între factori și aproape de zero. Aceasta înseamnă că factorii și ...

multicoline

independent

cuantificarea măsurabilă

Decizie:

Pentru a estima multicolinearitatea factorilor, se poate utiliza determinantul matricei de coeficienți de corelație asociat între factori. Dacă factorii nu sunt corelați între ei, matricea coeficienților de corelație asociată între factori ar fi unică. Deoarece toate elementele non-diagonale Ar fi zero.
pentru că \u003d \u003d și \u003d \u003d \u003d 0.
Dacă există o dependență liniară completă între factori și toate coeficienții de corelare perechii sunt egali cu unul, atunci determinantul unei astfel de matrice este zero.


Cu cât este mai aproape de zero, cuantificatorul matricei de corelare a interfeței, cu atât mai puternic multicollinearitatea factorilor și rezultatele nesigure ale regresiei multiple. Și, dimpotrivă, cu cât este mai aproape de unitate determinantul matricei de corelare a interfeței, cu atât mai puțin multicolația factorilor.

5. Pentru un model econometric ecuație liniară Regresia multiplă a speciei construite matrice de coeficienți pereche de corelare liniară ( y. - variabilă dependentă; x (1), X (2), x (3), x (4)- variabile independente):


Variabile independente (explică) independente (explică) nu sunt

x (2) și x (3)

x (1)și x (3)

x (1) și x (4)

x (2) și x (4)

Decizie:

La construirea unui model de regresie multiplă, este necesar să se excludă posibilitatea existenței unei relații liniare strânse între variabilele independente (explicate), ceea ce duce la problema multicollinearității. În acest caz, verificați coeficienții corelației liniare pentru fiecare pereche de variabile independente (explicate). Aceste valori sunt reflectate în matricea coeficienților asociați de corelație liniară. Se crede că prezența valorilor coeficienților de corelare a perechilor între variabilele explicative care depășesc valoarea absolută de 0,7, reflectă relația strânsă dintre aceste variabile (urmărirea penală a variabilei y. În acest caz, nu este luat în considerare). Astfel de variabile independente se numesc Collinear. Dacă valoarea coeficientului de corelare a perechilor între variabilele explicative nu depășește 0,7 printr-o valoare absolută, atunci astfel de variabile explicative nu sunt colinear. Luați în considerare valorile coeficienților de perechi de corelație de interfață: între x (1) și x (2) valoare egală cu 0,45; între x (1) și x (3) - egală cu 0,82; între x (1) și x (4) - egală cu 0,94; între x (2) și x (3) - egală cu 0,3; între x (2) și x (4) - egală cu 0,7; între x (3) și x (4) - La fel de 0,12. Astfel, ei nu depășesc 0,7 valori ,. În consecință, Collinear nu suntfactori x (1) și x (2), x (2) și x (3), x (3) și x (4). De la ultimele perechi listate în opțiunile de răspunsuri există un cuplu x (2) și x (3) - Acesta este răspunsul potrivit. Pentru alte perechi: x (1. și x (3), x (1) și x (4), x (2) și x (4) - valorile coeficienților asociați ai corelației interfeței depășesc 0,7, iar acești factori sunt colinear.

Subiect 3: Variabile fictive

1. Tabelul datelor sursă este dat pentru a construi un model de regresie econometric:

Variabile fictive nu sunt

experiență de muncă

productivitatea muncii

nivelul educației

nivelul de calificare al angajaților

Decizie:

La construirea unui model de regresie, poate apărea o situație atunci când este necesar să se includă în ecuația în plus față de variabilele cantitative, reflectând unele atribute (etaj, educație, regiune etc.). Acest tip de variabile de înaltă calitate se numește variabile "fictive" (dummy). Pentru a construi modelul specificat în Configurare, se utilizează variabile fictive: nivelul de educație și nivelul calificării angajaților. Restul variabilelor nu sunt Fictiv, din opțiunile propuse este experiența și productivitatea muncii.

2. În studiul dependenței consumului de carne de la nivelul veniturilor și podeaua consumatorului poate fi recomandată ...

utilizați o variabilă fictivă - etajul consumatorului

împărțiți o totalitate în două: pentru consumatorii de sex feminin și pentru consumatorii de sex masculin

utilizați un nivel fictiv - nivel de venit

eliminați podeaua consumatorului din considerație, deoarece acest factor nu poate fi măsurat cantitativ

Decizie:

La construirea unui model de regresie, poate apărea o situație atunci când este necesar să se includă în ecuația în plus față de variabilele cantitative, reflectând unele atribute (etaj, educație, regiune etc.). Acest tip de variabile de înaltă calitate se numește variabile "fictive" (dummy). Acestea reflectă eterogenitatea agregării statistice studiate și sunt utilizate pentru o mai bună modelare a dependențelor în astfel de obiecte de observare neomogene. Atunci când simulează anumite dependențe în datele neuniforme, este posibilă, de asemenea, utilizarea unei metode de separare a întregului set de date neomogene în mai multe seturi separate, numărul căruia este egal cu numărul de variabilă a stărilor dummy. În acest fel opțiuni corecte Răspunsurile sunt: \u200b\u200b"Utilizați o variabilă fictivă - jumătate a consumatorului" și "împărțiți combinația a două: pentru consumatorii de sex feminin și pentru consumatorii de sex masculin".

3. Dependența de preț a apartamentului este studiată ( w.) Din zona sa de zi ( h.) și tipul de casă. Modelul include variabile fictive care reflectă tipurile de case în cauză: monolit, panou, cărămidă. Ecuația primită:,
Unde ,
Ecuațiile de regresie privată pentru cărămidă și monolitică sunt ...

pentru tipul de cărămidă de acasă

pentru tipul monolitic al casei

pentru tipul de cărămidă de acasă

pentru tipul monolitic al casei

Decizie:

Necesită o ecuație de regresie privată pentru caramida și casele monolitice. Pentru casa de caramida Valorile variabilelor fictive sunt următoarele ,. Ecuația va lua forma: Pentru tipul de cărămidă de acasă.
Pentru o casă monolitică, valorile variabilelor fictive sunt după cum urmează ,. Ecuația va lua vederea
sau Pentru tipul monolitic al casei.