logo

Kovarianssimatriisi

Kovarianssimatriisi on eräänlainen matriisi, jota käytetään kuvaamaan kovarianssiarvoja kahden satunnaisvektorin kohteen välillä. Se tunnetaan myös varianssi-kovarianssimatriisina, koska kunkin elementin varianssi on esitetty matriisin päädiagonaalia pitkin ja kovarianssi on edustettuna ei-diagonaalisten elementtien joukossa. Kovarianssimatriisi on yleensä neliömatriisi. Se on myös positiivinen puolimääräinen ja symmetrinen. Tämä matriisi on hyödyllinen, kun on kyse stokastisesta mallintamisesta ja pääkomponenttianalyysistä.

Mikä on kovarianssimatriisi?

The varianssi -kovarianssimatriisi on a neliömatriisi diagonaalielementeillä, jotka edustavat varianssia, ja ei-diagonaalisilla komponenteilla, jotka ilmaisevat kovarianssia. Muuttujan kovarianssi voi olla mikä tahansa reaaliarvo - positiivinen, negatiivinen tai nolla. Positiivinen kovarianssi viittaa siihen, että näillä kahdella muuttujalla on positiivinen suhde, kun taas negatiivinen kovarianssi osoittaa, että niillä ei ole. Jos kaksi elementtiä eivät vaihtele yhdessä, niillä on nolla kovarianssi.



Lisätietoja, Diagonaalinen matriisi

Esimerkki kovarianssimatriisista

Oletetaan, että on 2 tietojoukkoa X = [10, 5] ja Y = [3, 9]. Joukon X varianssi = 12,5 ja joukon Y varianssi = 18. Molempien muuttujien välinen kovarianssi on -15. Kovarianssimatriisi on seuraava:

egin{bmatrix} Variance~of~Set~X & Coorelation~of~Both~Sets Coorelation~of~Both~Sets& Variance~of~Set~Y end{bmatrix}=egin{bmatrix} 12.5 & -15 -15& 18 end{bmatrix}

Kovarianssimatriisikaava

Kovarianssimatriisin yleinen muoto annetaan seuraavasti:

Kovarianssimatriisi

missä,

  • Näytevarianssi: missä (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}
  • Näyte kovarinace: (x1, ja1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Väestön varianssi: missä (xn) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Populaatiokovarianssi: (xn, jan) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

Tässä, m on väestön keskiarvo

overline x on näytteen keskiarvo

n on havainnon määrä

x i on havainto tietojoukossa x

Katsotaanpa kovarianssimatriisin muotoa 2 ⨯ 2 ja 3 ⨯ 3

2 2 Kovarianssimatriisi

Tiedämme, että 2⨯ 2:ssa matriisi on kaksi riviä ja kaksi saraketta. Näin ollen 2 ⨯ 2 -kovarianssimatriisi voidaan ilmaista muodossaegin{bmatrix}mathrm{var(x)}& mathrm{cov(x,y)} \mathrm{cov(x,y)} &mathrm{var(y)}end{bmatrix}

3 3 Kovarianssimatriisi

3⨯3-matriisissa on 3 riviä ja 3 saraketta. Tiedämme, että kovarianssimatriisissa diagonaaliset elementit ovat varianssia ja ei-diagonaaliset elementit ovat kovarianssia. Näin ollen 3⨯3 kovarianssimatriisi voidaan antaa muodossaegin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

Kuinka löytää kovarianssimatriisi?

Kovarianssimatriisin mitat määräytyvät tietyn tietojoukon muuttujien lukumäärän mukaan. Jos joukossa on vain kaksi muuttujaa, kovarianssimatriisissa olisi kaksi riviä ja kaksi saraketta. Vastaavasti, jos tietojoukossa on kolme muuttujaa, sen kovarianssimatriisissa olisi kolme riviä ja kolme saraketta.

Tiedot koskevat Annan, Carolinen ja Lauran psykologiassa ja historiassa antamia arvosanoja. Tee kovarianssimatriisi.

Opiskelija Psykologia (X) Historia (Y)
Anna 80 70
Caroline 63 kaksikymmentä
Laura 100 viisikymmentä

Seuraavia vaiheita on noudatettava:

Vaihe 1: Laske muuttujan X keskiarvo. Summaa kaikki muuttujan X havainnot ja jaa saatu summa termien lukumäärällä. Näin ollen (80 + 63 + 100)/3 = 81.

Vaihe 2: Vähennä keskiarvo kaikista havainnoista. (80 – 81), (63 – 81), (100 – 81).

Vaihe 3: Ota edellä saatujen erojen neliöt ja laske ne sitten yhteen. Näin ollen (80-81)2+ (63–81)2+ (100–81)2.

Vaihe 4: Etsi X:n varianssi jakamalla vaiheessa 3 saatu arvo 1:llä pienemmällä määrällä kuin havaintojen kokonaismäärä. var(X) = [(80 - 81)2+ (63–81)2+ (100–81)2] / (3–1) = 343.

Vaihe 5: Toista samalla tavalla vaiheet 1–4 laskeaksesi Y:n varianssin. Var(Y) = 633.

Vaihe 6: Valitse muuttujapari.

Vaihe 7: Vähennä ensimmäisen muuttujan (X) keskiarvo kaikista havainnoista; (80 – 81), (63 – 81), (100 – 81).

Vaihe 8: Toista sama muuttujalle Y; (70 – 47), (20 – 47), (50 – 47).

Vaihe 9: Kerro vastaavat termit: (80 – 81)(70 – 47), (63 – 81)(20 – 47), (100 – 81)(50 – 47).

Vaihe 10: Etsi kovarianssi lisäämällä nämä arvot ja jakamalla ne arvolla (n – 1). Cov(X, Y) = (80-81)(70-47) + (63-81)(20-47) + (100-81)(50-47)/3-1 = 481.

Vaihe 11: Järjestä termit käyttämällä kovarianssimatriisin yleiskaavaa. Matriisista tulee:egin{bmatrix} 343 & 481 481& 633 end{bmatrix}

Kovarianssimatriisin ominaisuudet

Kovarianssimatriisin ominaisuudet mainitaan alla:

  • Kovarianssimatriisi on aina neliö, mikä tarkoittaa, että kovarianssimatriisin rivien määrä on aina yhtä suuri kuin siinä olevien sarakkeiden lukumäärä.
  • Kovarianssimatriisi on aina symmetrinen, mikä tarkoittaa, että transponoida kovarianssimatriisin arvo on aina yhtä suuri kuin alkuperäinen matriisi.
  • Kovarianssimatriisi on aina positiivinen ja puolivarma.
  • The ominaisarvot kovarianssimatriisin arvot ovat aina reaalisia ja ei-negatiivisia.

Lue lisää,

  • Matriisityypit
  • Matriisin kertolasku
  • Varianssi ja keskihajonta

Ratkaistut esimerkit kovarianssimatriisista

Esimerkki 1: Kolmen fysiikan ja biologian opiskelijan pisteet ovat alla:

OpiskelijaFysiikka (X)Biologia (Y)
A 92 80
B 60 30
C 100 70

Laske kovarianssimatriisi yllä olevista tiedoista.

Ratkaisu:

Näytekovarianssimatriisi on annettu kaavallafrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

Tässä, μx= 84, n = 3

var(x) = [(92 - 84)2+ (60–84)2+ (100 – 84)2] / (3–1) = 448

Joten, μja= 60, n = 3

var(y) = [(80 - 60)2+ (30–60)2+ (70–60)2] / (3–1) = 700

arraylist lajiteltu

Nyt cov(x, y) = cov(y, x) = [(92 - 84) (80 - 60) + (60 - 84) (30 - 60) + (100 - 84) (70 - 60)] / (3–1) = 520.

Populaatiokovarianssimatriisi esitetään seuraavasti:egin{bmatrix} 448 & 520 520& 700 end{bmatrix}

Esimerkki 2. Valmistele populaatiokovarianssimatriisi seuraavasta taulukosta:

IkäHenkilöiden määrä
29 68
26 60
30 58
35 40

Ratkaisu:

Populaatiovarianssi saadaan kaavallafrac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} .

Tässä, μx= 56,5, n = 4

var(x) = [(68 - 56,5)2+ (60 – 56,5)2+ (58 – 56,5)2+ (40 – 56,5)2] / 4 = 104,75

Joten, μja= 30, n = 4

var(y) = [(29–30)2+ (26–30)2+ (30–30)2+ (35–30)2] / 4 = 10,5

Nyt cov(x, y) =frac{sum_{1}^{4}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{4}

cov(x, y) = -27

Populaatiokovarianssimatriisi esitetään seuraavasti: egin{bmatrix} 104.7 &-27 -27& 10.5 end{bmatrix}

Esimerkki 3. Tulkitse seuraava kovarianssimatriisi:

egin{bmatrix} & X & Y & Z X & 60 & 32 & -4 Y & 32 & 30 & 0 Z & -4 & 0 & 80 end{bmatrix}

Ratkaisu:

  1. Diagonaaliset elementit 60, 30 ja 80 osoittavat varianssia tietosarjoissa X, Y ja Z vastaavasti. Y näyttää pienimmän varianssin, kun taas Z näyttää suurimman varianssin.
  2. X:n ja Y:n kovarianssi on 32. Koska tämä on positiivinen luku, se tarkoittaa, että kun X kasvaa (tai pienenee), myös Y kasvaa (tai pienenee)
  3. X:n ja Z:n kovarianssi on -4. Koska se on negatiivinen luku, se tarkoittaa, että kun X kasvaa, Z pienenee ja päinvastoin.
  4. Y:n ja Z:n kovarianssi on 0. Tämä tarkoittaa, että näiden kahden tietojoukon välillä ei ole ennustettavaa suhdetta.

Esimerkki 4. Etsi näytekovarianssimatriisi seuraaville tiedoille:

XJAKANSSA
75 10.5 Neljä viisi
65 12.8 65
22 7.3 74
viisitoista 2.1 76
18 9.2 56

Ratkaisu:

Näytekovarianssimatriisi on annettu kaavallafrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

n = 5, mx= 22,4, var(X) = 321,2 / (5–1) = 80,3

mja= 12,58, var(Y) = 132,148 / 4 = 33,037

mKanssa= 64, var(Z) = 570/4 = 142,5

cov(X, Y) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( y_{i}-12.58 ight ) }{5-1} = -11.76

cov(X, Z) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( z_{i}-64 ight ) }{5-1} = 34.97

cov(Y, Z) = frac{sum_{1}^{5}left ( y_{i} -12.58 ight )left ( z_{i}-64 ight ) }{5-1} = -40.87

Kovarianssimatriisi esitetään seuraavasti:

egin{bmatrix} 80.3 & -13.865 &14.25 -13.865 & 33.037 & -39.5250 14.25 & -39.5250 & 142.5 end{bmatrix}

Usein kysytyt kysymykset kovarianssimatriisista

1. Määrittele kovarianssimatriisi

Kovarianssimatriisi on eräänlainen matriisi, jota käytetään kuvaamaan kovarianssiarvoja kahden satunnaisvektorin kohteen välillä.

2. Mikä on kovarianssimatriisin kaava?

Kovarianssimatriisin kaava on annettu muodossa

left[egin{array}{ccc} operatorname{Var}left(x_1 ight) & ldots ldots & operatorname{Cov}left(x_n, x_1 ight) vdots & ldots & vdots vdots & ldots & vdots operatorname{Cov}left(x_n, x_1 ight) & ldots ldots & operatorname{Var}left(x_n ight) end{array} ight]

Missä, Näytevarianssi: missä (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}

  • Kovarinaksen näyte: (x1, ja1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Väestön varianssi: missä (xn) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Populaatiokovarianssi: (xn, jan) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

3. Mikä on 3 ⨯ 3 kovarianssimatriisin yleinen muoto?

Kovarianssimatriisin 3 ⨯ 3 yleinen muoto annetaan seuraavasti:

egin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

4. Mitkä ovat kovarianssimatriisin ominaisuudet?

Kovarianssimatriisi on neliömatriisi ja se on myös luonteeltaan symmetrinen, eli alkuperäisen matriisin transponointi antaa itse alkuperäisen matriisin

5. Mitkä ovat ne sektorit, joilla kovarianssimatriisia voidaan käyttää?

Kovarianssimatriisia käytetään matematiikan, koneoppimisen, rahoituksen ja taloustieteen aloilla. Kovarianssimatriisia käytetään Cholskey Decomposition -ohjelmassa suorittamaan Monte Carlo -simulaatiota, jota käytetään matemaattisten mallien luomiseen.