Kovarianssimatriisi on eräänlainen matriisi, jota käytetään kuvaamaan kovarianssiarvoja kahden satunnaisvektorin kohteen välillä. Se tunnetaan myös varianssi-kovarianssimatriisina, koska kunkin elementin varianssi on esitetty matriisin päädiagonaalia pitkin ja kovarianssi on edustettuna ei-diagonaalisten elementtien joukossa. Kovarianssimatriisi on yleensä neliömatriisi. Se on myös positiivinen puolimääräinen ja symmetrinen. Tämä matriisi on hyödyllinen, kun on kyse stokastisesta mallintamisesta ja pääkomponenttianalyysistä.
Mikä on kovarianssimatriisi?
The varianssi -kovarianssimatriisi on a neliömatriisi diagonaalielementeillä, jotka edustavat varianssia, ja ei-diagonaalisilla komponenteilla, jotka ilmaisevat kovarianssia. Muuttujan kovarianssi voi olla mikä tahansa reaaliarvo - positiivinen, negatiivinen tai nolla. Positiivinen kovarianssi viittaa siihen, että näillä kahdella muuttujalla on positiivinen suhde, kun taas negatiivinen kovarianssi osoittaa, että niillä ei ole. Jos kaksi elementtiä eivät vaihtele yhdessä, niillä on nolla kovarianssi.
Lisätietoja, Diagonaalinen matriisi
Esimerkki kovarianssimatriisista
Oletetaan, että on 2 tietojoukkoa X = [10, 5] ja Y = [3, 9]. Joukon X varianssi = 12,5 ja joukon Y varianssi = 18. Molempien muuttujien välinen kovarianssi on -15. Kovarianssimatriisi on seuraava:
Kovarianssimatriisikaava
Kovarianssimatriisin yleinen muoto annetaan seuraavasti:
missä,
- Näytevarianssi: missä (x1) =
frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} - Näyte kovarinace: (x1, ja1) =
frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1} - Väestön varianssi: missä (xn) =
frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} - Populaatiokovarianssi: (xn, jan) =
frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}
Tässä, m on väestön keskiarvo
n on havainnon määrä
x i on havainto tietojoukossa x
Katsotaanpa kovarianssimatriisin muotoa 2 ⨯ 2 ja 3 ⨯ 3
2 ⨯ 2 Kovarianssimatriisi
Tiedämme, että 2⨯ 2:ssa matriisi on kaksi riviä ja kaksi saraketta. Näin ollen 2 ⨯ 2 -kovarianssimatriisi voidaan ilmaista muodossa
3 ⨯ 3 Kovarianssimatriisi
3⨯3-matriisissa on 3 riviä ja 3 saraketta. Tiedämme, että kovarianssimatriisissa diagonaaliset elementit ovat varianssia ja ei-diagonaaliset elementit ovat kovarianssia. Näin ollen 3⨯3 kovarianssimatriisi voidaan antaa muodossa
Kuinka löytää kovarianssimatriisi?
Kovarianssimatriisin mitat määräytyvät tietyn tietojoukon muuttujien lukumäärän mukaan. Jos joukossa on vain kaksi muuttujaa, kovarianssimatriisissa olisi kaksi riviä ja kaksi saraketta. Vastaavasti, jos tietojoukossa on kolme muuttujaa, sen kovarianssimatriisissa olisi kolme riviä ja kolme saraketta.
Tiedot koskevat Annan, Carolinen ja Lauran psykologiassa ja historiassa antamia arvosanoja. Tee kovarianssimatriisi.
Opiskelija | Psykologia (X) | Historia (Y) |
---|---|---|
Anna | 80 | 70 |
Caroline | 63 | kaksikymmentä |
Laura | 100 | viisikymmentä |
Seuraavia vaiheita on noudatettava:
Vaihe 1: Laske muuttujan X keskiarvo. Summaa kaikki muuttujan X havainnot ja jaa saatu summa termien lukumäärällä. Näin ollen (80 + 63 + 100)/3 = 81.
Vaihe 2: Vähennä keskiarvo kaikista havainnoista. (80 – 81), (63 – 81), (100 – 81).
Vaihe 3: Ota edellä saatujen erojen neliöt ja laske ne sitten yhteen. Näin ollen (80-81)2+ (63–81)2+ (100–81)2.
Vaihe 4: Etsi X:n varianssi jakamalla vaiheessa 3 saatu arvo 1:llä pienemmällä määrällä kuin havaintojen kokonaismäärä. var(X) = [(80 - 81)2+ (63–81)2+ (100–81)2] / (3–1) = 343.
Vaihe 5: Toista samalla tavalla vaiheet 1–4 laskeaksesi Y:n varianssin. Var(Y) = 633.
Vaihe 6: Valitse muuttujapari.
Vaihe 7: Vähennä ensimmäisen muuttujan (X) keskiarvo kaikista havainnoista; (80 – 81), (63 – 81), (100 – 81).
Vaihe 8: Toista sama muuttujalle Y; (70 – 47), (20 – 47), (50 – 47).
Vaihe 9: Kerro vastaavat termit: (80 – 81)(70 – 47), (63 – 81)(20 – 47), (100 – 81)(50 – 47).
Vaihe 10: Etsi kovarianssi lisäämällä nämä arvot ja jakamalla ne arvolla (n – 1). Cov(X, Y) = (80-81)(70-47) + (63-81)(20-47) + (100-81)(50-47)/3-1 = 481.
Vaihe 11: Järjestä termit käyttämällä kovarianssimatriisin yleiskaavaa. Matriisista tulee:
Kovarianssimatriisin ominaisuudet
Kovarianssimatriisin ominaisuudet mainitaan alla:
- Kovarianssimatriisi on aina neliö, mikä tarkoittaa, että kovarianssimatriisin rivien määrä on aina yhtä suuri kuin siinä olevien sarakkeiden lukumäärä.
- Kovarianssimatriisi on aina symmetrinen, mikä tarkoittaa, että transponoida kovarianssimatriisin arvo on aina yhtä suuri kuin alkuperäinen matriisi.
- Kovarianssimatriisi on aina positiivinen ja puolivarma.
- The ominaisarvot kovarianssimatriisin arvot ovat aina reaalisia ja ei-negatiivisia.
Lue lisää,
- Matriisityypit
- Matriisin kertolasku
- Varianssi ja keskihajonta
Ratkaistut esimerkit kovarianssimatriisista
Esimerkki 1: Kolmen fysiikan ja biologian opiskelijan pisteet ovat alla:
Opiskelija | Fysiikka (X) | Biologia (Y) |
---|---|---|
A | 92 | 80 |
B | 60 | 30 |
C | 100 | 70 |
Laske kovarianssimatriisi yllä olevista tiedoista.
Ratkaisu:
Näytekovarianssimatriisi on annettu kaavalla
frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .Tässä, μx= 84, n = 3
var(x) = [(92 - 84)2+ (60–84)2+ (100 – 84)2] / (3–1) = 448
Joten, μja= 60, n = 3
var(y) = [(80 - 60)2+ (30–60)2+ (70–60)2] / (3–1) = 700
arraylist lajiteltuNyt cov(x, y) = cov(y, x) = [(92 - 84) (80 - 60) + (60 - 84) (30 - 60) + (100 - 84) (70 - 60)] / (3–1) = 520.
Populaatiokovarianssimatriisi esitetään seuraavasti:
egin{bmatrix} 448 & 520 520& 700 end{bmatrix}
Esimerkki 2. Valmistele populaatiokovarianssimatriisi seuraavasta taulukosta:
Ikä | Henkilöiden määrä |
---|---|
29 | 68 |
26 | 60 |
30 | 58 |
35 | 40 |
Ratkaisu:
Populaatiovarianssi saadaan kaavalla
frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} .Tässä, μx= 56,5, n = 4
var(x) = [(68 - 56,5)2+ (60 – 56,5)2+ (58 – 56,5)2+ (40 – 56,5)2] / 4 = 104,75
Joten, μja= 30, n = 4
var(y) = [(29–30)2+ (26–30)2+ (30–30)2+ (35–30)2] / 4 = 10,5
Nyt cov(x, y) =
frac{sum_{1}^{4}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{4} cov(x, y) = -27
Populaatiokovarianssimatriisi esitetään seuraavasti:
egin{bmatrix} 104.7 &-27 -27& 10.5 end{bmatrix}
Esimerkki 3. Tulkitse seuraava kovarianssimatriisi:
Ratkaisu:
- Diagonaaliset elementit 60, 30 ja 80 osoittavat varianssia tietosarjoissa X, Y ja Z vastaavasti. Y näyttää pienimmän varianssin, kun taas Z näyttää suurimman varianssin.
- X:n ja Y:n kovarianssi on 32. Koska tämä on positiivinen luku, se tarkoittaa, että kun X kasvaa (tai pienenee), myös Y kasvaa (tai pienenee)
- X:n ja Z:n kovarianssi on -4. Koska se on negatiivinen luku, se tarkoittaa, että kun X kasvaa, Z pienenee ja päinvastoin.
- Y:n ja Z:n kovarianssi on 0. Tämä tarkoittaa, että näiden kahden tietojoukon välillä ei ole ennustettavaa suhdetta.
Esimerkki 4. Etsi näytekovarianssimatriisi seuraaville tiedoille:
X | JA | KANSSA |
---|---|---|
75 | 10.5 | Neljä viisi |
65 | 12.8 | 65 |
22 | 7.3 | 74 |
viisitoista | 2.1 | 76 |
18 | 9.2 | 56 |
Ratkaisu:
Näytekovarianssimatriisi on annettu kaavalla
frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .n = 5, mx= 22,4, var(X) = 321,2 / (5–1) = 80,3
mja= 12,58, var(Y) = 132,148 / 4 = 33,037
mKanssa= 64, var(Z) = 570/4 = 142,5
cov(X, Y) =
frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( y_{i}-12.58 ight ) }{5-1} = -11.76 cov(X, Z) =
frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( z_{i}-64 ight ) }{5-1} = 34.97 cov(Y, Z) =
frac{sum_{1}^{5}left ( y_{i} -12.58 ight )left ( z_{i}-64 ight ) }{5-1} = -40.87 Kovarianssimatriisi esitetään seuraavasti:
egin{bmatrix} 80.3 & -13.865 &14.25 -13.865 & 33.037 & -39.5250 14.25 & -39.5250 & 142.5 end{bmatrix}
Usein kysytyt kysymykset kovarianssimatriisista
1. Määrittele kovarianssimatriisi
Kovarianssimatriisi on eräänlainen matriisi, jota käytetään kuvaamaan kovarianssiarvoja kahden satunnaisvektorin kohteen välillä.
2. Mikä on kovarianssimatriisin kaava?
Kovarianssimatriisin kaava on annettu muodossa
left[egin{array}{ccc} operatorname{Var}left(x_1 ight) & ldots ldots & operatorname{Cov}left(x_n, x_1 ight) vdots & ldots & vdots vdots & ldots & vdots operatorname{Cov}left(x_n, x_1 ight) & ldots ldots & operatorname{Var}left(x_n ight) end{array} ight] Missä, Näytevarianssi: missä (x1) =
frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}
- Kovarinaksen näyte: (x1, ja1) =
frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1} - Väestön varianssi: missä (xn) =
frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} - Populaatiokovarianssi: (xn, jan) =
frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}
3. Mikä on 3 ⨯ 3 kovarianssimatriisin yleinen muoto?
Kovarianssimatriisin 3 ⨯ 3 yleinen muoto annetaan seuraavasti:
egin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}
4. Mitkä ovat kovarianssimatriisin ominaisuudet?
Kovarianssimatriisi on neliömatriisi ja se on myös luonteeltaan symmetrinen, eli alkuperäisen matriisin transponointi antaa itse alkuperäisen matriisin
5. Mitkä ovat ne sektorit, joilla kovarianssimatriisia voidaan käyttää?
Kovarianssimatriisia käytetään matematiikan, koneoppimisen, rahoituksen ja taloustieteen aloilla. Kovarianssimatriisia käytetään Cholskey Decomposition -ohjelmassa suorittamaan Monte Carlo -simulaatiota, jota käytetään matemaattisten mallien luomiseen.