Vastakkainen haku on etsintä, jossa tutkimme ongelmaa, joka syntyy, kun yritämme suunnitella maailmaa edellä ja muut agentit suunnittelevat meitä vastaan.
- Aiemmissa aiheissa olemme tutkineet hakustrategioita, jotka liittyvät vain yhteen agenttiin, joka pyrkii löytämään ratkaisun, joka usein ilmaistaan toimintosarjan muodossa.
- Mutta voi olla tilanteita, joissa useampi kuin yksi agentti etsii ratkaisua samassa hakutilassa, ja tämä tilanne tapahtuu yleensä pelien pelaamisessa.
- Ympäristöä, jossa on useampi kuin yksi tekijä, kutsutaan nimellä monen agentin ympäristö , jossa jokainen agentti on toisen agentin vastustaja ja pelaa toisiaan vastaan. Jokaisen edustajan on otettava huomioon toisen toimijan toiminta ja sen vaikutus heidän suoritukseensa.
- Niin, Hakuja, joissa kaksi tai useampi pelaaja, joilla on ristiriitaiset tavoitteet, yrittää tutkia samaa hakualuetta ratkaisua varten, kutsutaan kontradiktorisiksi hauiksi, joita kutsutaan usein peleiksi. .
- Pelit on mallinnettu hakuongelmana ja heuristisena arviointifunktiona, ja nämä ovat kaksi päätekijää, jotka auttavat mallintamaan ja ratkaisemaan pelejä tekoälyssä.
Pelityypit tekoälyssä:
Deterministinen | Chance Moves | |
---|---|---|
Täydellistä tietoa | Shakki, tammi, mene, Othello | Backgammon, monopoli |
Epätäydellistä tietoa | Taistelulaivoja, sokeita, tic-tac-toe | Bridge, pokeri, scrabble, ydinsota |
Esimerkki: Backgammon, Monopoli, Pokeri jne.
Huomautus: Tässä aiheessa käsitellään deterministisiä pelejä, täysin havaittavissa olevaa ympäristöä, nollasummaa ja sitä, missä kukin agentti toimii vuorotellen.
Nollasummapeli
- Nollasummapelit ovat kontradiktorista hakua, johon liittyy puhdasta kilpailua.
- Nollasummapelissä jokaisen agentin hyöty tai menetys on täsmälleen tasapainotettu toisen agentin hyötyjen tai hyötyjen kanssa.
- Yksi pelin pelaaja yrittää maksimoida yhden arvon, kun taas toinen pelaaja yrittää minimoida sen.
- Jokaista yhden pelaajan siirtoa pelissä kutsutaan plyksi.
- Shakki ja tic-tac-toe ovat esimerkkejä nollasummapeleistä.
Nollasummapeli: sulautettu ajattelu
Nollasummapeli sisälsi sulautetun ajattelun, jossa yksi agentti tai pelaaja yrittää selvittää:
- Mitä tehdä.
- Kuinka päättää muutto
- Pitää ajatella myös vastustajaansa
- Vastustaja miettii myös mitä tehdä
Jokainen pelaaja yrittää selvittää vastustajansa vastauksen heidän toimintaansa. Tämä vaatii sulautettua ajattelua tai taaksepäin ajattelua peliongelmien ratkaisemiseksi tekoälyssä.
Ongelman virallistaminen:
Peli voidaan määritellä tekoälyn haun tyypiksi, joka voidaan muotoilla seuraavista elementeistä:
Pelipuu:
Pelipuu on puu, jossa puun solmut ovat pelin tiloja ja puun reunat ovat pelaajien liikkeet. Pelipuu sisältää alkutilan, toimintatoiminnon ja tulosfunktion.
Esimerkki: Tic-Tac-Toe pelipuu:
virhe: pääluokkaa ei löytynyt tai ladata
Seuraava kuva esittää osaa tic-tac-toe-pelin pelipuusta. Seuraavassa on joitain pelin avainkohtia:
- Pelaajia on kaksi MAX ja MIN.
- Pelaajilla on vaihtoehtoinen vuoro, ja he aloittavat MAX:lla.
- MAX maksimoi pelipuun tuloksen
- MIN minimoi tuloksen.
Esimerkki selitys:
- Alkutilasta lähtien MAXilla on 9 mahdollista liikettä, kun hän aloittaa ensimmäisenä. MAX paikka x ja MIN paikka o, ja molemmat pelaajat pelaavat vuorotellen, kunnes saavutamme lehtisolmun, jossa yhdellä pelaajalla on kolme peräkkäin tai kaikki ruudut ovat täynnä.
- Molemmat pelaajat laskevat kunkin solmun, minimaxin, minimax-arvon, joka on paras saavutettavissa oleva apuohjelma optimaalista vastustajaa vastaan.
- Oletetaan, että molemmat pelaajat ovat hyvin tietoisia tic-tac-toe-pelistä ja pelaavat parasta peliä. Jokainen pelaaja tekee parhaansa estääkseen toista voittamasta. MIN toimii Maxia vastaan pelissä.
- Joten pelipuussa meillä on kerros Max, kerros MIN, ja jokaista kerrosta kutsutaan nimellä Ply . Max paikka x, sitten MIN laittaa o:n estääkseen Maxia voittamasta, ja tämä peli jatkuu terminaalisolmuun asti.
- Tässä joko MIN voittaa, MAX voittaa tai se on tasapeli. Tämä pelipuu on koko mahdollisuuksien hakuavaruus, jossa MIN ja MAX pelaavat tiikkiä vuorotellen.
Tästä syystä minimax-menettelyn kontradiktorinen haku toimii seuraavasti:
- Sen tavoitteena on löytää optimaalinen strategia, jolla MAX voi voittaa pelin.
- Se noudattaa Depth-first-haun lähestymistapaa.
- Pelipuussa optimaalinen lehtisolmu voi esiintyä missä tahansa puun syvyydessä.
- Levitä minimax-arvoja puuhun, kunnes päätesolmu havaitaan.
Tietyssä pelipuussa optimaalinen strategia voidaan määrittää kunkin solmun minimax-arvosta, joka voidaan kirjoittaa muodossa MINIMAX(n). MAX mieluummin siirtyy maksimiarvon tilaan ja MIN mieluummin pienimmän arvon tilaan, sitten: