Soar (kognitiivinen arkkitehtuuri) - Soar (cognitive architecture)

Liidellä on kognitiivinen arkkitehtuuri , loi alunperin John Laird , Allen Newell ja Paul Rosenbloom klo Carnegie Mellon University . (Rosenbloom jatkoi apututkijana siirtyessään Stanfordin yliopistoon , sitten Etelä-Kalifornian yliopiston tietotieteelliseen instituuttiin.) Sitä ylläpitää ja kehittää nyt John Lairdin tutkimusryhmä Michiganin yliopistossa .

Soar -projektin tavoitteena on kehittää kiinteitä laskennallisia rakennuspalikoita, joita tarvitaan yleisille älykkäille agenteille - agenteille, jotka pystyvät suorittamaan laajan valikoiman tehtäviä ja koodaamaan, käyttämään ja oppimaan kaikenlaista tietoa toteuttaakseen kaikki kognitiiviset ominaisuudet ihmiset, kuten päätöksenteko, ongelmanratkaisu, suunnittelu ja luonnollisen kielen ymmärtäminen. Se on sekä teoria siitä, mitä kognitio on, että sen teorian laskennallinen toteutus. Sen perustamisesta lähtien vuonna 1983 John Lairdin väitöskirjana AI -tutkijat ovat käyttäneet sitä laajalti älykkäiden agenttien ja kognitiivisten mallien luomiseen ihmisen käyttäytymisen eri puolilta . Ajankohtaisin ja kattavin kuvaus Soarista on vuoden 2012 kirja The Soar Cognitive Architecture.

Teoria

Soar ilmentää useita hypoteeseja yleisen älykkyyden taustalla olevista laskentarakenteista , joista monet on jaettu muiden kognitiivisten arkkitehtuurien kanssa, mukaan lukien ACT-R , jonka loi John R.Anderson , ja LIDA , jonka loi Stan Franklin . Viime aikoina Soarin painopiste on ollut yleisessä tekoälyssä (toiminnallisuus ja tehokkuus), kun taas ACT-R on korostunut aina kognitiivisessa mallinnuksessa (ihmisen kognition yksityiskohtainen mallinnus).

Alkuperäinen Soorin taustalla oleva kognitioteoria on ongelma -tilan hypoteesi, joka on kuvattu Allen Newellin kirjassa Unified Theories of Cognition . ja juontaa juurensa yhteen ensimmäisistä luoduista tekoälyjärjestelmistä, Newell, Simon ja Shaw 's Logic Theorist , joka esiteltiin ensimmäisen kerran vuonna 1955. Ongelma-avaruushypoteesi väittää, että kaikki päämäärätietoinen käyttäytyminen voidaan hakea mahdollisten tilojen tilan kautta ( ongelma -alue ), kun yritetään saavuttaa tavoite. Jokaisessa vaiheessa valitaan yksi operaattori ja sitä sovelletaan sitten agentin nykyiseen tilaan, mikä voi johtaa sisäisiin muutoksiin, kuten tiedon hakemiseen pitkäaikaisesta muistista tai muokkauksista tai ulkoisista toimista maailmassa. (Soarin nimi on johdettu tästä peruskierrosta tilasta, operaattori ja tulos; sitä ei kuitenkaan enää pidetä lyhenteenä.) Ongelma -tilan hypoteesille on ominaista, että kaikki käyttäytyminen, jopa monimutkainen toiminta, kuten suunnittelu, on hajoavaa primitiivisten operaattoreiden valinta- ja sovellusjaksoon, joka ihmisen käyttäytymiseen kartoitettuna kestää ~ 50 ms.

Toinen Soarin teorian hypoteesi on, että vaikka vain yksi operaattori voidaan valita kussakin vaiheessa pakottaakseen sarjan pullonkaulan, valinta- ja sovellusprosessit toteutetaan rinnakkaisten sääntöjen laukaisujen avulla, jotka tarjoavat asiayhteydestä riippuvaisen prosessitiedon haun.

Kolmas hypoteesi on, että jos tieto operaattorin valitsemisesta tai soveltamisesta on puutteellista tai epävarmaa, syntyy umpikuja ja arkkitehtuuri luo automaattisesti aliaseman. Alaosassa samaa ongelmanratkaisuprosessia käytetään rekursiivisesti, mutta tavoitteena on noutaa tai löytää tietoa, jotta päätöksenteko voi jatkua. Tämä voi johtaa pinoon aliaineita, joissa syntyy luonnollisesti perinteisiä ongelmamenetelmiä, kuten suunnittelu tai hierarkkinen tehtävien hajottaminen . Kun ala -asemaan luodut tulokset ratkaisevat umpikujan, alusta ja siihen liittyvät rakenteet poistetaan. Yleistä lähestymistapaa kutsutaan nimellä Universal Subgoaling.

Nämä oletukset johtavat arkkitehtuuriin, joka tukee kolmea käsittelytasoa. Alimmalla tasolla on alhaalta ylöspäin suuntautuva, rinnakkainen ja automaattinen käsittely. Seuraava taso on harkitseva taso, jossa ensimmäisen tason tietämystä käytetään ehdottaa, valita ja soveltaa yhtä toimenpidettä. Nämä kaksi tasoa toteuttavat nopeaa, taitavaa käyttäytymistä ja vastaavat suunnilleen Kahnemanin System 1 -käsittelytasoa. Monimutkaisempi käyttäytyminen syntyy automaattisesti, kun tieto on epätäydellistä tai epävarmaa, kolmannen käsittelytason avulla, jossa käytetään alustoja, jotka vastaavat suunnilleen järjestelmää 2.

Neljäs Soarin hypoteesi on, että taustalla oleva rakenne on modulaarinen, mutta ei tehtävä- tai valmiuspohjaisten moduulien, kuten suunnittelun tai kielen suhteen, vaan sen sijaan tehtävistä riippumattomia moduuleja, mukaan lukien: päätöksentekomoduuli; muistimoduulit (lyhytaikaiset tila-/visuaaliset ja työmuistit; pitkäaikaiset prosessuaaliset, deklaratiiviset ja episodiset muistit), kaikkiin pitkäaikaisiin muistiin liittyvät oppimismekanismit; ja havainto- ja moottorimoduulit. Näiden muistien erityisominaisuuksista on myös muita oletuksia, joita kuvataan jäljempänä, mukaan lukien kaikki oppiminen verkossa ja inkrementaalinen.

Viides hypoteesi on, että muistielementit (paitsi tila-/visuaalimuistissa olevat) esitetään symbolisina suhteellisina rakenteina. Hypoteesi siitä, että symbolinen järjestelmä on välttämätön yleiselle älykkyydelle, tunnetaan fyysisen symbolijärjestelmän hypoteesina . Tärkeä kehitys Soarissa on se, että kaikkiin symbolisiin rakenteisiin on liitetty tilastolliset metatiedot (kuten tiedot viimeaikaisuudesta ja käyttötiheydestä tai odotettu tuleva palkkio), joka vaikuttaa symbolisten rakenteiden hakemiseen, ylläpitoon ja oppimiseen.

Arkkitehtuuri

Käsittelyjakso - päätöksentekomenettely

Soarin pääkäsittelyjakso syntyy prosessimuistin (sen tietämys asioiden tekemisestä) ja työmuistin (sen edustus nykyisestä tilanteesta) välisestä vuorovaikutuksesta, joka tukee operaattoreiden valintaa ja soveltamista. Työmuistissa oleva tieto esitetään symbolisena kuvaajarakenteena , joka on juurtunut tilaan. Prosessimuistissa oleva tieto esitetään ikään kuin sitten -säännöinä (ehto- ja toimenpidejoukkoina), joita jatkuvasti verrataan työmuistin sisältöön. Kun säännön ehdot vastaavat työmuistin rakenteita, se laukaisee ja suorittaa toimintansa. Tätä sääntöjen ja työmuistin yhdistelmää kutsutaan myös tuotantojärjestelmäksi . Toisin kuin useimmat tuotantojärjestelmät, Soarissa kaikki vastaavat säännöt toimivat samanaikaisesti.

Sen sijaan, että yhden säännön valinta olisi päätöksenteon ydin, Soarin päätöksenteko tapahtuu toimijoiden valinnan ja sovellusten kautta , joita ehdotetaan, arvioidaan ja sovelletaan sääntöjen mukaisesti. Käyttäjää ehdotetaan säännöillä, joilla testataan nykyinen tila ja luodaan edustus operaattorista työmuistiin sekä hyväksyttävä asetus , joka osoittaa, että operaattoria tulee harkita valinnassa ja käytössä. Lisäsäännöt vastaavat ehdotettua operaattoria ja luovat lisäasetuksia, jotka vertaavat ja arvioivat sitä muihin ehdotettuihin operaattoreihin. Asetukset analysoidaan päätöksentekomenettelyllä, joka valitsee halutun operaattorin ja asentaa sen nykyiseksi operaattoriksi työmuistiin. Säännöt, jotka vastaavat nykyistä operaattoria, käynnistyvät sen jälkeen ja tekevät muutoksia työmuistiin. Työmuistiin tehdyt muutokset voivat olla yksinkertaisia ​​johtopäätöksiä, kyselyitä Soarin pitkäaikaisista semanttisista tai episodimuistoista, hakuja moottorijärjestelmälle toimintojen suorittamiseksi ympäristössä tai vuorovaikutusta työmuistin (SVS) kanssa. rajapinta havaintoon. Nämä muutokset työmuistiin johtavat uusien operaattoreiden ehdottamiseen ja arviointiin, minkä jälkeen valitaan yksi ja sen sovellus.

Vahvistusopetus

Soar tukee vahvistusoppimista , joka virittää sääntöjen arvot, jotka luovat numeerisia asetuksia operaattoreiden arvioimiseksi palkinnon perusteella. Maksimaalisen joustavuuden takaamiseksi työmuistissa on rakenne, jossa palkinto luodaan.

Impassit, substraatit ja lohko

Jos operaattoreiden asetukset eivät riitä yksittäisen operaattorin valinnan määrittämiseen tai säännöt eivät riitä operaattorin soveltamiseen, syntyy umpikuja. Vastauksena umpikujaan työmuistiin luodaan alaosa, jonka tavoitteena on ratkaista umpikuja. Menettelyyn liittyvä lisätieto voi sitten ehdottaa ja valita ala -aseman operaattoreita saadakseen lisää tietoa ja joko luoda mieltymyksiä alkuperäisessä tilassa tai muuttaa tätä tilaa niin, että umpikuja ratkaistaan. Osa-alueet tarjoavat keinon vaativiin monimutkaisiin päättelyihin, mukaan lukien hierarkkinen tehtävien hajottaminen, suunnittelu ja pääsy deklaratiivisiin pitkän aikavälin muistiin. Kun umpikuja on ratkaistu, kaikki substraatin rakenteet poistetaan tuloksia lukuun ottamatta. Soarin lohkaisumekanismi kokoaa prosessin substraatissa, joka johti tuloksiin sääntöihin. Tulevaisuudessa opitut säännöt laukaisevat automaattisesti vastaavissa tilanteissa, jotta umpikujaa ei synny, mikä muuttaa monimutkaiset päättelyt vähitellen automaattiseksi/reaktiiviseksi käsittelyksi. Äskettäin yleistä yleistä alitavoittelumenettelyä on laajennettu tavoitteellisella ja automaattisella tietopohjan täydentämismekanismilla, jonka avulla voidaan ratkaista umpikuja yhdistämällä innovatiivisella ja ongelmalähtöisellä tavalla Soar-agentin hallussa oleva tieto.

Symbolinen tulo ja lähtö

Symbolinen tulo ja lähtö tapahtuu työmuistirakenteiden kautta, jotka on liitetty ylätilaan, jota kutsutaan tulolinkiksi ja lähtölinkiksi. Jos rakenteita luodaan työmuistin ulostulolinkille, ne muunnetaan ulkoisten toimintojen (esim. Moottorin ohjaus) komennoiksi.

Avaruusnäkymä ja mielikuvat

Tukeakseen vuorovaikutusta näköjärjestelmien ja ei-symbolisten päättelyjen kanssa Soarilla on Spatial Visual System (SVS). SVS edustaa sisäisesti maailmaa näkymäkaaviona , kokoelmana esineitä ja komponentti -aliobjekteja, joilla kullakin on alueellisia ominaisuuksia, kuten muoto, sijainti, asento, suhteellinen sijainti ja mittakaava. Soar -agentti, joka käyttää SVS: ää, voi luoda suodattimia, jotka poimivat automaattisesti ominaisuudet ja suhteet näkymäkaaviostaan, jotka lisätään sitten työmuistiin. Lisäksi Soar -agentti voi lisätä rakenteita SVS: ään ja käyttää sitä henkisiin kuviin. Esimerkiksi agentti voi luoda hypoteettisen objektin SVS: ään tietyssä paikassa ja kysyä, törmääkö se havaittujen objektien kanssa.

Semanttinen muisti

Semanttinen muisti (SMEM) Soarissa on suunniteltu erittäin suureksi pitkäaikaiseksi muistiksi tosimaisista rakenteista. SMEM: n tiedot esitetään suunnatuina syklisinä kaavioina. Rakenteet voidaan tallentaa tai hakea sääntöjen avulla, jotka luovat komentoja työmuistin varatulle alueelle. Haetut rakenteet lisätään työmuistiin.

SMEM-rakenteilla on aktivointiarvot, jotka edustavat kunkin muistin käytön taajuutta tai viimeaikaista käyttöä, ja toteuttavat alun perin ACT-R: lle kehitetyn perustasotason aktivointimallin . Haun aikana haetaan SMEM: n rakenne, joka vastaa kyselyä ja jolla on suurin aktivointi. Soar tukee myös hajauttamisen aktivointia , jossa aktivointi leviää työmuistiin haetuista SMEM-rakenteista muihin pitkäaikaisiin muistiin, joihin ne on linkitetty. Nämä muistot levittävät aktivoitumista naapurimuistoihinsa, ja heikkenevät jonkin verran. Leviämisen aktivointi on mekanismi, jonka avulla nykyinen konteksti voi vaikuttaa noutamiseen semanttisesta muistista.

Jaksollinen muisti

Episodinen muisti (EPMEM) tallentaa automaattisesti tilannekuvia työmuistista ajalliseen virtaan. Aiemmat jaksot voidaan hakea työmuistiin kyselyn avulla. Kun jakso on haettu, seuraava (tai edellinen) jakso voidaan noutaa. Agentti voi käyttää EPMEMiä toistamaan jaksoja menneisyydestään (jolloin se voi ennustaa toimintojen vaikutukset), hakea tiettyjä muistoja tai kyselemään jaksoja, joilla on tiettyjä muistirakenteita.

Oppiminen

Jokaiseen Soarin pitkäaikaiseen muistiin liittyy online-oppimismekanismeja, jotka luovat uusia rakenteita tai muuttavat metatietoja agentin kokemuksen perusteella. Esimerkiksi Soar oppii uusia menettelymuistin sääntöjä chunking -prosessin avulla ja virittää operaattoreiden valintaa koskevia sääntöjä vahvistuksen oppimisen avulla.

Agentin kehittäminen

Tavallinen lähestymistapa agentin kehittämiseen Soarissa alkaa kirjoittamalla säännöt, jotka ladataan prosessimuistiin, ja semanttisen muistin alustaminen asianmukaisella deklaratiivisella tietämyksellä. Agenttien kehittämisprosessi on kuvattu yksityiskohtaisesti virallisessa Soar -käsikirjassa sekä useissa opetusohjelmissa, jotka löytyvät tutkimusryhmän verkkosivuilta .

Ohjelmisto

John Lairdin kognitiivisen arkkitehtuurin laajentaminen, 2008.

Soar -arkkitehtuuria ylläpitää ja laajentaa John Lairdin tutkimusryhmä Michiganin yliopistossa. Nykyinen arkkitehtuuri on kirjoitettu yhdistelmällä C ja C ++, ja se on vapaasti saatavilla (BSD -lisenssi) tutkimusryhmän verkkosivustolla .

Soar voi liittyä ulkoisiin kieliympäristöihin, mukaan lukien C ++, Java, Tcl ja Python Soar Markup Language (SML) -kielen kautta. SML on ensisijainen mekanismi Soar -agenttien esiintymien luomiseen ja vuorovaikutukseen niiden I/O -linkkien kanssa.

JSoar on Javalla kirjoitettu Soarin toteutus. Sitä ylläpitää SoarTech , tekoälyn tutkimus- ja kehitysyhtiö. JSoar seuraa tarkasti Michiganin yliopiston arkkitehtuurin toteutusta, vaikka se ei yleensä heijasta kyseisen C/C ++ -version viimeisintä kehitystä ja muutoksia.

Sovellukset

Alla on historiallinen luettelo eri sovellusalueista, jotka on toteutettu Soarissa. Soarissa on otettu käyttöön yli sata järjestelmää, vaikka suurin osa niistä on lelu- tai palapelit.

Palapelit ja pelit

Koko historiansa aikana Soaria on käytetty monenlaisten klassisten AI -pulmien ja -pelien toteuttamiseen, kuten Hanoin torni, Water Jug, Tic Tac Toe, Eight Puzzle, Missionaries and Cannibals ja Blocks -maailman muunnelmia . Yksi Soarin ensimmäisistä saavutuksista oli osoittaa, että monet erilaiset heikot menetelmät syntyisivät luonnollisesti siihen koodatusta tehtävistä, ominaisuus nimeltä Universal Weak Method.

Tietokoneen kokoonpano

Ensimmäinen laajamittainen Soarin sovellus oli R1-Soar, Paul Rosenbloomin osittainen uudelleentoteutus DEC-tietokoneiden konfigurointiin kehitetystä R1 ( XCON ) -asiantuntijajärjestelmästä John McDermott. R1-Soar osoitti Soarin kyvyn skaalata kohtalaisen kokoisiin ongelmiin, käyttää hierarkkista tehtävien hajottamista ja suunnittelua sekä muuntaa tarkoituksellinen suunnittelu ja ongelmanratkaisu reaktiiviseksi suorittamiseksi lohkomalla.

Luonnollinen kielen ymmärtäminen

NL-Soar oli luonnollinen kielen ymmärtämisjärjestelmä , jonka Jar Fain Lehman, Rick Lewis, Nancy Green, Deryle Lonsdale ja Greg Nelson ovat kehittäneet Soarissa. Se sisälsi valmiudet luonnollisen kielen ymmärtämiseen, luomiseen ja vuoropuheluun korostaen reaaliaikaista inkrementaalista jäsentämistä ja luomista. NL-Soaria käytettiin TacAir-Soarin kokeellisessa versiossa ja NTD-Soarissa.

Simuloidut lentäjät

Soarin toinen laajamittainen sovellus käsitti aineiden kehittämisen laajamittaisen hajautetun simulaation koulutukseen. Kaksi suurta järjestelmää Yhdysvaltain taktisten lentotehtävien lentämiseen kehitettiin yhdessä Michiganin yliopistossa ja Etelä-Kalifornian yliopiston tietotieteellisessä instituutissa (ISI). Michigan-järjestelmää kutsuttiin TacAir-Soariksi ja se lensi (simulaatiossa) Yhdysvaltain kiinteän siiven sotilaallisia taktisia tehtäviä (kuten lähituen , lakot, YMP , tankkaus ja SEAD- tehtävät). ISI-järjestelmää kutsuttiin RWA-Soariksi ja se lensi helikopteritehtäviä. Jotkut TacAir-Soarin ja RWA-Soarin ominaisuuksista olivat huomio, tilannetietoisuus ja sopeutuminen, reaaliaikainen suunnittelu ja dynaaminen uudelleensuunnittelu sekä monimutkainen viestintä, koordinointi ja yhteistyö Soar-aineiden ja ihmisten yhdistelmien välillä. Nämä järjestelmät osallistui DARPA : n Synthetic Theatre of War (STOW-97) Advanced Concept Technology demo (ActD), joka oli tuolloin suurin fielding synteettisten aineiden yhteisessä taistelukentän yli 48 tunnin ajan, ja mukana koulutus aktiivinen henkilöstö. Nämä järjestelmät osoittivat tekoälyaineiden käytön kannattavuuden laajamittaisessa koulutuksessa.

HÖYRY

Yksi RWA-Soar-projektin tärkeistä tuloksista oli Milind Tamben kehittämä STEAM , joka on kehys joustavalle tiimityölle, jossa agentit ylläpitävät joukkuetovereidensa malleja Cohen & Levesquen yhteisten aikomusten viitekehyksen avulla .

NTD-Soar

NTD-Soar oli simulaatio NASAn testijohtajasta (NTD), joka on vastuussa NASAn avaruussukkulan valmistelun koordinoinnista ennen laukaisua. Se oli integroitu kognitiivinen malli, joka sisälsi monia erilaisia ​​monimutkaisia ​​kognitiivisia kykyjä, kuten luonnollisen kielen käsittelyn , huomion ja visuaalisen haun sekä ongelmanratkaisun laajaan agenttimalliin.

Virtuaaliset ihmiset

Soaria on käytetty simuloimaan virtuaalisia ihmisiä, jotka tukevat kasvokkain käytävää vuoropuhelua ja yhteistyötä virtuaalimaailmassa USC: n luovan teknologian instituutissa. Virtuaalisilla ihmisillä on muun muassa integroituja kykyjä havaita , luonnollisella kielellä , tunteilla , kehonhallinnalla ja toiminnalla.

Pelien tekoälyt ja mobiilisovellukset

Peli AI aineita on rakennettu Liidellä pelejä kuten StarCraft , Quake II , Descent 3 , Unreal Tournament , ja Minecraft , tukemalla valmiuksia, kuten paikkatietojen päättely , reaaliaikainen strategiapeli , ja vastustaja ennakointi . Tekoälyagentteja on myös luotu videopeleille, mukaan lukien Infinite Mario, joka käytti vahvistuksen oppimista, ja Frogger II , Space Invaders ja Fast Eddie, jotka käyttivät sekä vahvistavaa oppimista että henkisiä kuvia .

Soar voi toimia luonnollisesti mobiililaitteilla . Liikkuva sovellus pelin Liar Dice on kehitetty iOS joka kulkee Soar arkkitehtuurin suoraan puhelimesta moottorina vastustaja Aitousvarmennuksilla.

Robotiikka

Monia erilaisia ​​robotisovelluksia on rakennettu Soarilla sen jälkeen, kun alkuperäinen Robo-Soar otettiin käyttöön vuonna 1991 Puman robottivarren ohjaamiseen. Näitä ovat olleet liikkuvasta robotinhallinnasta humanoidipalveluihin perustuvat REEM -robotit, tehtävät robottipuut ja miehittämättömät vedenalaiset ajoneuvot .

Interaktiivinen tehtävän oppiminen

Soar -yhteisön tutkimus- ja kehitystyö keskittyy tällä hetkellä interaktiiviseen tehtävien oppimiseen (ITL), uusien tehtävien, ympäristöominaisuuksien, käyttäytymisrajoitusten ja muiden määritysten automaattiseen oppimiseen luonnollisen ohjaajan vuorovaikutuksen kautta. ITL-tutkimusta on sovellettu pöytäpelien pelaamiseen ja usean huoneen navigointiin.

Ajoitus

Merle-Soar esitteli varhain, kuinka Soar voisi oppia monimutkaisen ajoitustehtävän, joka on mallinnettu johtavan ihmisen ajoituksen mukaan tuulilasin tuotantolaitoksessa lähellä Pittsburghia.

Katso myös

Viitteet

Bibliografia

Ulkoiset linkit