Ennakoiva analytiikka - Predictive analytics

Ennakoiva analytiikka käsittää erilaisia tilastollisia tekniikoita tiedon louhinnasta , ennustavasta mallinnuksesta ja koneoppimisesta, jotka analysoivat nykyisiä ja historiallisia tosiasioita ennustaakseen tulevia tai muuten tuntemattomia tapahtumia.

Liiketoiminnassa ennustavat mallit hyödyntävät historiallisista ja tapahtumatiedoista löytyviä malleja riskien ja mahdollisuuksien tunnistamiseksi. Mallit keräävät suhteita monien tekijöiden välillä, jotta voidaan arvioida tiettyyn ehtojoukkoon liittyvää riskiä tai potentiaalia, mikä ohjaa ehdokaskauppojen päätöksentekoa .

Näiden teknisten lähestymistapojen määrittelevä toiminnallinen vaikutus on se, että ennakoiva analytiikka antaa ennustavan pistemäärän (todennäköisyyden) jokaiselle henkilölle (asiakas, työntekijä, terveydenhuollon potilas, tuotetunnus, ajoneuvo, komponentti, kone tai muu organisaatioyksikkö), jotta voidaan määrittää, ilmoittaa tai vaikuttaa organisaatioprosesseihin, jotka koskevat suuria määriä yksilöitä, kuten markkinoinnissa, luottoriskien arvioinnissa, petosten havaitsemisessa, valmistuksessa, terveydenhuollossa ja valtion toiminnoissa, mukaan lukien lainvalvonta.

Ennakoivaa analytiikkaa käytetään vakuutusmatemaattisessa tieteessä , markkinoinnissa , liikkeenjohdossa , urheilu-/ fantasiaurheilussa , vakuutuksissa , poliisitoiminnassa , televiestinnässä , vähittäiskaupassa , matkustamisessa , liikkuvuudessa , terveydenhuollossa , lastensuojelussa , lääkkeissä , kapasiteetin suunnittelussa , sosiaalisessa verkostoitumisessa ja muilla aloilla.

Yksi tunnetuimmista sovelluksista on luottopisteytys , jota käytetään koko liiketoiminnan johtamisessa . Pisteytysmallit käsittelevät asiakkaan luottotietoja , lainahakemusta , asiakastietoja jne. Järjestääkseen henkilöt järjestykseen niiden todennäköisyyden mukaan suorittaa tulevat luottomaksut ajoissa.

Määritelmä

Ennakoiva analytiikka on tilastoalue, joka käsittelee tietojen poimimista tiedoista ja niiden käyttämistä trendien ja käyttäytymismallien ennustamiseen . Ennakoivan verkkoanalytiikan parantaminen laskee online -tapahtumien tilastolliset todennäköisyydet . Ennakoiviin tilastotekniikoihin kuuluvat datamallinnus , koneoppiminen , tekoäly , syväoppimisalgoritmit ja tiedonlouhinta . Usein tuntematon kiinnostava tapahtuma on tulevaisuudessa, mutta ennakoivaa analytiikkaa voidaan soveltaa kaikentyyppisiin tuntemattomiin, olipa sitten menneisyydessä, nykyisyydessä tai tulevaisuudessa. Esimerkiksi epäiltyjen tunnistaminen rikoksen tekemisen jälkeen tai luottokorttipetos sen tapahtuessa. Ennakoivan analytiikan ydin perustuu selittävien muuttujien ja ennustettujen muuttujien välisten suhteiden keräämiseen aiemmista tapahtumista ja niiden hyödyntämisestä tuntemattoman tuloksen ennustamiseksi. On kuitenkin tärkeää huomata, että tulosten tarkkuus ja käytettävyys riippuvat suuresti tietoanalyysin tasosta ja oletusten laadusta.

Ennakoiva analytiikka määritellään usein ennustamiseksi yksityiskohtaisemmalla rakeisuustasolla, eli ennustavien pisteiden (todennäköisyyksien) luomiseksi kullekin yksittäiselle organisaatioelementille. Tämä erottaa sen ennustamisesta . Esimerkiksi "Ennakoiva analytiikka - tekniikka, joka oppii kokemuksesta (datasta) ennustaakseen yksilöiden tulevaa käyttäytymistä voidakseen tehdä parempia päätöksiä." Tulevissa teollisissa järjestelmissä ennakoivan analytiikan arvo on ennakoida ja estää mahdolliset ongelmat saavuttamaan lähes nolla jakautuminen ja integroida edelleen ohjeelliseen analytiikkaan päätösten optimointia varten.

Tyypit

Yleensä termillä ennakoiva analytiikka tarkoitetaan ennustavaa mallintamista , datan "pisteytystä" ennustavilla malleilla ja ennustamista . Ihmiset käyttävät kuitenkin termiä yhä useammin liittyviin analyyttisiin tieteenaloihin, kuten kuvailevaan mallintamiseen ja päätöksenteon mallintamiseen tai optimointiin. Näihin tieteenaloihin kuuluu myös tiukka data -analyysi, ja niitä käytetään laajalti liiketoiminnassa segmentointiin ja päätöksentekoon, mutta niillä on eri tarkoitukset ja niiden taustalla olevat tilastolliset tekniikat vaihtelevat.

Ennakoivat mallit

Ennakoiva mallinnus käyttää ennakoivia malleja analysoidakseen otoksen yksikön tietyn suorituskyvyn ja kyseisen yksikön yhden tai useamman tunnetun ominaisuuden välistä suhdetta. Mallin tavoitteena on arvioida todennäköisyyttä, että samanlaisessa yksikössä eri näytteessä on tietty suorituskyky. Tämä luokka sisältää malleja monilla aloilla, kuten markkinoinnissa, jossa he etsivät hienovaraisia ​​tietomalleja vastatakseen asiakkaiden suorituskykyä koskeviin kysymyksiin tai petosten havaitsemismalleja. Ennakoivat mallit suorittavat usein laskelmia reaaliaikaisten tapahtumien aikana, esimerkiksi arvioidakseen tietyn asiakkaan tai tapahtuman riskejä tai mahdollisuuksia päätöksenteon ohjaamiseksi. Laskennan nopeuden kehittymisen myötä yksittäisistä agenttien mallinnusjärjestelmistä on tullut kykeneviä simuloimaan ihmisen käyttäytymistä tai reaktioita tiettyihin ärsykkeisiin tai skenaarioihin.

Käytettävissä olevia näyteyksiköitä, joilla on tunnettuja ominaisuuksia ja tunnettuja suorituksia, kutsutaan "harjoitusnäytteeksi". Muiden näytteiden yksiköitä, joilla on tunnettuja ominaisuuksia, mutta joita ei tunneta, kutsutaan "pois [koulutus] -näytteestä". Näyteyksiköiden loppu ei välttämättä liity kronologiseen suhteeseen harjoitusnäyteyksiköihin. Koulutusnäyte voi esimerkiksi koostua viktoriaanisten kirjoittajien kirjoitusten kirjallisista ominaisuuksista, joiden attribuutio tunnetaan, ja näyteyksikön ulkopuolinen yksikkö voi olla äskettäin löydetty kirjoitus, jonka tekijä on tuntematon; Ennakoiva malli voi auttaa määrittämään teoksen tunnetulle tekijälle. Toinen esimerkki on analyysi veriroiskeista simuloiduissa rikospaikoissa, joissa näyteyksikkö on todellinen veriroiskekuvio rikospaikalta. Näyteyksikön loppu voi olla samasta ajasta kuin koulutusyksiköt, aiemmasta tai tulevasta ajasta.

Kuvaavat mallit

Kuvaavat mallit kvantifioivat datasuhteet tavalla, jota käytetään usein asiakkaiden tai potentiaalisten asiakkaiden luokittelemiseen ryhmiin. Toisin kuin ennustavat mallit, jotka keskittyvät yksittäisen asiakkaan käyttäytymisen (kuten luottoriskin) ennustamiseen, kuvaavat mallit tunnistavat monia erilaisia ​​suhteita asiakkaiden tai tuotteiden välillä. Kuvaavat mallit eivät luokittele asiakkaita järjestyksessä niiden todennäköisyyden mukaan tehdä tietty toimenpide ennustavien mallien tapaan. Sen sijaan kuvailevia malleja voidaan käyttää esimerkiksi asiakkaiden luokittelemiseen tuotevalintojen ja elämänvaiheen mukaan. Kuvailevia mallinnustyökaluja voidaan käyttää kehittämään lisämalleja, jotka voivat simuloida suurta määrää yksilöllisiä tekijöitä ja tehdä ennusteita.

Päätösmallit

Päätösmallit kuvaavat suhdetta päätöksen kaikkien osien - tunnettujen tietojen (mukaan lukien ennustemallien tulokset), päätöksen ja päätöksen ennustetulosten - välillä, jotta voidaan ennustaa monen muuttujan sisältävien päätösten tulokset. Näitä malleja voidaan käyttää optimoinnissa maksimoimalla tietyt tulokset ja minimoiden muut. Päätösmalleja käytetään yleensä kehittämään päätöksentekologiikkaa tai liiketoimintasääntöjä, jotka tuottavat halutun toimenpiteen jokaiselle asiakkaalle tai tilanteelle.

Sovellukset

Vaikka ennakoivaa analytiikkaa voidaan käyttää monissa sovelluksissa, esitämme muutamia esimerkkejä siitä, missä ennakoiva analytiikka on osoittanut positiivista vaikutusta viime vuosina.

Liiketoiminta

Analyyttinen asiakassuhteiden hallinta (CRM) on usein ennakoivan analyysin kaupallinen sovellus. Ennakoivan analyysin menetelmiä sovelletaan asiakastietoihin kokonaisvaltaisen näkemyksen muodostamiseksi asiakkaasta. CRM käyttää ennakoivaa analyysiä markkinointikampanjoiden, myynnin ja asiakaspalvelun sovelluksissa. Analyyttistä CRM: ää voidaan soveltaa asiakkaiden koko elinkaaren ajan ( hankinta , suhteiden kasvu , säilyttäminen ja takaisin saaminen).

Usein yrityksen organisaatiot keräävät ja ylläpitää runsaasti tietoja, kuten asiakkaan kirjanpitoa tai myyntipistetapahtumia. Näissä tapauksissa ennakoiva analyysi voi auttaa analysoimaan asiakkaiden menoja, käyttöä ja muuta käyttäytymistä, mikä johtaa tehokkaaseen ristiinmyyntiin tai lisätuotteiden myymiseen nykyisille asiakkaille.

Ennakoivan analytiikan asianmukainen soveltaminen voi johtaa ennakoivampiin ja tehokkaampiin säilytysstrategioihin. Tarkastelemalla usein asiakkaan aiempaa palvelun käyttöä, palvelun suorituskykyä, kulutusta ja muita käyttäytymismalleja, ennustavat mallit voivat määrittää todennäköisyyden, että asiakas lopettaa palvelun pian. Interventio tarjouksilla, joilla on suuri havaittu arvo, voi lisätä mahdollisuutta kääntyä tai säilyttää asiakas. Ennakoiva analytiikka voi myös ennustaa hiljaista kulumista, asiakkaan käyttäytymistä hitaasti mutta tasaisesti vähentämään käyttöä.

Lastensuojelu

Jotkut lastensuojeluvirastot ovat alkaneet käyttää ennakoivaa analytiikkaa merkitsemään korkean riskin tapauksia. Esimerkiksi Floridan Hillsborough Countyssa lastensuojeluviraston käyttämä ennustava mallinnustyökalu on estänyt kohdeväestön hyväksikäytöstä johtuvat lasten kuolemat.

Kliinisten päätösten tukijärjestelmät

Ennakoiva analyysi on löytänyt käyttöä terveydenhuollossa ensisijaisesti sen määrittämiseksi, mitkä potilaat ovat vaarassa sairastua diabetekseen, astmaan tai sydänsairauksiin. Lisäksi kehittyneet kliinisen päätöksenteon tukijärjestelmät sisältävät ennustavaa analytiikkaa lääketieteellisen päätöksenteon tueksi.

Vuonna 2016 tehty tutkimus neurodegeneratiivisista häiriöistä on tehokas esimerkki CDS -alustasta Parkinsonin taudin diagnosoimiseksi, seuraamiseksi, ennustamiseksi ja seurannaksi .

Oikeudellisten päätösten tulosten ennakointi

Oikeudellisten päätösten tuloksen ennustaminen voidaan tehdä tekoälyohjelmilla. Näitä ohjelmia voidaan käyttää apuvälineinä tämän alan ammatteille.

Salkun, tuotteen tai taloustason ennuste

Usein analyysin painopiste ei ole kuluttaja vaan tuote, portfolio, yritys, teollisuus tai jopa talous. Vähittäiskauppias voi esimerkiksi olla kiinnostunut ennakoimaan myymälätason kysyntää varastonhallintatarkoituksiin. Tai Federal Reserve Board saattaa olla kiinnostunut ennustamaan työttömyysasteen ensi vuodelle. Tämäntyyppisiin ongelmiin voidaan puuttua ennakoivalla analytiikalla käyttämällä aikasarjatekniikoita (katso alla). Niitä voidaan käsitellä myös koneoppimismenetelmillä, jotka muuttavat alkuperäisen aikasarjan ominaisuusvektoritilaksi, jossa oppimisalgoritmi löytää kuvioita, joilla on ennustava voima.

Vakuutus

Monien yritysten on otettava huomioon eri palveluista johtuva riskialttius ja määritettävä riskin kattamiseen tarvittavat kustannukset. Ennakoiva analytiikka voi auttaa vakuuttamaan nämä määrät ennustamalla sairauden, maksukyvyttömyyden , konkurssin jne. Mahdollisuuksia. Ennakoiva analytiikka voi virtaviivaistaa asiakkaiden hankintaprosessia ennustamalla asiakkaan tulevaa riskikäyttäytymistä sovellustason tietojen perusteella. Ennustavat analyysit luottotietojen muodossa ovat vähentäneet lainojen hyväksymiseen kuluvaa aikaa erityisesti asuntomarkkinoilla. Oikea ennakoiva analyysi voi johtaa oikeisiin hinnoittelupäätöksiin, mikä voi auttaa vähentämään maksukyvyttömyyden riskiä tulevaisuudessa.

Tekniikka ja suuret tiedot vaikuttavat

Big data on kokoelma tietojoukkoja, jotka ovat niin suuria ja monimutkaisia, että niiden käyttäminen perinteisten tietokantojen hallintatyökalujen kanssa tulee hankalaa . Suurten tietojen määrä, monipuolisuus ja nopeus ovat tuoneet haasteita kaappaamiseen, tallentamiseen, hakuun, jakamiseen, analysointiin ja visualisointiin. Esimerkkejä suurista tietolähteistä ovat verkkolokit , RFID , anturitiedot , sosiaaliset verkostot , Internet -haun indeksointi, puhelutietojen tallennus, sotilaallinen valvonta ja monimutkaiset tiedot tähtitieteellisistä, biogeokemiallisista, genomiikan ja ilmakehän tiedoista. Big Data on IT -organisaatioiden tarjoamien ennakoivimpien analyysipalvelujen ydin. Tietokonelaitteiston teknisen kehityksen-nopeampien suorittimien, halvemman muistin ja MPP- arkkitehtuurin-sekä uusien tekniikoiden, kuten Hadoopin , MapReducen ja tietokannassa ja tekstianalytiikassa suurten tietojen käsittelyn ansiosta, on nyt mahdollista kerätä, analysoida ja louhia valtavia määriä jäsenneltyä ja jäsentämätöntä tietoa uusien oivallusten saamiseksi. On myös mahdollista suorittaa ennustavia algoritmeja suoratoistodatalle. Nykyään suurempien tietojen tutkiminen ja ennakoivan analytiikan käyttö on useamman organisaation ulottuvilla kuin koskaan ennen, ja ehdotetaan uusia menetelmiä, jotka pystyvät käsittelemään tällaisia ​​tietojoukkoja.

Analyyttiset tekniikat

Ennakoivan analyysin suorittamiseen käytetyt lähestymistavat ja tekniikat voidaan laajalti ryhmitellä regressiotekniikoiksi ja koneoppimistekniikoiksi.

Regressiotekniikat

Regressiomallit ovat ennakoivan analytiikan tukipilari. Pääpaino on matemaattisen yhtälön muodostamisessa mallina, joka edustaa tarkasteltavien eri muuttujien välisiä vuorovaikutuksia. Tilanteesta riippuen on olemassa laaja valikoima malleja, joita voidaan soveltaa ennustavan analyysin suorittamisessa. Joitakin niistä käsitellään lyhyesti alla.

Lineaarinen regressiomalli

Lineaarista regressiomallia ennustaa vastemuuttuja lineaarisena funktiona parametrien tuntemattomia kertoimia. Nämä parametrit säädetään siten, että sovitusmitta on optimoitu. Suuri osa mallin sovittamiseen tähtäävistä ponnisteluista keskittyy jäännöksen koon minimoimiseen sekä sen varmistamiseen, että se jakautuu satunnaisesti mallin ennusteisiin nähden.

Regression tavoitteena on valita mallin parametrit minimoidaksesi neliön jäännösten summa. Tätä kutsutaan tavalliseksi pienimmän neliösumman (OLS) estimaatiksi.

Erilliset valintamallit

Useita regressioita (yllä) käytetään yleensä, kun vaste muuttuja on jatkuva ja sillä on rajaton alue. Usein vastausmuuttuja ei ehkä ole jatkuva, vaan pikemminkin diskreetti. Vaikka matemaattisesti on mahdollista soveltaa moninkertaista regressiota erillisiin järjestettyihin riippuvaisiin muuttujiin, jotkin moninkertaisen lineaarisen regression teorian taustalla olevat oletukset eivät enää päde, ja on olemassa muita tekniikoita, kuten diskreetit valintamallit, jotka soveltuvat paremmin tämän tyyppiseen analyysiin. Jos riippuvainen muuttuja on diskreetti, jotkut näistä ylivoimaisista menetelmistä ovat logistinen regressio , moninomiaalinen logit ja probit -mallit. Logistisia regressio- ja probit -malleja käytetään, kun riippuvainen muuttuja on binäärinen .

Logistinen regressio

Luokitusasetuksissa tulos todennäköisyyksien osoittaminen havainnoille voidaan saavuttaa käyttämällä logistista mallia (jota kutsutaan myös logiikkamalliksi), joka muuntaa binääririippuvaisen muuttujan tiedot rajoittamattomaksi jatkuvaksi muuttujaksi ja arvioi säännöllisen monimuuttujamallin.

Wald ja uskottavuusosamäärä testataan tilastollinen merkitsevyys kunkin kertoimen b mallissa (analoginen t testejä käytetään OLS regressio, katso edellä). Testi, joka arvioi luokitusmallin sopivuutta, on "oikein ennustettu prosenttiosuus".

Probit -regressio

Probit -mallit tarjoavat vaihtoehdon logistiselle regressiolle kategoristen riippuvien muuttujien mallintamiseen.

Moninomiaalinen logistinen regressio

Binäärilogit -mallin laajennus tapauksiin, joissa riippuvaisella muuttujalla on enemmän kuin kaksi luokkaa, on moninominen logit -malli . Tällaisissa tapauksissa tietojen romahtaminen kahteen luokkaan ei ehkä ole järkevää tai voi johtaa tietojen rikkauden menettämiseen. Monikielinen logit -malli on sopiva tekniikka näissä tapauksissa, varsinkin kun riippuvaisia ​​muuttujaluokkia ei ole järjestetty (esimerkiksi värit, kuten punainen, sininen, vihreä). Jotkut kirjoittajat ovat laajentaneet moninomiaalista regressiota sisältämään ominaisuuksien valinta-/ tärkeysmenetelmiä , kuten satunnaisen moninomialogit .

Logit versus probit

Molemmilla regressioilla on taipumus käyttäytyä samalla tavalla, paitsi että logistinen jakauma on yleensä hieman tasaisempi. Logit- ja probit -mallista saadut kertoimet ovat yleensä lähellä toisiaan. Kuitenkin riskisuhde on helpompi tulkita, että logittimalli.

Käytännön syitä valita probit -malli logistisen mallin sijaan voisi olla:

  • Uskotaan vahvasti, että taustalla oleva jakauma on normaali
  • Todellinen tapahtuma ei ole binäärinen tulos ( esim . Konkurssiasema), vaan osa ( esim . Eri velkatasojen väestön osuus).

Aikasarjamallit

Aikasarjamalleja käytetään ennustamaan tai ennustamaan muuttujien tulevaa käyttäytymistä. Nämä mallit ottavat huomioon sen, että ajan mittaan otetuilla datapisteillä voi olla sisäinen rakenne (kuten automaattinen korrelaatio, trendi tai kausivaihtelu), joka olisi otettava huomioon. Tämän seurauksena tavanomaisia ​​regressiotekniikoita ei voida soveltaa aikasarjatietoihin, ja menetelmiä on kehitetty hajottamaan sarjan trendit, kausiluonteiset ja suhdannevaihtelut.

Aikasarjamallit arvioivat stokastisia komponentteja sisältäviä eroyhtälöitä. Näiden mallien kaksi yleisesti käytettyä muotoa ovat autoregressiiviset mallit (AR) ja liukuvan keskiarvon mallit. Box-Jenkins menetelmää yhdistää AR ja MA mallien tuottamiseksi ARMA (autoregressive liukuva keskiarvo) malli, joka on kulmakivi paikallaan aikasarja-analyysin. ARIMAa (autoregressiiviset integroidut liukuvan keskiarvon mallit) sitä vastoin käytetään kuvaamaan ei-kiinteitä aikasarjoja.

Viime vuosina aikasarjamallit ovat kehittyneet ja pyrkivät mallintamaan ehdollista heteroskedastisuutta. Tällaisia ​​malleja ovat ARCH -malli ( autoregressiivinen ehdollinen heteroskedastisuus ) ja GARCH -malli (yleistetty autoregressiivinen ehdollinen heteroskedastisuus), joita molempia käytetään usein taloudellisissa aikasarjoissa.

Selviytymis- tai kestoanalyysi

Selviytymisanalyysi on toinen nimi tapahtuma-ajan analyysille. Näitä tekniikoita kehitettiin ensisijaisesti lääketieteen ja biologian tieteissä, mutta niitä käytetään myös laajalti yhteiskuntatieteissä, kuten taloustieteessä, sekä tekniikassa.

Selviytymistiedoille ominaiset sensurointi ja epätavanomaisuus aiheuttavat vaikeuksia yritettäessä analysoida tietoja käyttämällä tavanomaisia ​​tilastollisia malleja, kuten useita lineaarisia regressioita . Normaali jakauma , joka on symmetrinen jakelu, ottaa positiivinen sekä negatiivisia arvoja, mutta kesto sen luonteen ei voi olla negatiivinen ja sen vuoksi normaalius ei voida olettaa, kun käsitellään kesto / Eloonjääntitulokset.

Kestomallit voivat olla parametrisia, ei-parametrisia tai puoliparametrisia. Joitakin yleisesti käytettyjä malleja ovat Kaplan-Meierin ja Coxin suhteellinen vaaramalli (ei parametrinen).

Luokitus- ja regressiopuut (CART)

Luokitus- ja regressiopuut (CART) ovat ei-parametrinen päätöspuun oppimistekniikka , joka tuottaa joko luokitus- tai regressiopuita sen mukaan, onko riippuvainen muuttuja kategorinen vai numeerinen.

Päätöspuut muodostuvat sääntöjen kokoelmasta, joka perustuu mallinnustiedon muuttujiin:

  • Muuttujien arvoihin perustuvat säännöt valitaan, jotta saadaan paras jako havaintojen erottamiseksi riippuvaisen muuttujan perusteella
  • Kun sääntö on valittu ja jakaa solmun kahteen osaan, samaa prosessia sovelletaan jokaiseen "alisolmuun" (eli se on rekursiivinen menettely)
  • Halkaisu pysähtyy, kun CART havaitsee, ettei lisävahvistusta voida saavuttaa, tai jotkut ennalta asetetut pysäytyssäännöt täyttyvät. (Vaihtoehtoisesti tiedot jaetaan mahdollisimman paljon ja sitten puu leikataan myöhemmin .)

Jokainen puun haara päättyy terminaalisolmuun. Jokainen havainto kuuluu yhteen ja täsmälleen yhteen päätesolmuun, ja jokainen terminaalisolmu määritellään yksilöllisesti sääntöjoukolla.

Erittäin suosittu menetelmä ennakoivaan analyysiin on satunnaiset metsät .

Monimuuttujainen adaptiivinen regressio

Monimuuttujainen adaptiivinen regressio spline (MARS) on ei-parametrinen tekniikka, joka rakentaa joustavia malleja sovittamalla kappaleittain lineaarisia regressioita .

Monimuuttujainen ja mukautuva regressio -spline -lähestymistapa tarkoituksella ylittää mallin ja sitten luumut optimaalisen mallin saavuttamiseksi. Algoritmi on laskennallisesti erittäin intensiivinen, ja käytännössä määritellään perustoimintojen yläraja.

Koneoppimisen tekniikat

Koneoppiminen sisältää useita kehittyneitä tilastollisia menetelmiä regressiota ja luokittelua varten, ja se soveltuu useille eri aloille, kuten lääketieteelliseen diagnostiikkaan , luottokorttipetosten havaitsemiseen, kasvojen ja puheen tunnistamiseen ja osakemarkkinoiden analysointiin .

Työkalut

Historiallisesti ennakoivien analytiikkatyökalujen käyttäminen - ja niiden antamien tulosten ymmärtäminen - vaati kehittyneitä taitoja. Nykyaikaiset ennakoivat analyysityökalut eivät kuitenkaan enää rajoitu IT -asiantuntijoihin. Kun yhä useammat organisaatiot ottavat ennakoivan analytiikan osaksi päätöksentekoprosesseja ja integroivat sen toimintaansa, ne luovat muutoksen markkinoilla kohti yrityskäyttäjiä tiedon ensisijaisina kuluttajina. Yrityskäyttäjät haluavat työkaluja, joita he voivat käyttää yksin. Toimittajat vastaavat luomalla uuden ohjelmiston, joka poistaa matemaattisen monimutkaisuuden, tarjoaa käyttäjäystävällisiä graafisia käyttöliittymiä ja/tai rakentaa pikakuvakkeita, jotka voivat esimerkiksi tunnistaa saatavilla olevan tiedon ja ehdottaa sopivaa ennustavaa mallia. Ennakoivista analytiikkatyökaluista on tullut riittävän kehittyneitä, jotta ne voivat esittää ja hajottaa riittävästi tietoongelmia, joten jokainen tietotaitoinen tietotyöntekijä voi käyttää niitä tietojen analysointiin ja merkityksellisten, hyödyllisten tulosten hakemiseen. Esimerkiksi nykyaikaiset työkalut esittävät havaintoja yksinkertaisilla kaavioilla, kaavioilla ja pisteillä, jotka osoittavat mahdollisten tulosten todennäköisyyden.

Markkinoilla on lukuisia työkaluja, jotka auttavat ennakoivan analyysin suorittamisessa. Nämä vaihtelevat niistä, jotka tarvitsevat hyvin vähän käyttäjän hienostuneisuutta, ja niihin, jotka on suunniteltu asiantuntijalle. Ero näiden työkalujen välillä on usein mukautustasossa ja raskaan tiedonsiirron sallimisessa.

PMML

Ennustemallien Markup Language (PMML) ehdotettiin yleiskieltä ilmaisemiseen ennustavia malleja. Tällainen XML-pohjainen kieli tarjoaa eri työkaluille mahdollisuuden määritellä ennustavia malleja ja jakaa ne. PMML 4.0 julkaistiin kesäkuussa 2009.

Kritiikki

Tietokoneiden ja algoritmien kyvystä ennakoida tulevaisuutta on paljon epäilijöitä, kuten Gary King , Harvardin yliopiston professori ja kvantitatiivisen yhteiskuntatieteen instituutin johtaja. Ympäristö vaikuttaa ihmisiin lukemattomilla tavoilla. Täydellinen ennustaminen siitä, mitä ihmiset tekevät seuraavaksi, edellyttää, että kaikki vaikuttavat muuttujat tunnetaan ja mitataan tarkasti. "Ihmisten ympäristö muuttuu jopa nopeammin kuin he itse. Kaikki säästä suhteeseen äitinsä kanssa voi muuttaa ihmisten ajattelua ja toimintaa. Kaikki nämä muuttujat ovat arvaamattomia. Kuinka ne vaikuttavat ihmiseen, on vielä vähemmän ennustettavissa. Jos Jos he asetetaan täsmälleen samaan tilanteeseen huomenna, he voivat tehdä aivan toisenlaisen päätöksen. Tämä tarkoittaa, että tilastollinen ennuste on pätevä vain steriileissä laboratorio -olosuhteissa, mikä ei yhtäkkiä ole niin hyödyllistä kuin aiemmin näytti. "

Tietojärjestelmissä ja MIS Quarterlyssä vuosien 1990 ja 2006 välisenä aikana julkaistun 1072 julkaisun tutkimuksessa vain 52 empiiristä paperia yritti ennakoida väitteitä, joista vain 7 suoritti asianmukaisen ennustavan mallinnuksen tai testauksen.

Katso myös

Viitteet

Lue lisää

  • Agresti, Alan (2002). Luokiteltu tietojen analyysi . Hoboken: John Wiley ja pojat. ISBN 0-471-36093-7.
  • Coggeshall, Stephen, Davies, John, Jones, Roger. ja Schutzer, Daniel, "Intelligent Security Systems", julkaisussa Freedman, Roy S., Flein, Robert A. ja Lederman, Jess, Editors (1995). Tekoäly pääomamarkkinoilla . Chicago: Irwin. ISBN 1-55738-811-3.CS1 maint: useita nimiä: tekijöiden luettelo ( linkki )
  • L. Devroye; L. Györfi; G. Lugosi (1996). Todennäköinen teoria kuvioiden tunnistamisesta . New York: Springer-Verlag. ISBN 9781461207115.
  • Enders, Walter (2004). Sovellettava aikasarjan ekonometria . Hoboken: John Wiley ja pojat. ISBN 0-521-83919-X.
  • Greene, William (2012). Ekonometrinen analyysi, 7. painos . Lontoo: Prentice Hall. ISBN 978-0-13-139538-1.
  • Guidère, Mathieu; Howard N, Sh. Argamon (2009). Rikas kielen analyysi terrorismin torjuntaa varten . Berliini, Lontoo, New York: Springer-Verlag. ISBN 978-3-642-01140-5.
  • Mitchell, Tom (1997). Koneoppiminen . New York: McGraw-Hill. ISBN 0-07-042807-7.
  • Siegel, Eric (2016). Ennakoiva analytiikka: Voima ennustaa, kuka napsauttaa, ostaa, valehtelee tai kuolee . John Wiley. ISBN 978-1119145677.
  • Tukey, John (1977). Tutkimusdatan analyysi . New York: Addison-Wesley. ISBN 0-201-07616-0.
  • Finlay, Steven (2014). Ennakoiva analytiikka, tiedonlouhinta ja big data. Myytit, väärinkäsitykset ja menetelmät . Basingstoke: Palgrave Macmillan. ISBN 978-1-137-37927-6.
  • Coker, Frank (2014). Pulse: Ymmärtäminen yrityksesi elintärkeistä merkeistä . Bellevue, WA: Ambient Light Publishing. ISBN 978-0-9893086-0-1.