Søk i artikler

Hvordan fungerer IBM Watson, datamaskinen som vant Jeopardy!?

I februar 2011 vant IBM spørreprogrammet Jeopardy!. Men hvordan fungerer den seirende datamaskinen ved navn IBM Watson?

En gang imellom kommer det ny teknologi som presser grensene for hva man trodde var mulig. IBM Watson er et kremeksempel på nettopp dette. Den forstår og tolker språk og kan gjøre intelligente slutninger basert på informasjon den har lest. Vi er nærmere sann kunstig intelligens enn noen gang.

Først: Hva er Jeopardy!?

Jeopardy! er et spørreprogram som har gått på amerikansk tv siden 1964. I spillet er det deltagerne som skal finne spørsmål til svar, eller «ledetråder» gitt av programlederen fra et spillebrett.

Spillebrettet består av et rutenett av ledetråder. Her har man kategorier bortover og vanskelighetsgrad nedover. Ettersom vanskelighetsgraden øker, stiger også pengen man vinner eller taper.

Spillet spilles av tre spillere som konkurrerer om å få høyest mulig pengesum. Man får penger ved å stille riktig spørsmål og taper tilsvarende pengesum hvis man stiller feil spørsmål.

Utfordringen

Jeopardy! er et spill med spørsmål i alle tenkelige kategorier. Ledetrådene gitt av programlederen ofte vanskelig å forstå da de inneholder ordspill og andre løse referanser. Det er vanskelig for et menneske å forstå hva som blir spurt om, og så godt som umulig for en datamaskin å forstå.

På grunn av den store spredningen av kategorier det blir gitt ledetråder i, er et heller ikke mulig å bruke tradisjonelle data for som kunnskapsgrunnlag for IBM Watson. Man må bruke såkalt «ustrukturert data». Det vil si data som ikke er i databaser eller andre strukturerte former. Kunnskap som Watson besitter må derfor komme fra bøker, wikipedia, andre nettsider, forum, osv., osv. Watson er dermed nødt til å «lese» seg opp på kunnskap, mye likt måten mennesker lærer på.

Utfordringen IBM stod ovenfor var å spille Jeopardy! på live amerikansk TV mot de to beste spillerne i Jeopardy!-s historie. Ken Jennings, som hadde vunnet 74 ganger på rad, og Brad Rutter som er den mest vinnende Jeopardy!-spilleren noen sinne, målt i dollar. Kort oppsummert, en oppgave ingen tidligere har vært i nærheten av å løse.

Et videoklipp som viser litt av hva Watson dreier seg om.

Så, hvordan gikk det?

Det gikk over all forventning. Med en sluttstilling på 77.147,- til IBM og 24.000,- til nummer to. Kampen kan oppleves på Youtube. Her er et klipp:

Et videoklipp som viser Jeopardy-kampen dag 2 av 3.

Teknologien

Først, la oss se på maskinen Watson kjører på. Det er faktisk et «standard» Linux-oppsett. Standard i den forstand at hele systemet bygger på en standard Linux-kjerne. Litt utenfor det normale er maskinvaren. Watson er faktisk fordelt utover 90 IBM Power7 servere. Disse serverne står fordelt på 10 skap og huser 2880 prosessorkjerner, 16TB minne og 20 TB harddisk. Maskinen yter 80 Teraflops eller 80 milliarder instruksjoner per sekund. Det er denne kraften som skal til for å komme opp med et svar på under tre sekunder, som er gjennomsnittlig svartid for andre spillere.

Så til programvaren. Watson bruker noe som heter Deep QA eller «Deep Questions and Answers» som er en IBM-utviklet teknologi for å svare på spørsmål stilt med naturlig språk, med ustrukturert informasjon som datagrunnlag.

IBM Deep QA skissert. Forklaring kan leses i punktene under.

Slik det fungerer:

  1. Watson mottar et spørsmål.
  2. Det første som må gjøres er å tolke spørsmålet. «Hva er det egentlig det spørres om?»
  3. Så bryter man ned spørsmålet i mindre jobber, slik at man kan parallelt utnytte de 2880 prosessorkjernene man sitter på.
  4. Så gjøres et primærsøk for å finne hypoteser som potensielt kan være riktig svar.
  5. Deretter gjør man et sekundærsøk, hvor man går igjennom hypotesene en etter en og spør tilbake i datagrunnlaget for å finne ut hvilke beviser man har som understøtter hver enkelt hypotese. Man kan dermed si hva man vet, hvorfor man vet det, men kanskje aller viktigst så vet man hva man ikke vet.
  6. Man sitter da med et sett med hypoteser med tilhørende sannsynlighet for at det er riktig svar.
  7. Man må deretter slå sammen svar som er like, og gjøre en sortering.
  8. Og deretter sitter man med et svar man er relativt sikker på er rett.

Men, hva nå?

IBM bygget naturligvis ikke Watson for å vinne i Jeopardy!. Det er bare en demonstrasjon av teknologien. Neste skritt er å begynne å utnytte dette i samfunnet. Og her ser IBM for seg fire områder: Helse, politi/sikkerhet, finans og kundekontakt.

Helse er nok det området hvor man er kommet lengst, og man ser for seg at leger kan bruke Watson som et verktøy for å hjelpe å stille diagnoser. Man ser for seg at Watson ser på pasienthistorikk, familiehistorikk, prøveresultater, symptomer, osv., og dermed kan gi legen forslag til hva det kan feile personen. Da Watson er bevisst på hva den vet og hvorfor, ser man for seg at legen kan bruke systemet til å se på hvilke beviser og fra hvilken litteraturkilde den har sine diagnoser fra. Man ser derfor for seg at Watson kan bli et system som gjør at leger kan bruke tiden sin mer effektivt og sette flere korrekte diagnoser.

Det bør presiseres at undertegnede jobber i IBM. Artikkelen er derfor blåfarget.

Lik oss på Facebook