Je hoeft geen Sherlock Holmes te zijn om te weten wie Watson is …

We hebben het hier echter over Watson van IBM. En wat daar precies achter zit is toch niet zo “Elementair, mijn beste Watson !”.

Vandaar deze blog als poging om één en ander te verduidelijken. Het zal blijken dat Watson zo’n beetje de rode draad is doorheen de geschiedenis van computergigant IBM. En dat één blog niet zal volstaan om één en ander uit te spitten.

Thomas J Watson

Thomas J Watson was general manager van computergigant – avant la lettre – IBM, van 1914 tot 1956, die in die periode uitgroeide van een bescheiden mechanografische onderneming met slechts 1300 werknemers tot een groep met meer dan 70000 werknemers (en tegelijk zijn omzet zag verhonderdvoudigen). Watson is er dus in geslaagd met zijn talenten als verkoper en diplomaat het bedrijf door de moeilijke periode van de crisis en de wereldoorlogen te loodsen. Tijdens de Tweede Wereldoorlog was het inzetten van mecanografie overigens een belangrijke factor voor het ondersteunen van de militaire (en politieke) operaties van zowel nazi Duitsland als de geallieerden.

Zonder meer mag duidelijk zijn dat Watson de aanzet heeft gegeven tot de verdere wereldwijde expansie van IBM als één van de meest successvolle en invloedrijke IT ondernemingen tot de dag van vandaag.

Naar de jaren 1980 … een business in verandering …

De IT business tot de jaren tachtig steunde voor een groot deel op het ontwikkelen, vervaardigen en aan de man brengen van de hardware infrastructuur.

Dit betreft zowel de mainframe systemen als de opkomende PC, beide vlaggenschepen van IBM.

In het licht van steeds versnellende technologische evoluties en de globalisering werd echter duidelijk dat dit business model voor IBM niet volstond om aan de top te blijven.

Men dacht dan ook aan gesofisticeerde toepassingen die veel verder gaan dan het uitvoeren van administratieve of berekeningsprocessen, en vroeg zich af of de machines een zekere vorm van intelligentie konden verkrijgen (die hen zou toelaten steeds meer taken van de mens over te nemen).

Eén van de eerste uitdagingen waar de onderzoekers van IBM hun tanden inzetten was het schaakprobleem. Zodra het virtuele schaakbord en de spelregels in het systeem ingevoerd zijn kan een computersysteem het gaan opnemen tegen een menselijke speler. Om beurten voeren de partijen hun zet in en beredeneren zij wat hun volgende zet zal zijn.

Schaak en mat

De schaakspelers in de wereldtop steunen hierbij op een jarenlange training en ervaring waarin zij leren uit scenario’s van vorige spelletjes en zich bekwamen in het vooruit denken en anticiperen van meerdere cycli van zetten en tegenzetten.

De succesvolle schaakmachine zal deze topspelers maar kunnen verslaan door het imiteren en perfectioneren van deze aanpak. Dit is een schoolvoorbeeld van een artificieel intelligentie probleem. In grote lijnen bestaat het denkproces uit de constructie van een zoekboom, vertrekkende vanuit een bepaalde startpositie, waarbij elke mogelijke zet van de machine of de opponent aanleiding geven tot een nieuwe tak. Een optimale zet kan dan bepaald worden mits alle mogelijke eindposities op een correcte manier geëvalueerd en vergeleken kunnen worden. De computer heeft hier het gigantisch voordeel van de capaciteit voor het opslaan, doorlopen en verwerken van deze zoekbomen, en kan aldus zo’n 20 zetten vooruitkijken.

IBM Deep Blue

Is een belangrijke etappe in de strijd van mens tegen machine op het schaakbord. Het was de IBM Deep Blue machine die er, in 1997, voor het eerst in slaagde de Wereldkampioen Gary Kasparov te verslaan. Dit gegeven is enigszins controversieel, maar het blijft wel een betekenisvol wapenfeit omdat definitief duidelijk werd dat de prestaties van de schaakmachines naar het hoogste niveau getild waren. Bijna 20 jaar later blijft dit de belangrijkste conclusie, met als bedenking dat geen enkele schaakcomputer onfeilbaar is en systematisch elk spelletje zou kunnen winnen. Sommige kenners beschouwen de speelstijl van de computers als weinig creatief, gebaseerd op brute force en het uitbuiten van de menselijke fouten van de tegenstander. Vanuit een theoretisch standpunt moet men ook erkennen dat er geen sluitend algoritme is om elk spelletje te winnen. Vooral de fase van het eindspel lijkt moeilijk onder controle te krijgen en vereist een aparte strategie gebaseerd op het analyseren van een enorme collectie gekende end games.

Hoe dan ook, het research team van IBM moest rond de milleniumwisseling op zoek naar een nieuwe uitdaging …

Jeopardy! (Waagstuk)

Jeopardy! is het bekende quiz programma waar 3 kandidaten een reeks vragen voorgeschoteld krijgen over algemene onderwerpen zoals actualiteit, geschiedenis, sport, kunst, literatuur, woordspelingen, en dergelijke. Deze vragen worden geformuleerd als een opgave (clue) en het antwoord moet geformuleerd worden als een vraag. Als voorbeeld één van de opgaven in de vlaamse versie van de quiz:

Opgave: Grote, grijze zoogdieren die onder andere in Afrika leven en toeteren met hun slurf.
- Juist antwoord kandidaat: Wat zijn olifanten?

Het recht om te antwoorden wordt verleend aan wie het snelst op de knop drukt (nadat de volledige opgave gelezen is door de quizmaster) en bij goed antwoord pakt de kandidaat de winst en mag hij het volgende thema (en prijskaartje kiezen), bij fout antwoord krijgt een andere kandidaat zijn kans. Kan een computer zich ook hier meten met een menselijke opponent ? IBM ontwikkelde hiervoor een “alwetende” machine genaamd Watson.

Een waagstuk voor Watson

De uitdaging voor de machine is hier van een andere orde dan bij het schaakspel en de vraagstelling is veel complexer. Zo is het universum van alle mogelijke clues en antwoorden praktisch onbegrensd en lenen deze zich ook veel minder tot een formele representatie met een vaste set van spelregels. Bovendien, als de machine zich wil meten als gelijke met de menselijke opponent moet deze ook in staat zijn de uitgesproken clues van de quizmaster te interpreteren (natural language processing), en een vocaal antwoord te genereren. In de praktijk heeft men wel een aantal faciliteiten voorzien voor Watson zoals het sturen van een elektronisch signaal i.p.v. een lichtsignaal zodra de kandidaten mogen antwoorden.

Gelukkig beschikt Watson over een enorme collectie van documenten (zo’n 200 miljoen pagina’s encyclopedieën, artikels, boeken, ..) en data, maar het volstaat uiteraard niet om de documenten op te diepen die qua keywords gerelateerd zijn. Watson moet een precies en relevant antwoord kunnen geven. De aanpak hiervoor is het gelijktijdig uitvoeren van tientallen (heuristische en statistical learning) algoritmen voor het analyseren van de clue als natural language, formuleren van hypotheses, en het evalueren en combineren van resultaten om tenslotte een lijst van mogelijke antwoorden voor te stellen. In de terminologie van artificiële intelligentie spreekt men over information retrieval (in tegenstelling tot zuiver document retrieval) en automated reasoning. Het probleem in zijn geheel behoort tot het domein van open domain question answering dat momenteel in volle ontwikkeling is.

Dat het IBM research team, in samenwerking met een aantal amerikaanse universiteiten er in geslaagd is deze uitdaging tot een goed einde te brengen mag blijken uit een aantal topprestaties waar Watson een spelletje Jeopardy! heeft gewonnen (zoals bijvoorbeeld in dit videofragment waar de tegenkandidaten de grootste moeite hebben om in het spel te komen), dit na een aantal jaren onderzoek in de periode 2005-2010. Zie ook het volledige verhaal over Watson op Wikipedia.

Kritiek op Watson

Het is niet evident de prestaties van Watson op hun juiste waarde te schatten. Zo moet men opmerken dat de machine er volledig op gericht was om te presteren in de gestandardiseerde omstandigheden van de Jeopardy! set. Hierbij heeft de machine toch een paar onbegrijpelijke steken laten vallen maar was de prestatie voor het overige op een uiterst hoog niveau.

Dit betekent niet dat Watson klaar staat om al het intellectuele denkwerk van de mens over te nemen. Zo is een weetjes vraag over amerikaanse presidenten toch nog altijd makkelijker dan een ingewikkelde medische diagnose, een complex juridisch dossier of een bewijs uit de wiskunde waar onderzoekers al jaren op werken. Het mag ook duidelijk zijn dat Watson niet in staat is tot emoties of empathie, en ook geen creatief gedrag vertoont, toch cruciale kwaliteiten als de machine wil wedijveren met de mens.

De grote filosoof en taalkundige Noam Chomsky omschreef in een interview het fenomeen Watson als een grotere pletwals (“a bigger steamroller”), daarmee doelend op het feit dat het succes van Watson steunt op een enorme rekenkracht en geheugen toegang (“dus brute force”) eerder dan op fijne redeneringen.

In een artikel in de New York Times geven de professoren Sean Dorrance Kelly en Hubert Dreyfus een gelijkaardige kritiek (“Watson does not come within a million miles of replicating the achievements of everyday human action and thought”) en analyseren zij één van de foutjes die Watson maakt om te besluiten dat Watson weliswaar vaak kan scoren met statistical learning maar niet altijd de relevantie van een gegeven correct kan inschatten.

Een geniale zet

Vriend en vijand zijn het er zeker wel over eens dat dank zij de prestaties van Watson de CEO, Watson de Jeopardy! kampioen en zijn broertje de schaakkampioen, Watson een uiterst sterk merk is. Bij uitstek geschikt als merknaam voor de Analytics producten en diensten van IBM. Misschien dacht u zelfs al spontaan aan Watson Analytics bij het lezen van de titel van deze blog ?

In een vervolg op deze blog gaan we meer uitvoerig in op Watson Analytics. Het mag duidelijk zijn dat IBM hiermee hoge verwachtingen creëert zowel op het vlak van de prestaties in de toepassingen als op zakelijk vlak.

Smals Research

Elementary, my dear Watson !