IT-Strategien

IBM Watson - Der Supercomputer

IBM Watson ist eine Computerarchitektur, die für komplexe Datenanalysen entwickelt wurde. Sie vereint die drei Kernkompetenzen natürliches Sprachverständnis, Lernfähigkeit und präzise Antworten auf Basis von Wahrscheinlichkeitsberechnungen in einem System.

image.jpg

© Clockready - Wikimedia.com

IBM Watson - Der Supercomputer

Die Daten vermehren sich heute mit einer nie dagewesenen Geschwindigkeit: Sensoren, Mobilgeräte, Online-Transaktionen oder Social Networks produzieren jeden Tag rund 2,5 Trillionen Bytes an neuen Daten - eine Zahl mit 18 Nullen! 90 Prozent der gesamten Daten auf der Welt sind in den letzten zwei Jahren entstanden.

Vorbild Mensch

Insbesondere dort, wo Unternehmen, Forschungseinrichtungen, Behörden oder Institutionen mit enormen unstrukturierten Datenbergen in Form von Text, Audio, Video, Klick-Streams, Protokolldateien und vielem mehr konfrontiert sind, ermöglicht IBM Watson die Auswertung der Daten in Echtzeit.

Menschen tun es ganz selbstverständlich: Aus gesprochenen oder geschriebenen Texten analysiert der Homo Sapiens sprachliche Informationen und zieht daraus seine Schlu?sse. Die Bewältigung der gigantischen Datenmengen und -arten lässt sich mit herkömmlichen Analyse-Technologien nicht mehr bewältigen. Die erste Technologie, die sich konsequent auf diese Herausforderung fokussiert hat, ist das nach dem IBM-Gru?nder Thomas J. Watson benannte System.

Drei Kernkompetenzen

Verständnis natu?rlich menschlicher Sprache, neuartige Analyseverfahren, lernendes System - das zeichnet IBM Watson aus. Anders als herkömmliche Computer ist das System in der Lage, Sinn und Zusammenhang auch aus indirekten, hochgradig kontextabhängigen, doppeldeutigen und unscharfen sprachlichen Angaben zu ziehen.

Dabei nutzt es neuartige Verfahren, um seine interne Datenbasis schnell zu analysieren und die wahrscheinlichste Antwort auf Basis von Hypothesen und Wahrscheinlichkeitsberechnungen zu finden. Außerdem kann es Feedback der Nutzer analysieren und dieses Wissen fu?r zuku?nftige Fragen speichern - also Lernen im menschlichen Sinne.

Diese drei Säulen von IBM Watson können fu?r unterschiedliche Aufgaben mit verschiedener Software und Hardware kombiniert werden. Zu den festen Software-Bestandteilen zählen unter anderem:

  • die Unstructured Information Management Architecture (UIMA), ein von IBM entwickeltes, inzwischen als Open-Source erhältliches Framework zur Analyse von unstrukturierten Inhalten sowie
  • Hadoop, eine Apache-Open-Source-Software, die Inhalte u?ber verteilte Systeme hinweg analysiert und verarbeitet.

Technologisch arbeiten im Kern von Watson dieselben Basistechnologien wie in IBM Content Analytics, IBM LanguageWare sowie IBM Infosphere BigInsights.

Verschiedene Einsatzszenarien

IBM Watson ist längst in der Realwirtschaft angekommen, was zahlreiche Anwendungsszenarien zeigen. So gibt es interessante Beispiele aus der Automobilindustrie, von Versicherungsunternehmen sowie aus Marketingabteilungen.

Die Automobilindustrie ist fu?r den Einsatz von IBM Watson prädestiniert aufgrund der zunehmenden Digitalisierung der Funktionen und Prozesse in Fahrzeugen. So kann das intelligente System Ingenieure und Designer bei Antworten auf Fragen nach technischen Spezifikationen unterstu?tzen und Kundenfeedback auswerten.

Bei Werkstatt-Reparaturen bietet das System Fahrer und Mechatroniker Hilfestellung bei komplexen Diagnose- und Wartungsarbeiten. Der Fahrer kann sich u?ber Informationen zu Strecke und Umgebung freuen und bekommt Antworten auf Fragen zur Bedienung des Fahrzeugs.

In einem ganz konkreten Fall half IBM Watson dabei, die von platzenden Reifen ausgehende Gefahr zu reduzieren. IBM Content Analytics wurde bei der National Highway Traffic Safety Administration (NHTSA) in den USA eingesetzt. Fu?r die Analyse hat man u?ber 210.000 Dokumente in das System geladen - alles Fehlerberichte, die Defekte an Automobilen beschreiben und von den Fahrzeughaltern an die NHTSA u?bermittelt wurden.

Die Fehlerbeschreibungen sind frei formuliert und damit ein klassisches Beispiel fu?r die Analyse unstrukturierter Daten. Ziel der NHTSA war es, mithilfe der Analyse bisher unbekannte Problemfälle zu erkennen. Die Textanalyse identifizierte zunächst den Automobilhersteller, fu?r den die meisten Problemberichte eintrafen.

Anschließend brachte die weitere Analyse das Ergebnis, dass die Fahrzeugkomponente "Vorderradaufhängung" statistisch signifikant in den Fehlerbeschreibungen auftritt. Die automatische linguistische Durchdringung der Dokumente und die Suche nach Verben ergab, dass die Begriffe "fracture" (brechen), "flatten" (plätten), "shred" (zerreißen) und "break" (brechen) besonders häufig im Zusammenhang mit dem ausgewählten Automobilhersteller und der Vorderradaufhängung genannt wurden.

Somit konnte die NHTSA die Vielzahl an Dokumenten in wenigen Schritten auf besonders schwerwiegende Fehlerbeschreibungen eingrenzen: Aus den u?ber 210.000 Fehlerberichten wurden weniger als 100 als relevant fu?r dieses Problem identifiziert. Diese ließen sich im Weiteren näher untersuchen, um einer Gefährdung von Personen im Straßenverkehr durch geplatzte Reifen fru?hzeitig entgegenzuwirken.

Wissen trifft auf Rechenpower

Auch in der medizinischen Praxis werden Watson-Technologien eingesetzt: Das Memorial Sloan-Kettering Cancer Center (MSKCC) in den USA arbeitet gemeinsam mit IBM an einem Entscheidungs-Tool fu?r die Diagnostik. Es soll Onkologen dabei helfen, individuelle Krebsdiagnosen und Behandlungsempfehlungen zu erstellen.

Dabei wird Watsons Rechenkraft und Fähigkeit zur Verarbeitung natu?rlicher Sprache mit dem Wissen des MSKCCs sowie dem verfu?gbaren Datenmaterial kombiniert. Ziel ist es, dass Ärzte damit u?berall und jederzeit auf das aktuelle Wissen ad hoc zugreifen können, um damit ihre Diagnosen und Behandlungen zu optimieren.

Die Masse an Daten wird in Zukunft weiter steigen. Diese Entwicklung, bedingt durch die zunehmende Mobilität und Digitalisierung im geschäftlichen als auch im privaten Umfeld, macht die Analyse unstrukturierter Inhalte in Zukunft noch bedeutender.

Mehr zum Thema

Wissenswertes über Big Data Hosting
Outsourcing

Die Datenmengen verdoppeln sich derzeit alle zwei Jahre. Diese Entwicklung stellt auch Service-Provider vor neue Herausforderungen. Mit einer rein…
Metrocluster im Unternehmen
IT-Strategien

Sogenannte Metrocluster sind ein probates Mittel, um die Hochverfügbarkeit der IT-Systeme selbst im Katastrophenfall zu gewährleisten.
IT-Infrastruktur im Rechenzentrum
IT-Strategie

Rechenzentren sind längst mehr als reine Anbieter von IT-Infrastruktur. Davon profitieren alle, die ihre IT auslagern.
Unternehmen,MAnagemenr,Datenqualität
IT-Strategien

Information gilt inzwischen oft als wichtigstes Unternehmensgut. Dennoch wird die Sicherung der Datenqualität in vielen Unternehmen noch sträflich…
Renovierung im Rechenzentrum
IT-Infrastruktur

Die Modernisierung eines Rechenzentrums ist in der Regel ein kostenintensives Großprojekt, bei dem Planung und Koordination ebenso wichtig sind wie…