Datenminen

Informationsschätze entdecken mit Data Mining

25.2.2011 von Klaus Manhart

In großen Datensammlungen wie Logfiles oder Kundenbestellungen verstecken sich wichtige Informationen, die mit gängigen Datenanalyse-Tools oft schwer zu finden sind. Mehr Erfolg verspricht die relativ junge Methode des Data Mining.

ca. 2:05 Min
Ratgeber
VG Wort Pixel
  1. Informationsschätze entdecken mit Data Mining
  2. Data-Mining-Methoden
  3. Klassifikationsverfahren
  4. Regressionsanalyse
gebäude, glas
gebäude, glas
© PC Magazin

Von Mitarbeiterdaten über Verkaufs- und Umsatzzahlen bis zu Statistiken von Website-Besuchen - in jedem Unternehmen fallen heute immense Datenmengen an. Solange diese gut strukturiert in Datenbanken organisiert sind und solange man weiß, wonach man sucht, ist die Welt in Ordnung.

Anders sieht es aus, wenn die Daten unstrukturiert sind oder das Suchziel unbekannt ist. Das kann etwa der Fall sein bei Daten aus Beständen wie Weblogs oder Kunden-Feedbacks. Die lassen sich oft nicht einfach abfragen. Man vermutet vielleicht, dass sie wichtige Erkenntnisse enthalten könnten. Doch wie soll dieses implizite Wissen im Datenwust entdeckt werden?

Die Lösung heißt Data Mining. Data-Mining-Werkzeuge sind darauf spezialisiert, unbekanntes Wissen in Datensammlungen zu finden. Sie decken Trends, Muster und Zusammenhänge auf - und können so wichtige Erkenntnisse wie etwa Vorhersagen über Kundenverhalten ableiten.

Im Gegensatz zu den klassischen Abfragewerkzeugen muss der Anwender beim Data Mining nicht von vornherein wissen, wonach er sucht. Vielmehr führt Data Mining den Anwender von sich aus zu den interessanten Informationen.

Data Mining ist allerdings keine einheitliche Methode, sondern eine Sammlung verschiedener Verfahren. Gemeinsam ist diesen, dass sie induktiv und datengesteuert arbeiten. Sie gehen also immer von den vorliegenden Daten aus und leiten daraus Hypothesen und Zusammenhänge ab.

Anwendungsbeispiele

Data Mining
Entscheidungsbaum: Knoten segmentieren den Datenbestand, die Kanten liefern hierfür die Bedingungen.
© PC Magazin

Data Mining wird heute in der Wissenschaft, bei Behörden und vor allem in der Wirtschaft angewendet. Banken nutzen Data Mining zur Erkennung von Kreditkartenbetrug und für die Profilerstellung von Kunden, die mit gewisser Wahrscheinlichkeit ihre Verbindlichkeiten nicht erfüllen können.

Im Marketing wird Data Mining genutzt um Absatzprognosen, Kundensegmentierungen, Warenkorbanalysen und Missbrauchserkennungen durchzuführen. Im Personalwesen werden die Personalauswahl und die Erkennung von Mitarbeiterfehlern durch Data Mining unterstützt. Strafverfolgungsbehörden nutzen es zur Aufdeckung von Geldwäsche.

Einen starken Aufwind erlebte Data Mining mit Web-Anwendungen - hier hat sich auch der Begriff Web Mining etabliert. Web Mining nutzt die klassischen Data-Mining-Verfahren, hat sie aber auch ausgebaut und verfeinert. Kommerziell lässt sich Web Mining für Verkauf und Kundenbindung einsetzen.

Online-Händler wie Amazon oder Verlage nutzen es, um mehr über ihre Besucher zu erfahren und ihre Angebote zu optimieren. Online-Händler können etwa feststellen, worin sich Kunden, die ein bestimmtes Produkt erworben haben, von denjenigen unterscheiden, die das Produkt nicht gekauft haben.

Die gewonnene Erkenntnis lässt sich nutzen, um potenzielle Neukunden zu identifizieren, die aufgrund ihrer Merkmalsstruktur das betreffende Produkt wahrscheinlich auch kaufen. Ferner wird Data Mining häufig eingesetzt, um eine Gruppe von Besuchern auf der Basis bestimmter Merkmale in Untergruppen aufzuteilen, die dann wiederum gezielt und individuell mit Marketing-Maßnahmen kontaktiert werden.

Data-Mining-Techniken beziehen ihre Daten für gewöhnlich aus unterschiedlichsten Quellen. Im WWW und E-Business sind dies insbesondere Internet-Logdateien, Cookies, an Anmeldeformulare angebundene Datenbanken, Daten aus dem dynamischen Tracking der Besucher oder Daten von Drittanbietern.

Die Daten werden in größeren Organisationen oft in einem Data Warehouse gespeichert. Data Warehouses sind große Datenlager, die bis zu mehreren Terabyte umfassen können.

Mehr lesen

Chronologische Liste und Netflix-Links

Marvel-Filme- und -Serien: Das ist die richtige Reihenfolge

Neuerscheinungen in der Übersicht

Netflix: Neue Filme und Serien

Vorschau auf Film- und Serien-Highlights

Amazon Prime Video: Neuheiten

Weiter zur Startseite  

Mehr zum Thema

PS Plus: Monatliche Spiele im Februar: UFC 4, Tiny Tinas Sturm auf die Drachenfestung und Planet Coaster

PS5- und PS4-Spiele kostenlos

PS Plus: Gratis-Spiele im Februar 2022

Playstation Plus bringt Mitgliedern jeden Monat Gratis-Games für die PS5 und PS4. Wir verraten, welche Titel die neuen PS Plus Spiele sind.

Wir zeigen, welche Spiele im Game Pass warten.

Spiele-Flatrate für Xbox Series, One, 360 und PC

Xbox Game Pass Spiele: Neue Spiele ab Januar 2022

Regelmäßig bekommt der Game Pass neue Spiele. Welche neuen Games Besitzer von Xbox Series X/S, One, Xbox 360 und PC aktuell bekommen, verrät dieser…

Grafikkarte optimal einstellen

GPUs mit Echtzeit-Raytracing

Nvidia & AMD: Wann kommen neue Grafikkarten?

Ende 2020 startete Nvidias RTX 3000. AMD folgte mit RX 6000. Wann kommen neue Grafikkarten? +++ OVP-Foto einer RTX 3090 Ti und neue Einsteiger-Chips…

PS5: Sony zeigt die Menüs

Sony-Konsole

PS5-Spiele: Liste aller bestätigten Playstation-5-Games

Die Playstation 5 erschien am 19. November 2020. Wir zeigen in einer übersichtlichen Liste, welche PS5-Spiele zur Verfügung stehen und stehen werden.

Gratis-Spiele-bei-Steam-und-Epic

Vollversionen geschenkt & zum Antesten

Gratis-Spiele bei Steam, Epic, Humble Bundle & mehr im…

In dieser Übersicht zeigen wir Ihnen jeden Monat die Spiele, die Sie kostenlos bei Steam, im Epic Games Store, im Humble Bundle und mehr erhalten.