Wie funtioniert Big Data?

Nicht eine Technologie, sondern viele

Big Data heißt wörtlich übersetzt nichts anderes als “Große Daten(mengen)”. Der Begriff meint aber nicht nur die Daten, sondern auch das Zusammenspiel der Technologien die bei der Entstehung, dem Speichern, Verarbeiten, und der Analyse zum Einsatz kommen.  Wir wollen diese Kette hier grob nachvollziehen und euch einen Einblick geben, wie aus einem Klick beim Online-Shopping eine personalisierte Werbeanzeige entstehen kann.

Coole Schuhe?

Du sitzt gerade auf der Couch, der Tag ist geschafft, als letzte Amtshandlung hast du eine Tafel Schokolade aufgemacht und willst eigentlich deine Lieblingsserie weiterschauen. Weil dein Laptop sowieso offen ist, schaust du aber nochmal kurz in einen der bekannten Online-Shops, was gerade so im Angebot ist.

Natürlich sind deine Anmeldedaten gespeichert (wäre ja auch nervig sie jedes Mal einzugeben) und du siehst direkt auf der Startseite ein cooles Paar Sneaker. Genau die, welche du dir vor 2 Wochen schon kaufen wolltest und jetzt sind sie sogar reduziert…

Was für ein Zufall, nicht? Ganz im Gegenteil, denn dahinter steckt ein komplexer Prozess. Nicht jeder Nutzer kriegt auf der scheinbar gleichen Seite auch dasselbe zu sehen. Online-Shops versuchen dir genau die passende Werbung anzuzeigen, welche dich zum Kauf verleitet. Um zu verstehen wie Unternehmen diese passenden Artikel finden, müssen wir jetzt ganz genau hinsehen.

 

Daten- Die Grundlage

 

Um zu entscheiden welche Werbung dir angezeigt wird, braucht der Händler zuerst relevante Informationen. Für unser Beispiel kommen diese Daten unter anderem aus deinem Account, den Informationen, die du und andere Nutzer beim Surfen auf der Seite preisgeben oder von innerhalb des Unternehmens. Für unser Beispiel könnten das somit diese sein:

Das Speichern

Natürlich müssen die meisten dieser Daten irgendwo gespeichert sein. Das ist aber gar nicht so einfach, denn es handelt sich um unfassbar große Mengen unterschiedlicher Datentypen.

Daher gibt spezielle Hardware und moderne Software, die es möglich machen riesige Datenmengen effizient zu speichern. Zum Beispiel kann der Online-Händler das Speichern verteilen (distributed storing), unterschiedliche Datentypen zusammen speichern (Nicht-relationale Datenbanken) und flexibel neuen Speicherplatz über das Internet erweitern (cloud storage). Diese Begriffe musst du dir natürlich nicht merken.

 

Die Verarbeitung

Nun muss das Unternehmen die Daten aufbereiten, um sie für die Analyse nutzen zu können. Es wählt dabei die relevantesten Daten aus und bringt diese in eine Form, mit der unser Algorithmus arbeiten kann.

Das muss unglaublich schnell geschehen, denn wenn du auf eine Webseite klickst, bleiben nur Sekundenbruchteile um eine passende Werbung zu finden und anzuzeigen. Um das zu ermöglichen, kann man die Daten auch ohne sie davor zu speichern in einem Datenstrom (engl.: data stream) direkt verarbeiten. Das nennt sich dann Streaming.

 

Die Analyse

Das alles ist aber quasi nur Vorbereitung und bringt uns allein wenig. Erst wenn man die nun gesammelten und aufbereiteten Daten nutzt, um daraus eine möglichst passende Werbung zu generieren, hat man wirklich etwas gewonnen.

Eine Möglichkeit anhand dieser Daten die passende Werbung zu finden, wäre es Künstliche Intelligenz einzusetzen. Man füttert diesen Algorithmus mit passenden Daten und er entscheidet, ob er uns ein paar Sneaker oder eine neue Jacke anzeigt.

Und so zeigt sich, wie Big Data und Künstliche Intelligenz zusammenhängen können. Die Daten sind das Rohmaterial, welches man mithilfe unterschiedlicher Technologien so aufbereiten und speichern muss, dass man es als Antrieb (zum Beispiel für Künstliche Intelligenz) nutzen kann.

 

Fazit

Hinter einem scheinbar günstigen Zufall, steckt hier also Big Data. Von unzähligen ganz unterschiedlichen Daten, über das Speichern, Verarbeiten und Analysieren bis zum Endergebnis ist Big Data ein ganzes Feld unterschiedlicher Technologien.

Dein Feedback zum Artikel

    Schüler (Klasse 5-9)Oberstufen-Schüler (Klasse 10-13)StudentBerufstätigBerufstätig mit Bezug zum Thema