Die Datenwirtschaft #8: Das kann ich dir empfehlen!
Ausgabe 8 - Das kann ich dir empfehlen!
Willkommen
Was steckt hinter den Produktempfehlungen bei Amazon? Warum sind die Netflix-Empfehlungen so wie sie sind? Recommender Systeme sind nicht mehr wegzudenken. Und wie viel "Spaß" man mit nur einem Selfie haben kann - erstaunlich! Oder erschreckend?
Fans von Data Science lieben auch diesen Newsletter! (Ganz ohne Recommender System ermittelt)
Viel Spaß beim Lesen!
Das wird dir auch gefallen – Recommender Systems
Recommender Systems oder auf Deutsch: Empfehlungssysteme. Mittels Analyse der Vergangenheit, dem Verhalten der Nutzer und ein paar KI-Zaubereien passgenaue Empfehlungen für weiteren Inhalt, Artikel oder was-auch-immer finden. Soweit die Theorie.
Wir werden täglich mit diesen Systemen konfrontiert, auch wenn man es nicht immer merkt. Ob E-Commerce, Filme, Musik oder Artikel, überall wird versucht passende Inhalte auf Basis unserer bisherigen Vorlieben zu empfehlen. Das funktioniert manchmal gut, manchmal weniger gut. So schlägt Amazon nach einem Kühlschrankkauf oft einen weiteren Kühlschrank vor. Ganz anders bei Netflix. Die vorgeschlagenen Filme passen meist gut zum bisherigen Konsum. Auch Instagram schafft es relativ gut, passende neue Accounts vorzuschlagen, die wir doch abonnieren sollen. Aber wie funktioniert das alles?
Wir unterscheiden grob in zwei Ansätzen: die kollaborative und die inhaltsbasierte Methode. Die kollaborative Methode analysiert die Interaktionen zwischen Benutzer und den Artikeln. Einfachstes Beispiel: „Andere Nutzer haben noch folgendes gekauft“. Bei der inhaltsbasierten Methode werden mehrere Parameter berücksichtigt, wie z. B. Alter, Geschlecht, Wohnort etc. Daraus wird ein Modell ermittelt, das beschreiben soll, warum ein Benutzer mit den Artikeln interagiert. Inhaltsbasierte Modell versagen am Anfang stärker, da beinahe willkürlich vorgeschlagen wird - es fehlen einfach Daten. Sind genug Daten vorhanden (gesammelt, gekauft etc.), wird das Modell besser abschneiden als das Kollaborative. In der Praxis kommt meistens ein Mix beider Methoden zum Einsatz.
Natürlich ist das Thema komplexer, als dass man es im Newsletter bearbeiten kann. Wer tiefer einsteigen will, kann mit diesem Artikel einen umfassenden Einstieg in die Theorie finden. Für diejenigen, die ein System selbst aufbauen möchten, finden bei Datacamp und Towards Datascience gute Artikel (Python basiert). Ein weiterer toller Artikel beschriebt das hochgelobte System von Netflix etwas detaillierter. Ob man diese Systeme mag oder nicht, sie kommen zum Einsatz. Gefallen müssen sie uns nicht, vor allem, wenn es um politische Äußerungen geht, wie es bei Twitter, Facebook und Co. der Fall ist. Schnell ist man in (s)einer Filterblase gefangen. Daher immer überlegen, woher die Empfehlungen kommen und welche Parameter die Grundlage des Modells gewesen sein könnten.
Wem gehört das Gesicht?
Disclaimer: Ich verlinke in diesem Abschnitt nichts, da ich der Meinung bin, die erwähnten „Dienste“ sind nur gut gemeint. Und was das heißt, weiß jeder …
Persönlich bin ich kein großer Freund von Deepfakes. Das Missbrauchspotential ist gewaltig. Leider ist die Erstellung von solchen Videos viel zu einfach geworden. Es existieren Apps, die das in ein paar Sekunden durchführen. Ein Selfie, das zum Anbieter geladen wird, reicht aus. Die Ergebnisse sind witzig, keine Frage. Was sonst so mit den Selfies getrieben wird? Warten wir’s ab. Ach ja: Die Intelligenz läuft ausschließlich auf deren Servern.
Wenn wir schon beim Thema Gesichtserkennung sind: Ein neuer Dienst verspricht anhand eines Selfies zu prüfen, ob das Gesicht in einem Porno zu finden ist. Preis? Pro Suche 2,00 €. Aus Gründen muss das Bild mit der Webcam auf der Webseite angefertigt werden, hochladen ist nicht erlaubt! Nur gut, dass man keine Fotos oder andere Bilder hinhalten kann. Aus meiner Sicht ein gut gemeinter Dienst, der schnell das Gegenteil bewirkt und gezielt nach bestimmten Menschen in den Filmen gesucht werden kann. Und auch hier: Das Bild wird hochgeladen, auf dem Server verarbeitet und danach ausgewertet. Denkt darüber nach, bevor ihr so etwas tut.
Schöne neue KI-Welt, oder?
Links
Wer einmal aus seiner YouTube Filterblase ausbrechen möchte, kann mit TheirTube die Perspektive wechseln. Achtung: Kann zu verstörtem Kopfschütteln führen!
Data Science und Machine Learning in kurzen Happen auf Twitter erklärt? Das macht Oliver Zeigermann aka @djcordhose in diesem Thread!
Wer sich mal an einem Recommender System versuchen möchte: Netflix hatte bei Kaggle eine Herausforderung zur Verbesserung des Empfehlungssystems. Wer selber (ohne Preisgeld) sich daran versuchen will, findet dort weiterhin das Datenset.
Damit haben wir wieder das Ende der dieser Ausgabe erreicht! Ich freue mich über Verbesserungsvorschläge und Tipps für Themen, Links oder Meinungen. Gerne per Mail an hallo@datenwirtschaft.online oder einfach per Twitter an mich senden.
Dir hat der Newsletter gefallen? Empfiehl ihn doch weiter.