Die Datenwirtschaft #7: Wer hat's geschrieben?

Ausgabe 7 - Wer hat's geschrieben?

Willkommen

Nach drei sehr erholsamen Wochen Urlaub, endlich die siebte Ausgabe des Newsletters! Ja, die Datenwirtschaft lebt noch.

In dieser Ausgabe dreht sich alles um GPT-3 und zwei Bücher, die nicht durch GPT-3 erstellt wurden.

Viel Spaß beim Lesen!

Wer hat es geschrieben?

GPT-3 ist die dritte Generation eines Sprachverarbeitungsmodell (NLP) von OpenAI. Füttert man das Modell mit einem kurzen Textabschnitt, ergänzt den weiteren Text. Und zwar relativ sinnvoll. Im Mai noch als Paper veröffentlicht, gibt es mittlerweile erste Anwendungsfälle, die zugegebener Maßen ziemlich gut sind. Dazu später mehr.

Für alle, die sich dafür interessieren, wie GPT-3 funktioniert, hat Jay Alammar einen schönen Artikel verfasst. GPT-3 ist Open Source, somit kann jeder damit arbeiten. Um vorweg die Angst zu nehmen: Stand heute hat die KI Probleme einen Turing-Test zu bestehen. Dennoch ist das Modell in der Lage beeindruckende Texte zu verfassen. Das Einsatzgebiet ist nicht nur auf Textgenerierung beschränkt. Man kann damit beispielsweise auch Anwendungen beschreiben und das Modell erzeugt den Code. Werden Entwickler jetzt arbeitslos? Warten wir’s ab! Und wie ist es mit Design? Auch hier hat jemand GPT-3 ins Spiel gebracht.

Aber wie „kreativ“ kann ein Modell sein? Auch das wurde ausprobiert und hat (in deutsch) ein Märchen generieren lassen. So schlecht ist das nicht. Und wer noch eine gute Geschäftsidee sucht, kann mit GPT-3 ebenfalls auf Unterstützung hoffen! Es gibt Stimmen, die GPT-3 als das nächste große Ding nach Bitcoin handeln.

GPT-3 ist beeindruckend, keine Frage. Die Grenzen zwischen von Menschen erzeugten Texten und denen einer KI verschwimmen mehr und mehr. In Zukunft können Texte von der KI vorformuliert, die von einem Menschen „nur“ noch in Form gebracht werden müssen. Was das für Bots, Fake News etc. bedeutet, ist noch nicht absehbar. Ich finde das Gebiet sehr spannend und freue mich auf weitere gute Einsatzmöglichkeiten dieser Technologie.

Ich habe gelesen

In den letzten Wochen habe ich zwei Daten relevante Bücher gelesen. Zum einen ist es Data Science (aff. Link) von John D. Kelleher und Brendan Tierney.
Mit diesem Buch erhält man einen sehr guten Überblick und Einblick, was Data Science eigentlich ist. Von der Entstehung bis zum heutigen Stand der Technik werden alle zugehörigen Themen jederzeit gut verständlich erläutert. Vor allem kommt der ethische Aspekt nicht zu kurz. Alles in allem ein wirklich gutes Buch, dass ich jedem Empfehle, der den Einstieg in Data Science finden möchte, aber auch für diejenigen, die das Thema nochmals fundiert auffrischen möchten! Klare Leseempfehlung von mir.

Das zweite Buch ist Storytelling with Data (aff. Link) von Cole Nussbaumer Knaflic. Jeder, der sich auch nur im entferntesten mit Erstellung von Diagrammen beschäftigt, sollte dieses Buch lesen. Man erfährt alles über effektive Gestaltung von Diagrammen, wie eine Leitidee für eine Datenstory entwickelt und diese verfolgt und erzählt werden kann. Seien es Geschäftszahlen oder andere Statistiken, es ist auf nahezu alles anwendbar. Im Buch geht es nicht um fancy Visualisierungen mit heftigem Programmieraufwand. Die Autorin beispielsweise erstellt alle ihre Diagramme mit Excel. Somit ist die Zielgruppe weit gefasst. Nachdem ich das Buch gelesen habe, sehe ich Datenvisualisierungen mit ganz anderen Augen. Ein wahrer Augenöffner und eine absolute Leseempfehlung!

Links

Deepfakes. Meiner Meinung nach die größte Pest, dank KI. Es muss nicht immer Videomaterial sein. Lass deinen Text durch Promis vortragen. Ich mag es nicht wirklich, bin aber beeindruckt.

Mit Daten und KI gutes tun? SAS zeigt, wie mit einer KI dem Bienensterben entgegengetreten werden kann.

Bitte schreibt gute ALT-Texte für eure Visualisierungen, damit auch die, die sie nicht sehen können, wissen, was ihr getan habt.

Damit haben wir wieder das Ende der dieser Ausgabe erreicht! Ich freue mich über Verbesserungsvorschläge und Tipps für Themen, Links oder Meinungen. Gerne per Mail an hallo@datenwirtschaft.online oder einfach per Twitter an mich senden.

Dir hat der Newsletter gefallen? Empfiehl ihn doch weiter.