Die Datenwirtschaft #5: Wir sind live.

Ausgabe 5 - Wir sind live

Willkommen

In der letzten Ausgabe freute ich mich noch über meinen wöchentlichen Rhythmus. Zack sind wir im Zweiwöchigem. Wie auch immer. Dieses Mal geht es darum, wie ein Datenprojekt im produktiven Umfeld eingesetzt werden kann und was das bedeutet. Außerdem: Bots, Bots, Bots und wie werde ich Data Scientist?

Viel Spaß beim Lesen!

Machine Learning in Produktion

Datenbasierte Projekte fangen meist explorativ an. Die Fachabteilungen haben Bedürfnisse, die mit den Daten erfüllt werden sollen. Marketing möchte Kundensegmente analysieren, Verkaufszahlen sollen prognostiziert werden oder ähnlich Anforderungen entstehen.

Die Daten werden analysiert und bereinigt. Anschließend kommt die Suche nach einem passenden Modell für die Daten. Es wird trainiert und evaluiert, bis ein vermutlich gut passendes Modell gefunden wurde. Dieses (Machine Learning) Modell muss im nächsten Schritt irgendwie in den „Betrieb“, sprich in einem Produktivsystem eingesetzt werden. Dieser Schritt ist nicht trivial. Luigi Patruno hat sich in einer mehrteiligen Artikelserie der Herausforderung angenommen. Vor allem der erste Artikel beschreibt die Anforderungen an ein solches System sehr gut.

Ein Machine Learning Modell in Produktivumgebungen zu deployen, ist vor allen bei Geschäftsanwendungen sehr wichtig. Einige Inspirationen, wie ML im Business-Kontext eingesetzt werden kann, hat SoftMediaLab bereits 2018 zusammengefasst.

Bots. Bots everywhere.

Bots. Überall Bots. Glaubt man den Medien, werden wir derzeit gezielt durch Abermillionen Bots in unserer Meinung fremdgesteuert. Fake News und Verschwörungstheorien. Alles Bots. Betrachtet man sich die Entwicklung bei Microsoft, werden demnächst alle Journalisten durch Bots, genauer gesagt einer KI ersetzt.

Florian Gallwitz analysiert diese vermeintlichen Bots und es stellt sich heraus: Oftmals sind es keine Bots, sondern tatsächlich Menschen, die den Unsinn verzapfen. Einige fragwürdige Artikel zu Bots hat Prof. Gallwitz bereits auf Twitter thematisiert.

Was es bedeutet, einen Bot zu erstellen, der regelmäßig einen Tweet absetzt, habe ich im Selbstversuch erfahren. Disclaimer: Der Bot ist weder intelligent noch toxisch. Zeigt aber, dass mit wenig Zeilen Code bereits etwas erreicht werden kann.

Berufswunsch Data Scientist

Der Begriff Data Science ist heute in aller Munde. Aber was gehört dazu, ein Data Scientist sein? Genau das hat Shilpa Arora auf Data Science Central erläutert.

Quereinstieg in Data Science ist leichter als man zunächst glauben mag. Es gibt sehr viele Ressourcen mit gutem Material zum Selbststudium. Kuratierte Listen zu YouTube Channels, einfache Kurse zu komplexen Themen oder gute Open-Source-Projekte zur Inspiration - alles ist frei verfügbar. Dazu kommen zahlreiche Schulungsanbieter, die teilweise auch freie Kurse anbieten.

Wer seine Kenntnisse einsetzen möchte, aber noch keine Idee hat, wie und wo, dem ist mit diesen drei Projektideen geholfen.

Um nach dem Selbststudium auch einen Job als Data Scientist zu ergattern, ist es hilfreich zu wissen, was potenzielle Fragen und Anforderungen an das Profil sein können.

Links

Oliver Zeigermann und Stefan Zörner haben in der 10. Ausgabe von embarcs Architektur Spicker das Thema Machine Learning Lösungen behandelt.

Matthew Eric Bassett ist der Meinung, AI im Geschäftsumfeld ist unnütz.

Diese sieben Todsünden des Machine Learnings sollte man unbedingt vermeiden.

Damit haben wir wieder das Ende der dieser Ausgabe erreicht! Ich freue mich über Verbesserungsvorschläge und Tipps für Themen, Links oder Meinungen. Gerne per Mail an hallo@datenwirtschaft.online oder einfach per Twitter an mich senden.

Dir hat der Newsletter gefallen? Empfiehl ihn doch weiter.