Im Seminar über die Funktionsweise von Künstlicher Intelligenz und Daten habe ich stellenweise an meiner eigenen Intelligenz zweifeln müssen. Trotzdem: Der intensive Tag mit Prof. Dr. Marc Pouly zum Thema „Technologie der KI“ war eine echte Freude – und das meine ich nicht ironisch.
Er schaffte es, Menschen wie mir, die in Mathematik oft einen Fensterplatz belegten, einen nachvollziehbaren Einblick in die Funktionsweise und Logik von Künstlicher Intelligenz zu geben. Wir arbeiteten die Unterschiede zwischen Machine Learning, Deep Learning und generativer KI heraus. Dieses Grundwissen hilft, die heutigen Möglichkeiten und Grenzen von KI realistischer einzuschätzen.
Wir produzieren täglich riesige Mengen an Daten. Ob wir nun ein Papierarchiv betreiben, oder uns nicht von zwanzig nahezu identischen Fotos trennen können – wir lieben es, Daten zu speichern. Die meisten davon sind unstrukturiert.
Gleichzeitig erwarten wir von KI-Tools präzise Antworten, ohne bereit zu sein, unsere eigenen Daten umfassend zu teilen. „Garbage in = Garbage out.“ Wie schaffen es Unternehmen, ein gutes Datenkonzept zu entwickeln und das Nutzen und Teilen von Daten sinnvoll zu steuern? Wir verwalten oft riesige Mengen an überflüssigen oder schlecht strukturierten Informationen. Ohne ein klares Konzept wird der Datenmüll zur Hypothek: Er blockiert Systeme, erhöht Speicherkosten und erschwert die Entwicklung effizienter KI-Anwendungen. Unternehmen müssen lernen, bewusst Daten auszuwählen, zu klassifizieren und auch zu entsorgen.
Anhand zahlreicher Beispiele aus der Schweizer Wirtschaft, analysierten wir im Praxisseminar mit Christoph Schnidrig, Head of Technology bei AWS, Datenkonzepte und die Technologie-Adaption in Zusammenarbeit mit Amazon Web Services. Erstaunlich, wie viele Firmen und auch öffentliche Verwaltungen ihre Daten den Servern von Amazon anvertrauen.
Als kleines Add-on lernten wir die Plattform https://partyrock.aws kennen – ein tolles Werkzeug, welches Prompt Engineering erleichtert und viele Ideen liefert. Wichtig: Im Backstage-Bereich unbedingt das richtige Häkchen setzen, damit nicht automatisch alle eigenen Daten mit Amazon geteilt werden 😉
Nach dem Beinahe-Ertrinken in der Informationsflut dieser intensiven Seminartage bei RoBe, verstehe ich den Zusammenhang zwischen unstrukturierten und strukturierten Daten. Mir ist klar, warum viele Unternehmen ihre Dienstleistungen scheinbar „gratis“ anbieten. Frei nach dem Motto: „Wenn ein Produkt oder Dienst dich nichts kostet, bist du das Produkt – weil du mit deinen persönlichen Daten bezahlst.“
KI ist datenhungrig – und genau darin liegt auch eine ihrer grössten Grenzen. Ohne qualitativ hochwertige, aktuelle und strukturierte Daten, sinkt die Aussagekraft der KI rapide. Zudem birgt die unersättliche Datensammelwut ethische und rechtliche Risiken: Datenschutzverletzungen, Diskriminierungen durch verzerrte Trainingsdaten und ein zunehmendes Gefühl der Überwachung sind reale Gefahren. Der verantwortungsvolle Umgang mit Daten wird damit zu einer Kernkompetenz im Umgang mit Künstlicher Intelligenz. Hinzu kommt: Jeder neue Release einer KI-Anwendung ist nicht nur datenintensiv, sondern auch extrem energie- und zeitaufwändig. Das Training neuer Modelle verschlingt enorme Rechenleistung, was nicht nur Kosten verursacht, sondern auch die Umwelt belastet.
Gerade deshalb ist es wichtig, sich nicht von der Datenflut, oder auch der Flut von Meinungen, mitreissen zu lassen – um nicht im Datensee zu ertrinken, sondern gezielt und souverän darin zu navigieren.