Wie generative KI die kreative Arbeit verändert

Published on 26 Dec 2022

Generative, KI, Veränderung, Kreative Arbeit

Große Worte und Bilder Generative KI-Modelle, auch als grundlegende Modelle bekannt, haben Unternehmen und Einzelpersonen, die sich mit der Inhaltserstellung beschäftigen, neue Türen geöffnet. In diesem Blog diskutieren wir, wie generative KI kreative Arbeit verändert und wie wir sie erstellen und wahrnehmen.

Siehe auch: Anonymer Bieter zahlt 28 Millionen Dollar für Weltraumflug mit Jeff Bezos

Was ist generative KI?

Generative KI ist zu vielem fähig. Sie kann schriftliche und visuelle Inhalte wie Blogeinträge, Code, Gedichte und sogar Kunstwerke generieren (und sogar Wettbewerbe gewinnen, was umstritten ist). Die Vorhersage des nächsten Wortes in einer Sequenz oder des nächsten Bildes aus Wörtern, die vorherige Bilder beschreiben, wird durch die Verwendung fortschrittlicher Modelle des maschinellen Lernens durch die Software ermöglicht. Im Jahr 2017 war Google Brain das erste Unternehmen, das ein LLM für kontextsensitive Textübersetzung einsetzte. Seitdem haben mehrere große Technologieunternehmen, darunter Google (mit seinen Modellen BERT und LaMDA) und Facebook (mit seinen Modellen OPT-175B und BlenderBot) sowie die Wohltätigkeitsorganisation OpenAI, an der Microsoft eine Mehrheitsbeteiligung hält, bedeutende generative KI-Modelle für natürliche Sprache und Text-zu-Bild-Umwandlung entwickelt (GPT-3 für Text, DALL-E2 für Bilder und Whisper für Sprache). Open-Source-Anbieter wie HuggingFace und Online-Communitys wie Mid Journey (die zum Sieg des Wettbewerbs beigetragen haben) haben ebenfalls generative Modelle entwickelt.

Aufgrund der enormen Datenmenge und der Rechenleistung, die zum Trainieren dieser Modelle erforderlich sind, war ihre Anwendung bisher hauptsächlich auf große Technologieunternehmen beschränkt. GPT-3 beispielsweise verwendete während seines ersten Trainings 45 Terabyte an Daten und verwendete 175 Milliarden Parameter oder Koeffizienten, um Vorhersagen zu erstellen; eine einzige Trainingssitzung für GPT-3 kostete 12 Millionen Dollar. Das chinesische Modell Wu Dao 2.0 umfasst 1,75 Billionen Variablen. Unternehmen benötigen oft mehr Ressourcen (Rechenzentrumskapazität und Mittel für Cloud Computing), um ihre Modelle zu entwickeln.

BioNeMo ist ein von NVIDIA entwickeltes Framework im Supercomputing-Maßstab für generative Chemie, Proteomik und DNA/RNA-Modellierung. Sobald ein generatives Modell trainiert wurde, kann es jedoch mit deutlich weniger Aufwand für einen bestimmten Inhaltsbereich „fein abgestimmt“ werden. Dies hat zu mehreren domänenspezifischen Varianten von BERT und GPT-3 geführt, beispielsweise solchen, die auf den biomedizinischen Bereich (BioBERT), den Rechtssektor (Legal-BERT) und die französische Sprache (CamemBERT) zugeschnitten sind. OpenAI hat festgestellt, dass nur 100 domänenspezifische Beispiele die Genauigkeit und Relevanz von GPT-3 deutlich verbesserten.

Um den größtmöglichen Nutzen aus generativen KI-Anwendungen zu ziehen, ist zu Beginn und im Anschluss an den Prozess menschliches Eingreifen erforderlich.

In den meisten Fällen nutzen Menschen die Gelegenheit, ihrer Kreativität Ausdruck zu verleihen, wenn sie die Möglichkeit dazu haben. Damit ein generatives Modell jedoch Material generieren kann, muss eine Person ihm einige Auslöser geben. Bis die nächste Generation einer noch intelligenteren KI erscheint, wird sich der Beruf des „Prompt Engineers“ wahrscheinlich zu einem etablierten Beruf entwickeln. Aus dieser Forschungsrichtung sind bereits ein 82-seitiges Buch mit DALL-E 2-Bildaufforderungen und ein Marktplatz hervorgegangen, auf dem Benutzer gegen eine geringe Gebühr Aufforderungen kaufen und verkaufen können. Die meisten Benutzer werden wahrscheinlich viele Optionen durchgehen müssen, bevor sie mit diesen Systemen die gewünschten Ergebnisse erzielen.

Anschließend liegt es an einer Person, das von einem Modell generierte Material sorgfältig zu prüfen und zu ändern. Ein einzelnes Dokument kann die Ergebnisse vieler Eingabeaufforderungen enthalten. Es ist möglich, dass für die Bildproduktion eine intensive Verarbeitung erforderlich ist. Jason Allen, Gewinner des Wettbewerbs „Digital veränderte Fotos“ in Colorado mit Unterstützung von Mid Journey, verriet einem Reporter, dass er mehr als 80 Stunden damit verbracht habe, mehr als 900 Iterationen des Kunstwerks zu erstellen und seine Eingabeaufforderungen immer wieder zu verfeinern. Anschließend druckte er drei Werke auf die Leinwand, nachdem er sie in Adobe Photoshop bearbeitet und mit einem anderen KI-Programm geschärft hatte.

Die Vielfalt der generativen KI-Modelle ist atemberaubend. Visuelle Darstellungen, erweiterte Textformen, E-Mails, Social-Media-Beiträge, Audioaufnahmen, Code und strukturierte Daten sind für sie alle zugänglich. Sie können Originaltexte, Übersetzungen, FAQs, Stimmungsanalysen, Zusammenfassungen und sogar Videomaterial generieren.

Der Einsatz generativer KI in der Kreativwelt

Generative KI-Anwendungen können zahlreiche kreative Möglichkeiten erfüllen. Zu diesen Möglichkeiten gehören:

Automatisierte Inhaltserstellung: Automatisierung der Produktion sprachlicher und visueller Inhalte im großen Maßstab Artikel, Blogeinträge und Social-Media-Updates sind nur einige Beispiele für die Arten von Material, die mithilfe von KI-Modellen automatisch generiert werden können. Unternehmen und Fachleute, die häufig Material erstellen, finden dies möglicherweise eine hilfreiche Methode, um Zeit zu sparen.

Verbesserte Inhaltsqualität: Da KI-Modelle aus großen Datenmengen lernen und Muster erkennen können, die Menschen möglicherweise nicht erkennen, ist die Qualität des von KI erstellten Materials häufig höher als die von Menschen erstellte. Dies kann zu zuverlässigeren und nützlicheren Informationen führen.

Diversifizierte Inhaltsarten: KI-Systeme können mehr Materialformen generieren, nicht nur Text, Fotos oder Videos. Dadurch können vielfältigere und faszinierendere Informationen ein größeres Publikum erreichen.

Maßgeschneiderte Materialien: KI-Modelle können für jeden Benutzer je nach Geschmack einzigartige Materialien erstellen. Mit diesen Informationen können Unternehmen und Fachleute Materialien erstellen, die bei ihrer Zielgruppe eher Anklang finden und so die Wahrscheinlichkeit erhöhen, dass sie gelesen und geteilt werden.

Wie gut ähnelt diese Technologie den menschlichen Bemühungen bei kreativen Unternehmungen?

Der folgende kursiv gedruckte Satz ist eine Beispielantwort auf einen Satz, den wir mit GPT-3, einem „Large Language Model“ (LLM) von OpenAI, verfasst haben. Die Vor- und Nachteile der meisten von KI produzierten Materialien sind im von GPT-3 verfassten Text zu sehen. Erstens reagiert es gut auf Änderungen in den bereitgestellten Satzansagen; wir haben mehrere Sätze untersucht, bevor wir uns für diesen entschieden haben. Zweitens ist die Qualität der vom System erstellten Texte überdurchschnittlich; es gibt keine Rechtschreib- oder Grammatikfehler und die verwendeten Wörter sind passend. Das dritte Problem ist, dass es bearbeitet werden muss; eine nummerierte Liste am Anfang dieser Art von Artikeln ist nicht Standard. Endlich hat es Vorschläge generiert, die wir übersehen hatten. Um ein Beispiel zu nennen: An den letzten Teil bezüglich maßgeschneidertem Material müssen wir noch denken.

Dies ist ein gutes Beispiel dafür, wie nützlich diese KI-Modelle für Unternehmen sein können. Sie könnten weitreichende Auswirkungen auf so unterschiedliche Bereiche wie Werbung, Informatik, Design, Kunst, Medien und zwischenmenschliche Kommunikation haben, die alle direkt mit der Content-Produktionsbranche verbunden sind. Für das ungeübte Auge könnte dies als die „künstliche allgemeine Intelligenz“ durchgehen, nach der sich die Menschen so sehr gesehnt und die sie zugleich gefürchtet haben.

Siehe auch: US-Kongress führt 5 Gesetzesentwürfe ein, um die Tech-Giganten im Zaum zu halten

Abschluss

Diese wenigen Anwendungsfälle für generative KI in Unternehmen sollten deutlich machen, dass wir gerade erst anfangen, die Möglichkeiten zu erkunden, die sie für Unternehmen und ihre Mitarbeiter bietet. Wir können kaum alle Möglichkeiten und Auswirkungen ermessen, die diese KI-Modelle hervorbringen könnten, vorausgesetzt, sie entwickeln sich weiterhin so weiter wie in ihrer kurzen Existenz. Beispielsweise könnten diese Systeme in naher Zukunft die Norm für die Erstellung der ersten Entwürfe der überwiegenden Mehrheit unserer schriftlichen oder bildbasierten Inhalte sein. Dazu gehören E-Mails, Briefe, Artikel, Softwareprogramme, Berichte, Blogeinträge, Präsentationen, Videos usw. Verbesserungen in diesem Bereich hätten weitreichende und unerwartete Auswirkungen auf Themen wie Inhaltseigentum und IP-Schutz. Dennoch würden sie auch eine neue Ära der Entdeckung und Innovation in den Künsten und Wissenschaften einläuten.

Vorgestelltes Bild: Bild von Freepik

Abonnieren Sie Whitepapers.online, um über neue Updates und Änderungen der Technologiegiganten informiert zu werden, die sich auf Gesundheit, Marketing, Wirtschaft und andere Bereiche auswirken. Wenn Ihnen unsere Inhalte gefallen, teilen Sie sie bitte auf Social-Media-Plattformen wie Facebook, WhatsApp, Twitter und mehr.