Comment l'IA générative modifie le travail créatif

Published on 26 Dec 2022

Génératif, IA, Altération, Travail créatif

Mots et images en grand Les modèles d'IA générative, également appelés modèles fondamentaux, ont ouvert de nouvelles portes aux entreprises et aux particuliers engagés dans la génération de contenu. Dans ce blog, nous verrons comment l'IA générative modifie le travail créatif et comment nous le créons et le percevons.

Voir aussi : Un acheteur anonyme paie 28 millions de dollars pour un vol spatial avec Jeff Bezos

Qu'est-ce que l'IA générative ?

L’IA générative est capable de beaucoup de choses. Elle peut générer du contenu écrit et visuel comme des entrées de blog, du code, de la poésie et même des œuvres d’art (et même remporter des concours, ce qui est controversé). Prédire le mot suivant dans une séquence ou l’image suivante à partir de mots décrivant des images précédentes est rendu possible par l’utilisation par le logiciel de modèles d’apprentissage automatique avancés. En 2017, Google Brain a été le premier à utiliser un LLM pour la traduction de texte sensible au contexte. Depuis lors, plusieurs grandes entreprises technologiques, dont Google (avec ses modèles BERT et LaMDA) et Facebook (avec ses modèles OPT-175B et BlenderBot), ainsi que l’association caritative OpenAI, dans laquelle Microsoft détient une participation majoritaire, ont développé d’importants modèles de langage naturel et de texte-image génératifs d’IA (GPT-3 pour le texte, DALL-E2 pour les images et Whisper pour la parole). Des fournisseurs open source comme HuggingFace et des communautés en ligne comme Mid journey (qui a contribué à la victoire du concours) ont également développé des modèles génératifs.

En raison de la grande quantité de données et de ressources informatiques nécessaires à la formation de ces modèles, leur application a été principalement limitée aux grandes entreprises technologiques. GPT-3, par exemple, a utilisé 45 téraoctets de données lors de sa première formation et a utilisé 175 milliards de paramètres ou coefficients pour produire des prédictions ; une seule session de formation pour GPT-3 a coûté 12 millions de dollars. Le modèle chinois, Wu Dao 2.0, comprend 1,75 billion de variables. Les entreprises ont souvent besoin de plus de ressources (capacité du centre de données et fonds pour le cloud computing) pour développer leurs modèles.

BioNeMo est un framework de calcul intensif développé par NVIDIA pour la chimie générative, la protéomique et la modélisation ADN/ARN. Une fois qu'un modèle génératif a été formé, il peut être « affiné » pour un certain domaine de contenu avec beaucoup moins d'entrées. Cela a donné lieu à plusieurs variantes de BERT et GPT-3 spécifiques à un domaine, telles que celles adaptées au domaine biomédical (BioBERT), au secteur juridique (Legal-BERT) et à la langue française (CamemBERT). OpenAI a découvert que seulement 100 échantillons spécifiques à un domaine amélioraient significativement la précision et la pertinence de GPT-3.

L’intervention humaine est nécessaire dès le début et après le processus pour tirer le meilleur parti des applications d’IA générative.

Dans la plupart des cas, lorsque les gens ont la possibilité d’exprimer leur créativité, ils le font. Pour qu’un modèle génératif puisse générer du contenu, une personne doit toutefois lui fournir des déclencheurs. En attendant l’apparition de la prochaine génération d’IA encore plus intelligente, le métier d’« ingénieur de prompteurs » deviendra probablement une carrière bien établie. Un livre de 82 pages contenant des invites d’images DALL-E 2 et une place de marché où les utilisateurs peuvent acheter et vendre des invites pour une somme modique sont déjà issus de cette ligne de recherche. La plupart des utilisateurs devront probablement faire le tour de nombreuses options avant d’obtenir les résultats qu’ils souhaitent de ces systèmes.

Il appartiendra ensuite à une personne d'examiner et de modifier soigneusement le matériel généré par un modèle. Un seul document peut inclure les résultats de plusieurs invites. Il est possible qu'un traitement intensif soit nécessaire pour la production d'images. Le gagnant du concours de « photos modifiées numériquement » du Colorado avec l'aide de Mid journey, Jason Allen, a révélé à un journaliste qu'il avait passé plus de 80 heures à créer plus de 900 itérations de l'œuvre d'art et à peaufiner ses invites encore et encore. Il a ensuite imprimé trois œuvres sur la toile après les avoir modifiées dans Adobe Photoshop et les avoir affinées à l'aide d'un autre programme d'IA.

La diversité des modèles d’IA générative est stupéfiante. Des visuels, des formes étendues de texte, des e-mails, des publications sur les réseaux sociaux, des enregistrements audio, du code et des données structurées leur sont tous accessibles. Ils peuvent générer des écrits originaux, des traductions, des FAQ, des analyses de sentiments, des résumés et même du contenu vidéo.

L'utilisation de l'IA générative dans le monde créatif

Les applications d'IA générative sont capables de répondre à de multiples possibilités créatives. Ces possibilités incluent :

Création de contenu automatisée : automatisation de la production de contenu linguistique et visuel à grande échelle Les articles, les entrées de blog et les mises à jour sur les réseaux sociaux ne sont que quelques exemples des types de contenu qui peuvent être générés automatiquement à l'aide de modèles d'IA. Les entreprises et les professionnels qui produisent souvent du contenu peuvent trouver cette méthode utile pour gagner du temps.

Qualité de contenu améliorée : les modèles d'IA étant capables d'apprendre à partir d'une grande quantité de données et de détecter des schémas que les gens ne sont pas forcément en mesure de remarquer, la qualité du contenu produit par l'IA peut souvent être supérieure à celle générée par les humains. Cela permet de fournir des informations plus fiables et plus utiles.

Diversification des types de contenu : les systèmes d'IA peuvent générer davantage de formes de contenu, pas seulement du texte, des photos ou des vidéos. Cela permet de diffuser des informations plus variées et plus intéressantes à un public plus large.

Supports personnalisés : les modèles d’IA peuvent créer des supports uniques pour chaque utilisateur en fonction de ses goûts. Grâce à ces informations, les entreprises et les professionnels peuvent produire des supports plus susceptibles de trouver un écho auprès du public visé, augmentant ainsi la probabilité qu’ils soient lus et partagés.

Dans quelle mesure cette technologie ressemble-t-elle aux efforts humains dans les activités créatives ?

La phrase en italique suivante est un exemple de réponse à une phrase que nous avons rédigée par GPT-3, un « grand modèle linguistique » (LLM) d’OpenAI. Les avantages et les inconvénients de la plupart des documents produits par l’IA peuvent être vus dans le texte écrit par GPT-3. Tout d’abord, il répond bien aux changements dans les phrases proposées ; nous avons exploré plusieurs phrases avant d’en arriver à celle-là. Deuxièmement, la qualité de l’écriture produite par le système est supérieure à la moyenne ; il n’y a pas d’erreurs d’orthographe ou de grammaire, et les mots utilisés sont appropriés. Le troisième problème est qu’il doit être édité ; une liste numérotée en haut de ce type d’article n’est pas standard. Enfin, il a généré des suggestions que nous avions négligées. Pour donner un exemple, nous n’avons pas encore pensé à ce dernier point concernant le matériel personnalisé.

C'est un exemple frappant de l'utilité de ces modèles d'IA pour les entreprises. Ils pourraient avoir des effets considérables dans des domaines aussi divers que la publicité, l'informatique, le design, les arts, les médias et la communication interpersonnelle, tous directement liés à l'industrie de la production de contenu. Pour un œil non averti, cela pourrait passer pour « l'intelligence artificielle générale » que les humains attendent et redoutent à la fois.

Voir aussi : Le Congrès américain présente 5 projets de loi pour contrôler les géants de la technologie

Conclusion

Ces quelques cas d’utilisation de l’IA générative dans les entreprises devraient nous faire comprendre que nous commençons seulement à explorer les possibilités qu’elle offre aux entreprises et à leurs employés. Nous ne pouvons guère imaginer toutes les possibilités et ramifications que ces modèles d’IA peuvent produire, à condition qu’ils continuent à progresser comme ils l’ont fait au cours de leur courte existence. Par exemple, dans un avenir proche, ces systèmes pourraient devenir la norme pour générer les premières ébauches de la grande majorité de nos contenus écrits ou basés sur des images. Cela comprend les courriels, les lettres, les articles, les logiciels, les rapports, les entrées de blog, les présentations, les vidéos, etc. Des améliorations dans ce domaine auraient des effets considérables et inattendus sur des questions telles que la propriété du contenu et la protection de la propriété intellectuelle. Néanmoins, elles ouvriraient également une nouvelle ère de découverte et d’innovation dans les arts et les sciences.

Image en vedette : Image de Freepik

Abonnez-vous à Whitepapers.online pour en savoir plus sur les nouvelles mises à jour et les changements apportés par les géants de la technologie qui affectent la santé, le marketing, les affaires et d'autres domaines. De plus, si vous aimez notre contenu, partagez-le sur les plateformes de médias sociaux comme Facebook, WhatsApp, Twitter, etc.