Grandes palabras e imágenes Los modelos de IA generativa, también conocidos como modelos fundamentales, han abierto nuevas puertas para las empresas y las personas que se dedican a la generación de contenido. En este blog, analizaremos cómo la IA generativa altera el trabajo creativo y cómo lo creamos y lo percibimos.
Ver también: Postor anónimo paga 28 millones de dólares por vuelo espacial con Jeff Bezos
¿Qué es la IA generativa?
Tal como están las cosas, la IA generativa es capaz de hacer muchas cosas. Puede generar contenido escrito y visual, como entradas de blog, código, poesía e incluso obras de arte (e incluso ganar concursos, de forma controvertida). Predecir la siguiente palabra en una secuencia o la siguiente imagen a partir de palabras que describen imágenes anteriores es posible gracias al uso que hace el software de modelos avanzados de aprendizaje automático. En 2017, Google Brain fue el primero en emplear un LLM para la traducción de textos en función del contexto. Desde entonces, varias empresas tecnológicas importantes, incluidas Google (con sus modelos BERT y LaMDA) y Facebook (con sus modelos OPT-175B y BlenderBot), así como la organización benéfica OpenAI, en la que Microsoft tiene una participación mayoritaria, han desarrollado importantes modelos de IA generativa de lenguaje natural y de conversión de texto a imagen (GPT-3 para texto, DALL-E2 para imágenes y Whisper para voz). Proveedores de código abierto como HuggingFace y comunidades en línea como Mid journey (que contribuyeron a la victoria de la competencia) también han desarrollado modelos generativos.
Debido a la enorme cantidad de datos y recursos computacionales necesarios para entrenar estos modelos, su aplicación se ha limitado principalmente a las grandes corporaciones tecnológicas. GPT-3, por ejemplo, utilizó 45 terabytes de datos durante su primer entrenamiento y empleó 175 mil millones de parámetros o coeficientes para producir predicciones; una sola sesión de entrenamiento para GPT-3 costó 12 millones de dólares. El modelo chino, Wu Dao 2.0, incluye 1,75 billones de variables. Las empresas a menudo necesitan más recursos (capacidad de centro de datos y fondos de computación en la nube) para desarrollar sus modelos.
BioNeMo es un marco de trabajo a escala de supercomputación desarrollado por NVIDIA para la química generativa, la proteómica y el modelado de ADN/ARN. Sin embargo, una vez que se ha entrenado un modelo generativo, se lo puede "afinar" para un determinado dominio de contenido con una cantidad de datos considerablemente menor. Esto ha dado lugar a varias variantes específicas de dominio de BERT y GPT-3, como las adaptadas al campo biomédico (BioBERT), el sector legal (Legal-BERT) y el idioma francés (CamemBERT). OpenAI descubrió que solo 100 muestras específicas de dominio mejoraron significativamente la precisión y la relevancia de GPT-3.
Se requiere la participación humana desde el principio y después del proceso para aprovechar al máximo las aplicaciones de IA generativa.
En la mayoría de los casos, cuando se les da a las personas la oportunidad de expresar su creatividad, lo hacen. Sin embargo, para que un modelo generativo genere material, una persona debe proporcionarle algunos disparadores. Hasta que aparezca la siguiente generación de una IA aún más inteligente, es probable que la profesión de "ingeniero de indicaciones" se convierta en una profesión consolidada. De esta línea de investigación ya se han sacado un libro de 82 páginas que contiene indicaciones con imágenes de DALL-E 2 y un mercado donde los usuarios pueden comprar y vender indicaciones por un precio simbólico. La mayoría de los usuarios probablemente tendrán que pasar por muchas opciones antes de obtener los resultados que desean de estos sistemas.
Luego, una persona tendrá que revisar y modificar cuidadosamente el material que ha generado un modelo. Un solo documento puede incluir los resultados de muchas indicaciones. Es posible que se necesite un procesamiento intensivo para la producción de imágenes. El ganador del concurso de "fotografías modificadas digitalmente" de Colorado con la ayuda de Mid journey, Jason Allen, reveló a un periodista que pasó más de 80 horas creando más de 900 iteraciones de la obra de arte y refinando sus indicaciones una y otra vez. Luego imprimió tres obras en el lienzo después de editarlas en Adobe Photoshop y afinarlas con otro programa de inteligencia artificial.
La diversidad de modelos de IA generativa es asombrosa. Pueden acceder a elementos visuales, formatos extendidos de texto, correos electrónicos, publicaciones en redes sociales, grabaciones de audio, código y datos estructurados. Pueden generar textos originales, traducciones, preguntas frecuentes, análisis de sentimientos, resúmenes e incluso material de video.
El uso de la IA generativa en el mundo creativo
Las aplicaciones de IA generativa son capaces de satisfacer múltiples posibilidades creativas. Entre ellas, se incluyen:
Creación automatizada de contenido: automatización de la producción de contenido lingüístico y visual a gran escala Los artículos, las entradas de blogs y las actualizaciones de las redes sociales son solo algunos ejemplos de los tipos de material que se pueden generar automáticamente mediante modelos de IA. Las empresas y los profesionales que suelen producir material pueden encontrar en este método un método útil para ahorrar tiempo.
Calidad de contenido mejorada: debido a que los modelos de IA pueden aprender de una gran cantidad de datos y detectar patrones que las personas tal vez no puedan notar, la calidad del material producido por IA puede ser a menudo superior a la generada por humanos. Esto tiene el potencial de proporcionar información más confiable y útil.
Diversificación de tipos de contenido: los sistemas de IA pueden generar más formatos de contenido, no solo texto, fotos o videos. Esto permite que una información más variada y fascinante llegue a una audiencia más amplia.
Materiales personalizados: Los modelos de IA pueden crear materiales únicos para cada usuario en función de sus gustos. Con esta información, las empresas y los profesionales pueden producir material que tenga más probabilidades de resonar con su público objetivo, aumentando la probabilidad de que sea leído y compartido.
¿En qué medida esta tecnología se asemeja a los esfuerzos humanos en las actividades creativas?
La siguiente frase en cursiva es una respuesta de muestra a una oración que escribimos con GPT-3, un "modelo de lenguaje grande" (LLM) de OpenAI. Los pros y los contras de la mayoría del material producido por IA se pueden ver en el texto escrito por GPT-3. En primer lugar, responde bien a los cambios en las oraciones que se le dan; exploramos varias oraciones antes de decidirnos por esa. En segundo lugar, la calidad de la redacción que produce el sistema está por encima de la media; no hay errores ortográficos ni gramaticales, y las palabras utilizadas son adecuadas. El tercer problema es que necesita ser editado; una lista numerada en la parte superior de este tipo de artículo no es estándar. Por fin, ha generado sugerencias que habíamos pasado por alto. Para dar un ejemplo, todavía tenemos que pensar en esa última parte sobre el material personalizado.
Se trata de un claro ejemplo de lo útiles que pueden ser estos modelos de IA para las empresas. Podrían tener efectos de gran alcance en campos tan diversos como la publicidad, la informática, el diseño, las artes, los medios de comunicación y la comunicación interpersonal, todos ellos directamente relacionados con la industria de la producción de contenidos. Para el ojo inexperto, esto podría pasar por la "inteligencia general artificial" que los humanos han anhelado y temido.
Ver también: El Congreso de Estados Unidos presenta cinco proyectos de ley para controlar a los gigantes tecnológicos
Conclusión
Estos pocos casos de uso de la IA generativa en las empresas deberían dejar claro que apenas estamos empezando a explorar las posibilidades que presenta para las empresas y sus empleados. Apenas podemos imaginar todas las posibilidades y ramificaciones que estos modelos de IA pueden producir, suponiendo que sigan avanzando como lo han hecho en su corta existencia. Por ejemplo, en un futuro cercano, estos sistemas pueden ser la norma para generar los primeros borradores de la gran mayoría de nuestro contenido escrito o basado en imágenes. Esto incluye correos electrónicos, cartas, artículos, programas de software, informes, entradas de blogs, presentaciones, videos, etc. Mejorar en esta área tendría efectos de largo alcance e inesperados en cuestiones como la propiedad del contenido y la protección de la propiedad intelectual. Aun así, también marcaría el comienzo de una nueva era de descubrimiento e innovación en las artes y las ciencias.
Imagen destacada: Imagen de Freepik
Suscríbete a Whitepapers.online para conocer las nuevas actualizaciones y los cambios realizados por los gigantes tecnológicos que afectan la salud, el marketing, los negocios y otros campos. Además, si te gusta nuestro contenido, compártelo en plataformas de redes sociales como Facebook, WhatsApp, Twitter y más.