Stora ord och bilder Generativa AI-modeller, även kända som grundmodeller, har öppnat nya dörrar för företag och individer som är engagerade i innehållsgenerering. I den här bloggen kommer vi att diskutera hur Generativ AI förändrar kreativt arbete och hur vi skapar och uppfattar det.
Se även: Anonym budgivare betalar 28 miljoner dollar för rymdfärd med Jeff Bezos
Vad är generativ AI?
Som det är kan generativ AI göra mycket. Det kan generera skriftligt och visuellt innehåll som blogginlägg, kod, poesi och till och med konstverk (och till och med vinna tävlingar, kontroversiellt). Att förutsäga nästa ord i en sekvens eller nästa bild från ord som beskriver tidigare bilder är möjlig genom programvarans användning av avancerade maskininlärningsmodeller. 2017 var Google Brain först med att använda en LLM för sammanhangsmedveten textöversättning. Sedan dess har flera stora teknikföretag, inklusive Google (med sina BERT- och LaMDA-modeller) och Facebook (med sina OPT-175B och BlenderBot-modeller), samt välgörenhetsorganisationen OpenAI, där Microsoft har en majoritetsandel, utvecklat betydande generativ AI naturligt språk och text-till-bild-modeller (GPT-3 för text, DALL-E2 för bilder och Whisper för tal). Open-source leverantörer som HuggingFace och onlinecommunities som Mid journey (som bidrog till tävlingens seger) har också utvecklat generativa modeller.
På grund av den stora mängden data och beräkningsresurser som behövs för att träna dessa modeller, har deras tillämpning mestadels varit begränsad till stora teknikföretag. GPT-3, till exempel, använde 45 terabyte data under sin första träning och använde 175 miljarder parametrar eller koefficienter för att producera förutsägelser; ett enda träningspass för GPT-3 kostade 12 miljoner dollar. Den kinesiska modellen, Wu Dao 2.0, inkluderar 1,75 biljoner variabler. Företag behöver ofta mer resurser (datacenterkapacitet och cloud computing-medel) för att utveckla sina modeller.
BioNeMo är ett ramverk i superdatorskala utvecklat av NVIDIA för generativ kemi, proteomik och DNA/RNA-modellering. När en generativ modell väl har tränats kan den dock "finjusteras" för en viss innehållsdomän med betydligt mindre input. Detta har resulterat i flera domänspecifika varianter av BERT och GPT-3, till exempel de som är skräddarsydda för det biomedicinska området (BioBERT), den juridiska sektorn (Legal-BERT) och det franska språket (CamemBERT). OpenAI upptäckte att endast 100 domänspecifika prov avsevärt förbättrade GPT-3:s noggrannhet och relevans.
Mänsklig input krävs i början och efter processen för att få ut det mesta av generativa AI-applikationer.
I de flesta fall, när människor ges möjligheter att uttrycka sin kreativitet, gör de det. För att en generativ modell ska kunna generera material måste dock en person mata den med några triggers. Tills nästa generation av en ännu mer intelligent AI dyker upp kommer "snabb ingenjör" sannolikt att bli en väletablerad karriär. En 82-sidig bok som innehåller DALL-E 2 bilduppmaningar och en marknadsplats där användare kan köpa och sälja uppmaningar för en nominell avgift har redan resulterat från denna forskning. De flesta användare kommer sannolikt att behöva gå igenom många alternativ innan de får de resultat de vill ha från dessa system.
Det blir sedan upp till en person att noggrant granska och ändra det material som en modell har genererat. Ett enda dokument kan innehålla resultaten från många uppmaningar. Det är möjligt att det krävs intensiv bearbetning för bildproduktion. Vinnaren av Colorado-tävlingen "digitalt modifierade bilder" med hjälp av Mid travel, Jason Allen, avslöjade för en reporter att han tillbringade mer än 80 timmar på att skapa mer än 900 iterationer av konstverket och förfina sina uppmaningar om och om igen. Han skrev sedan ut tre verk på duken efter att ha redigerat dem i Adobe Photoshop och skärpt dem med ett annat AI-program.
Mångfalden i generativa AI-modeller är häpnadsväckande. Bildmaterial, utökade former av text, e-postmeddelanden, inlägg på sociala medier, ljudinspelningar, kod och strukturerad data är alla tillgängliga för dem. De kan generera originaltexter, översättningar, vanliga frågor, sentimentanalyser, sammanfattningar och till och med videomaterial.
Användningen av generativ AI i den kreativa världen
Generativa AI-applikationer kan uppfylla flera kreativa möjligheter. Dessa möjligheter inkluderar:
Automatiserat innehållsskapande: Storskalig automatisering av språklig och visuell innehållsproduktion Artiklar, blogginlägg och uppdateringar av sociala medier är bara några exempel på de typer av material som kan genereras automatiskt med AI-modeller. Företag och proffs som ofta producerar material kan tycka att detta är en användbar metod för att spara tid.
Förbättrad innehållskvalitet: Eftersom AI-modeller kan lära av en stor mängd data och upptäcka mönster som människor kanske inte kan lägga märke till, kan kvaliteten på material som produceras av AI ofta vara högre än den som genereras av människor. Detta har potential att ge mer tillförlitlig och användbar information.
Diversifierade innehållstyper: Fler materiella former kan genereras av AI-system, inte bara text, foton eller video. Detta gör att mer varierad och fascinerande information kan nå en större publik.
Anpassade material: AI-modeller kan skapa unika material för varje användare beroende på deras smak. Med denna information kan företag och proffs producera material som är mer benägna att få resonans hos den avsedda publiken, vilket ökar sannolikheten för att det kommer att läsas och delas.
Hur väl liknar denna teknik mänskliga ansträngningar i kreativa strävanden?
Följande kursiverade fras är ett exempel på svar på en mening som vi skrev av GPT-3, en OpenAI "stor språkmodell" (LLM). För- och nackdelarna med det mesta AI-producerat material kan ses i texten skriven av GPT-3. För det första svarar den väl på ändringar i meningens uppmaningar; vi utforskade flera meningar innan vi landade på den. För det andra är kvaliteten på skriften som produceras av systemet över genomsnittet; det finns inga stavfel eller grammatiska fel, och orden som används är passande. Den tredje frågan är att den behöver redigeras; en numrerad lista överst i den här typen av artiklar är inte standard. Äntligen har det genererat förslag som vi hade förbisett. För att ge ett exempel, har vi ännu inte tänkt på den sista biten angående skräddarsytt material.
Det är ett gediget exempel på hur användbara dessa AI-modeller kan vara för företag. De kan ha långtgående effekter på så olika områden som reklam, datavetenskap, design, konst, media och interpersonell kommunikation, som alla är direkt knutna till innehållsproduktionsindustrin. För det otränade ögat kan detta passera för den "konstgjorda allmänna intelligensen" som människor både har längtat efter och fruktat.
Se även: Den amerikanska kongressen presenterar 5 lagförslag som ska regera i teknikjättar
Slutsats
Dessa få användningsfall för generativ AI i näringslivet borde göra det uppenbart att vi bara börjar utforska möjligheterna det ger företag och deras anställda. Vi kan knappt förstå alla möjligheter och förgreningar; dessa AI-modeller kan producera, förutsatt att de fortsätter att utvecklas som de har gjort under sin korta existens. Till exempel, inom en snar framtid kan dessa system vara normen för att generera de första utkasten av det stora flertalet av vårt skrivna eller bildbaserade innehåll. Detta inkluderar e-postmeddelanden, brev, artiklar, program, rapporter, blogginlägg, presentationer, videor, etc. En förbättring på detta område skulle få långtgående och oväntade effekter på frågor som innehållsägande och IP-skydd. Ändå skulle det också inleda en ny era av upptäckter och innovationer inom konst och vetenskap.
Utvald bild: Bild av Freepik
Prenumerera på Whitepapers.online för att lära dig om nya uppdateringar och förändringar gjorda av teknikjättar som påverkar hälsa, marknadsföring, affärer och andra områden. Om du gillar vårt innehåll, vänligen dela på sociala medieplattformar som Facebook, WhatsApp, Twitter och mer.