生成式人工智能如何改变创造性工作

Published on 26 Dec 2022

生成、人工智能、改变、创意工作

大词与图片 生成式人工智能模型(也称为基础模型)为从事内容生成的公司和个人打开了新的大门。在本博客中,我们将讨论生成式人工智能如何改变创意工作以及我们如何创造和感知创意工作。

另请参阅: 匿名竞标者支付 2800 万美元与杰夫·贝佐斯一起进行太空飞行

什么是生成式人工智能?

事实上,生成式人工智能具有很大的能力。它可以生成书面和视觉内容,例如博客文章、代码、诗歌,甚至艺术品(甚至赢得比赛,这有争议)。通过软件使用先进的机器学习模型,可以预测序列中的下一个单词或根据描述先前图像的单词预测下一张图片。 2017 年,Google Brain 率先雇用法学硕士进行上下文感知文本翻译。此后,包括谷歌(拥有 BERT 和 LaMDA 模型)和 Facebook(拥有 OPT-175B 和 BlenderBot 模型)以及微软拥有多数股权的慈善机构 OpenAI 在内的几家大型科技公司已经开发了重要的生成式人工智能自然语言和文本到图像模型(用于文本的 GPT-3、用于图像的 DALL-E2 和用于语音的 Whisper)。像 HuggingFace 这样的开源供应商和像 Mid journey 这样的在线社区(为比赛的胜利做出了贡献)也开发了生成式模型。

由于训练这些模型需要大量数据和计算资源,因此它们的应用主要局限于大型科技公司。例如,GPT-3 在首次训练时使用了 45 TB 的数据,并使用 1750 亿个参数或系数来生成预测;GPT-3 的一次训练花费了 1200 万美元。中国模型 Wu Dao 2.0 包含 1.75 万亿个变量。公司通常需要更多资源(数据中心容量和云计算资金)来开发他们的模型。

BioNeMo 是 NVIDIA 为生成化学、蛋白质组学和 DNA/RNA 建模开发的超级计算规模框架。然而,一旦生成模型经过训练,它就可以针对某个内容领域进行“微调”,而输入量则要少得多。这导致了 BERT 和 GPT-3 的几个特定领域变体,例如针对生物医学领域 (BioBERT)、法律领域 (Legal-BERT) 和法语 (CamemBERT) 的变体。OpenAI 发现,仅 100 个特定领域的样本就显著提高了 GPT-3 的准确性和相关性。

为了最大限度地发挥生成式人工智能应用的作用,在流程开始时和流程结束后都需要人工输入。

在大多数情况下,当人们有机会表达自己的创造力时,他们就会这样做。然而,要让生成模型生成素材,人们必须给它提供一些触发器。在下一代更智能的人工智能出现之前,“提示工程师”很可能成为一个成熟的职业。这方面的研究已经产生了一本 82 页的书,其中包含 DALL-E 2 图片提示和一个用户可以以象征性费用购买和出售提示的市场。大多数用户可能需要循环浏览许多选项,才能从这些系统中获得他们想要的结果。

然后,就需要人工仔细审查和修改模型生成的材料。单个文档可能包含许多提示的结果。图像制作可能需要密集处理。在 Mid Journey 的帮助下,科罗拉多州“数字修改照片”比赛的获胜者 Jason Allen 向记者透露,他花了 80 多个小时创作了 900 多个艺术品迭代,并一遍又一遍地完善他的提示。然后,他在 Adobe Photoshop 中编辑并使用另一个 AI 程序对其进行锐化后,将三幅作品打印在画布上。

生成式人工智能模型的多样性令人震惊。视觉效果、扩展形式的文本、电子邮件、社交媒体帖子、录音、代码和结构化数据都可以被它们访问。它们可以生成原创文章、翻译、常见问题解答、情感分析、摘要,甚至视频材料。

生成式人工智能在创意世界中的应用

生成式AI 应用能够实现多种创造可能性。这些可能性包括:

自动化内容创建:大规模语言和视觉内容制作自动化文章、博客条目和社交媒体更新只是使用 AI 模型自动生成的材料类型的几个示例。经常制作材料的企业和专业人士可能会发现这是一种节省时间的有用方法。

增强内容质量:由于人工智能模型可以从大量数据中学习并检测出人类可能无法注意到的模式,因此人工智能生成的材料质量通常可能高于人类生成的材料。这有可能提供更可靠和有用的信息。

内容种类多样化: AI系统可以生成更多形式的素材,而不仅仅是文字、照片或视频。这使得更多样、更有趣的信息能够接触到更广泛的受众。

定制材料: AI模型可以根据每个用户的喜好为他们创建独特的材料。有了这些信息,公司和专业人士可以制作出更容易引起目标受众共鸣的材料,从而增加阅读和分享的可能性。

这项技术与人类在创造性努力方面的相似度有多高?

以下斜体字是我们对 GPT-3(OpenAI“大型语言模型”(LLM))编写的句子的示例响应。大多数人工智能制作的材料的优缺点可以在 GPT-3 编写的文本中看到。首先,它对提供的句子提示的变化反应良好;在确定那一个句子之前,我们探索了几个句子。其次,系统生成的写作质量高于平均水平;没有拼写或语法错误,使用的单词合适。第三个问题是它需要编辑;这种文章顶部的编号列表并不标准。最后,它产生了我们忽略的建议。举个例子,我们还没有想到关于定制材料的最后一点。

这是这些人工智能模型对企业有多大用处的有力例证。它们可能对广告、计算机科学、设计、艺术、媒体和人际交流等各个领域产生深远影响,而这些领域都与内容制作行业直接相关。在外行人看来,这可能就是人类既渴望又害怕的“人工智能”。

另请参阅: 美国国会提出五项法案,以管制科技巨头

结论

生成式人工智能在商业领域的这些用例应该表明,我们才刚刚开始探索它为企业及其员工带来的可能性。我们几乎无法理解这些人工智能模型可能产生的所有可能性和影响,前提是它们继续像它们短暂存在时一样进步。例如,在不久的将来,这些系统可能成为生成我们绝大多数书面或基于图像的内容初稿的标准。这包括电子邮件、信件、文章、软件程序、报告、博客文章、演示文稿、视频等。这一领域的改进将对内容所有权和知识产权保护等问题产生深远而意想不到的影响。不过,它也将开启艺术和科学领域发现和创新的新时代。

特色图片: 图片来自 Freepik

订阅 Whitepapers.online,了解科技巨头对健康、营销、商业和其他领域产生影响的最新更新和变化。此外,如果您喜欢我们的内容,请在 Facebook、WhatsApp、Twitter 等社交媒体平台上分享。