作者：韩信子@ShowMeAI

深度学习实战系列：https://www.showmeai.tech/tutorials/42

本文地址：https://www.showmeai.tech/article-detail/414

声明：版权所有，转载请联系平台与作者并注明出处

收藏ShowMeAI查看更多精彩内容

简介

AI 以迅速的发展，不仅仅在研究界带来了革新，在生活的方方面面也提供智能化，使我们更便利。在本篇内容中，ShowMeAI将介绍 OpenAI 的主要发展以及它们实际落地的 AI 产品应用。

OpenAI vs DeepMind，两大人工智能巨头应对不同挑战

OpenAI 的使命侧重于以安全的方式为全人类实现人工智能的可用性。OpenAI 的模型为数据提取、文本生成、语音识别、图像生成或编辑等日常任务带来了高效的解决方案。尽管它们的任务和目标不同，但它们在开发大型模型方面有着共同的努力，这些模型在当今的大多数应用中都发挥着关键的作用。

DeepMind 的使命是解决智能问题，推动科学发展并造福人类。因此，它强调通用智能，即 AI 在任何情况下都能够自行学习。这也解释了为什么 DeepMind 所有的突破都依赖于深度强化学习，即 AI 只有一个目标和一组可能的行动，需要找出实现该目标的最佳方法。

GPT3，超智能化的内容生成助手

GPT3介绍

GPT-3 是一种深度学习模型，该模型经过训练后可以预测序列中的下一个标记，并能生成流畅逼真的文本，覆盖文本分析和摘要、文案撰写、代码生成等应用场景。GPT-3 在发布后不久就掀起了全球的热潮，促进了大量应用程序和初创公司的诞生。下图为用户使用 “Grammar Correction” 开始编程的操作示例。

现实生活中的应用

OpenAI 官方表示，OpenAI API是公司第一个商业产品，自推出九个月以来，超过 300 个应用在使用 GPT-3，成千上万的开发人员在使用平台。目前平均每天生成 45 亿个单词，且生产流量继续扩大中。

如果你需要在线的文本解决方案，那可以阅读更多相关信息并自己把模型玩起来：https://beta.openai.com/playground。OpenAI 为所有新帐户提供 18 美元的信用额度。

CLIP，文本和图像的天然融合艺术

CLIP介绍

CLIP 是 OpenAI 开发的一种大型预训练语言模型，将输入的文本映射到一个连续的向量空间，并通过计算两个文本之间的距离来进行文本分类和相似度计算。与传统的语言模型不同，CLIP可以通过学习数据库中的大量文本数据来实现端到端的文本分类，而不需要任何人工标注。因此，它可以用于许多不同的文本分类任务，包括情感分析、知识图谱构建和图像标注。下图表明 CLIP 极大地改进了图像分类的结果！

现实生活中的应用

CLIP可以完成零样本图像分类、图像描述、内容审核、图像生成等。值得注意的是，CLIP 是 DALLE 的构建块之一。

DALL·E 2，优秀的艺术家

DALL·E 2介绍

DALL·E 2 是 OpenAI 公司研发的一款新的人工智能系统，不仅可以根据文本描述生成对应的逼真图像，还可以根据文本提示修改图像内容，以及根据给定的图像拓展生成多种主题风格一致的“变体”。目前公开可用，可以直接访问 OpenAI 网站，也可以调用 API（2022 年 11 月已经发布！）。

现实生活中的应用

DALL·E 2 的影响力可与 GPT3 媲美，应用场景也非常丰富，包括插图、图像摄影、NFT 生成、图像编辑等。微软已经宣布 DALL·E 2 将为其 Designer App 提供支持；Shutterstock 还宣布与 OpenAI 建立合作关系，允许用户在平台上使用 DALL·E 2 进行创作！

Whisper，听懂所有语言的智者

Whisper介绍

Whisper 是一个自动语音识别 (ASR) 系统。它使用从网络上收集的 680,000 小时多语言和多任务监督数据进行训练。使用如此庞大且多样化的数据集可以提高对口音、背景噪音和技术语言的鲁棒性。此外，它还支持多种语言的转录，以及将这些语言翻译成英语。

现实生活中的应用

Whisper 是免费和可编程的，使用体验令人兴奋！这也使其成为现有商业语音识别服务的有力竞争者。它也可能直接挑战了当前主流的“基于云的 ASR 服务”。

由于 Whisper 模型较小，便于本地运行的移动 App 使用，从而可以避免转录前数据上传云端导致的隐私问题（已经有人行动起来了例如下方推文）。

Codex，完美代码生成助手

Codex介绍

OpenAI Codex 是一种基于 GPT-3 的自然语言到代码系统，有助于将自然语言指令转换为十几种流行的编码语言。Codex 于去年 8 月通过 OpenAI 的 API 发布，是 GitHub Copilot 的主要构建块。

其实，可以要求 GPT3 解释一段简单的文本代码，从代码到解释性文本这个过程GPT3也可以做得很好，理解和生成代码的能力已经编码在 GPT3 中。而 Codex 专注于生成可执行代码，使其成为开发人员的绝佳助手。由于它已经集成到 Visual Studio 中，根据经验，将它无缝集成到开发周期中。

现实生活中的应用

许多应用已经出现，包括各种代码助手 copilot、pygma 和 replit 等。

Copilot 编码助手能够根据指示生成代码、将注释转换为代码、生成测试并提出备选方案。
Pygma 使用 Codex 将 Figma 设计转换为高质量代码。
Replit 使用 Codex 描述选定的一段代码的作用，以便每个人都能理解其功能。

下图为 Replit 依靠 Codex 来解释部分代码。

ChatGPT，令人兴奋的AI聊天机器人

ChatGPT介绍

ChatGPT 是 OpenAI 于 11 月 30 日推出的一款聊天机器人，能根据用户的提示，在对话中生成类似人类的文本响应，完成回答问题、提供信息或参与对话等各种任务。与许多使用预定义的响应或规则生成文本的聊天机器人不同，ChatGPT 经过了训练，可以根据接收到的输入生成响应，从而生成更自然、更多样化的响应。

ChatGPT的亮点主要有哪些？

新增代码理解和生成能力，对输入的理解能力和包容度高，能在绝大部分知识领域给出专业回答。
加入道德原则。即ChatGPT能够识别恶意信息，识别后拒绝给出有效回答。
支持连续对话。ChatGPT具有记忆能力，提高了模型的交互体验。

现实生活中的应用

ChatGPT不仅会聊天，写得了代码，修复得了bug，还能帮你写工作周报、写小说、进行考试答题，绘画，看病，甚至你还可以诱骗它规划如何毁灭人类，许多人认为，ChatGPT不仅仅是一个聊天机器人，而可能是现有搜索引擎的颠覆者。

真实世界的人工智能应用落地——OpenAI篇 ⛵

简介

OpenAI vs DeepMind，两大人工智能巨头应对不同挑战

GPT3，超智能化的内容生成助手

GPT3介绍

现实生活中的应用

CLIP，文本和图像的天然融合艺术

CLIP介绍

现实生活中的应用

DALL·E 2，优秀的艺术家

DALL·E 2介绍

现实生活中的应用

Whisper，听懂所有语言的智者

Whisper介绍

现实生活中的应用

Codex，完美代码生成助手

Codex介绍

现实生活中的应用

ChatGPT，令人兴奋的AI聊天机器人

ChatGPT介绍

现实生活中的应用

参考资料

推荐阅读

真实世界的人工智能应用落地——OpenAI篇 ⛵的更多相关文章

随机推荐

热门专题