人工智能deep mind(真实世界的人工智能应用落地——OpenAI篇 ⛵)
💡 作者:韩信子@ShowMeAI
📘 深度学习实战系列:https://www.showmeai.tech/tutorials/42
📘 本文地址:https://www.showmeai.tech/article-detail/414
📢 声明:版权所有 ,转载请联系平台与作者并注明出处
📢 收藏ShowMeAI查看更多精彩内容💡 简介
AI 以迅速的发展 ,不仅仅在研究界带来了革新 ,在生活的方方面面也提供智能化 ,使我们更便利 。在本篇内容中 ,ShowMeAI将介绍 OpenAI 的主要发展以及它们实际落地的 AI 产品应用 。
💡 OpenAI vs DeepMind ,两大人工智能巨头应对不同挑战
OpenAI 的使命侧重于以安全的方式为全人类实现人工智能的可用性 。OpenAI 的模型为数据提取 、文本生成 、语音识别 、图像生成或编辑等日常任务带来了高效的解决方案 。尽管它们的任务和目标不同 ,但它们在开发大型模型方面有着共同的努力 ,这些模型在当今的大多数应用中都发挥着关键的作用 。
DeepMind 的使命是解决智能问题 ,推动科学发展并造福人类 。因此 ,它强调通用智能 ,即 AI 在任何情况下都能够自行学习 。这也解释了为什么 DeepMind 所有的突破都依赖于深度强化学习 ,即 AI 只有一个目标和一组可能的行动,需要找出实现该目标的最佳方法 。
💡 GPT3 ,超智能化的内容生成助手
💦 GPT3介绍
📘GPT-3 是一种深度学习模型 ,该模型经过训练后可以预测序列中的下一个标记,并能生成流畅逼真的文本 ,覆盖文本分析和摘要 、文案撰写 、代码生成等应用场景 。GPT-3 在发布后不久就掀起了全球的热潮 ,促进了大量应用程序和初创公司的诞生 。下图为用户使用 “Grammar Correction ” 开始编程的操作示例 。
💦 现实生活中的应用
OpenAI 官方表示 ,OpenAI API是公司第一个商业产品 ,自推出九个月以来 ,超过 300 个应用在使用 GPT-3 ,成千上万的开发人员在使用平台 。目前平均每天生成 45 亿个单词 ,且生产流量继续扩大中。
如果你需要在线的文本解决方案 ,那可以阅读更多相关信息并自己把模型玩起来:https://beta.openai.com/playground 。OpenAI 为所有新帐户提供 18 美元的信用额度 。
💡 CLIP ,文本和图像的天然融合艺术
💦 CLIP介绍
📘CLIP 是 OpenAI 开发的一种大型预训练语言模型 ,将输入的文本映射到一个连续的向量空间 ,并通过计算两个文本之间的距离来进行文本分类和相似度计算。与传统的语言模型不同 ,CLIP可以通过学习数据库中的大量文本数据来实现端到端的文本分类,而不需要任何人工标注 。因此 ,它可以用于许多不同的文本分类任务 ,包括情感分析 、知识图谱构建和图像标注 。下图表明 CLIP 极大地改进了图像分类的结果!
💦 现实生活中的应用
CLIP可以完成零样本图像分类 、图像描述 、内容审核 、图像生成等 。值得注意的是,CLIP 是 DALLE 的构建块之一 。
💡 DALL·E 2 ,优秀的艺术家
💦 DALL·E 2介绍
📘DALL·E 2 是 OpenAI 公司研发的一款新的人工智能系统 ,不仅可以根据文本描述生成对应的逼真图像 ,还可以根据文本提示修改图像内容 ,以及根据给定的图像拓展生成多种主题风格一致的“变体 ” 。目前公开可用 ,可以直接访问 OpenAI 网站 ,也可以调用 API(2022 年 11 月已经发布!) 。
💦 现实生活中的应用
DALL·E 2 的影响力可与 GPT3 媲美 ,应用场景也非常丰富 ,包括插图 、图像摄影 、NFT 生成 、图像编辑等 。微软已经宣布 DALL·E 2 将为其 Designer App 提供支持;Shutterstock 还宣布与 OpenAI 建立合作关系 ,允许用户在平台上使用 DALL·E 2 进行创作!
💡 Whisper ,听懂所有语言的智者
💦 Whisper介绍
📘Whisper 是一个自动语音识别 (ASR) 系统 。它使用从网络上收集的 680,000 小时多语言和多任务监督数据进行训练 。使用如此庞大且多样化的数据集可以提高对口音、背景噪音和技术语言的鲁棒性 。此外 ,它还支持多种语言的转录 ,以及将这些语言翻译成英语 。
💦 现实生活中的应用
Whisper 是免费和可编程的,使用体验令人兴奋!这也使其成为现有商业语音识别服务的有力竞争者 。它也可能直接挑战了当前主流的“基于云的 ASR 服务 ”。
由于 Whisper 模型较小 ,便于本地运行的移动 App 使用 ,从而可以避免转录前数据上传云端导致的隐私问题(已经有人行动起来了 📘例如下方推文) 。
💡 Codex,完美代码生成助手
💦 Codex介绍
📘OpenAI Codex 是一种基于 GPT-3 的自然语言到代码系统 ,有助于将 自然语言指令转换为十几种流行的编码语言 。Codex 于去年 8 月通过 OpenAI 的 API 发布 ,是 GitHub Copilot 的主要构建块。
其实 ,可以要求 GPT3 解释一段简单的文本代码 ,从代码到解释性文本这个过程GPT3也可以做得很好 ,理解和生成代码的能力已经编码在 GPT3 中 。而 Codex 专注于生成可执行代码 ,使其成为开发人员的绝佳助手 。由于它已经集成到 Visual Studio 中 ,根据经验 ,将它无缝集成到开发周期中 。
💦 现实生活中的应用
许多应用已经出现 ,包括各种代码助手 copilot 、pygma 和 replit 等 。
Copilot 编码助手能够根据指示生成代码 、将注释转换为代码、生成测试并提出备选方案 。 Pygma 使用 Codex 将 Figma 设计转换为高质量代码 。 Replit 使用 Codex 描述选定的一段代码的作用 ,以便每个人都能理解其功能 。下图为 Replit 依靠 Codex 来解释部分代码 。
💡 ChatGPT ,令人兴奋的AI聊天机器人
💦 ChatGPT介绍
📘ChatGPT 是 OpenAI 于 11 月 30 日推出的一款聊天机器人 ,能根据用户的提示,在对话中生成类似人类的文本响应 ,完成回答问题 、提供信息或参与对话等各种任务 。与许多使用预定义的响应或规则生成文本的聊天机器人不同 ,ChatGPT 经过了训练,可以根据接收到的输入生成响应 ,从而生成更自然 、更多样化的响应 。
ChatGPT的亮点主要有哪些?
新增代码理解和生成能力 ,对输入的理解能力和包容度高 ,能在绝大部分知识领域给出专业回答 。 加入道德原则 。即ChatGPT能够识别恶意信息 ,识别后拒绝给出有效回答。 支持连续对话 。ChatGPT具有记忆能力 ,提高了模型的交互体验 。💦 现实生活中的应用
ChatGPT不仅会聊天 ,写得了代码 ,修复得了bug ,还能帮你写工作周报 、写小说 、进行考试答题 ,绘画 ,看病 ,甚至你还可以诱骗它规划如何毁灭人类 ,许多人认为,ChatGPT不仅仅是一个聊天机器人 ,而可能是现有搜索引擎的颠覆者。
参考资料
📘 GPT-3:https://openai.com/blog/gpt-3-apps/ 📘 CLIP:https://openai.com/blog/clip/ 📘 DALL·E 2 :https://openai.com/dall-e-2/ 📘 Whisper:https://openai.com/blog/whisper/ 📘 OpenAI Codex:https://openai.com/blog/codex-apps/ 📘 ChatGPT推荐阅读
🌍 数据分析实战系列
:https://www.showmeai.tech/tutorials/40
🌍 机器学习数据分析实战系列:https://www.showmeai.tech/tutorials/41
🌍 深度学习数据分析实战系列:https://www.showmeai.tech/tutorials/42
🌍 TensorFlow数据分析实战系列:https://www.showmeai.tech/tutorials/43
🌍 PyTorch数据分析实战系列:https://www.showmeai.tech/tutorials/44
🌍 NLP实战数据分析实战系列:https://www.showmeai.tech/tutorials/45
🌍 CV实战数据分析实战系列:https://www.showmeai.tech/tutorials/46
🌍 AI 面试题库系列:https://www.showmeai.tech/tutorials/48创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!