首页IT科技多模态内容层面(OpenAI GPT-4震撼发布:多模态大模型)

多模态内容层面(OpenAI GPT-4震撼发布:多模态大模型)

时间2025-06-13 20:29:03分类IT科技浏览4540
导读:前言:...

前言:

🏠个人主页:以山河作礼             。

📝​📝:本文章是帮助大家更加了解GPT4              ,一起见证Al的成长!

🎈🎈欢迎大家一起学习                    ,一起成长!!

3 月 14 日晚间       ,OpenAI 宣布发布 GPT-4                     。

“我们创建了 GPT-4              ,这是 OpenAI 努力扩展深度学习的最新里程碑       。GPT-4 是一个大型多模态模型(接受图像和文本输入                    ,提供文本输出)       ,虽然在许多现实世界场景中的能力不如人类       ,但在各种专业和学术基准上表现出人类水平              ”                    ,OpenAI 表示      。

发布要点

GPT-4可以接受图像和文本输入             ,而GPT-3.5只接受文本                     。 GPT-4在各种专业和学术基准上的表现达到 “人类水平                    ”              。例如       ,它通过了模拟的律师考试                     ,分数约为应试者的前10%      。 OpenAI花了6个月的时间             ,利用从对抗性测试项目以及ChatGPT中获得的经验,反复调整GPT-4                     ,结果在事实性             、可引导性和可控制方面取得了

“史上最佳结果       ”                    。 在简单的聊天中                    ,GPT-3.5和GPT-4之间的区别可能微不足道,但是当任务的复杂性达到足够的阈值时              ,区别就出来了                    ,GPT-4比GPT-3.5更可靠       ,更有创造力              ,能够处理更细微的指令              。 GPT-4能对相对复杂的图像进行说明和解释                    ,比如说       ,从插入iPhone的图片中识别出一个Lightning

Cable适配器(下文有图片)。 图像理解能力还没有向所有OpenAI的客户开发       ,OpenAI正在与合作伙伴Be My Eyes进行测试                    。 OpenAI承认                    ,GPT-4并不完美             ,仍然会对事实验证的问题产生错乱感       ,也会犯一些推理错误                     ,偶尔过度自信                     。 开源OpenAI Evals,用于创建和运行评估GPT-4等模型的基准             ,同时逐个样本检查其性能。

OpenAI 联合创始人 Sam Altman 表示,它是“迄今为止功能最强大                     、最一致的模型              ”                     ,能够使用图像和文本             。

GPT4的新功能

GPT-4:我能玩梗图

首先                    ,看图能力可以用来解释表情包       、梗图                     。

提问这张图哪里好笑?GPT-4可以按顺序描述出每一格的内容,并总结出笑点:

为什么这张图片很可笑?GPT-4 回答道              ,VGA 线充 iPhone       。

GPT4:理解图片

当你给 GPT-4 发送下面这张图片                    ,并询问它       ,该图片有哪些不寻常的地方? GPT-4 回答:这张照片的不同寻常之处在于              ,一名男子正在行驶中的出租车车顶上的熨衣板上熨烫衣服             。

(看图)手套掉下去会怎样?

GPT-4 回答道,它会掉到木板上                    ,并且球会被弹飞

拍一张照片上传给GPT-4       ,它就可以立马生成网站的HTML代码!

GPT4:识别与解析图片内容

在性能表现上       ,OpenAI直接甩出一句话:

在各种专业和学术基准上和人类相当!

最近这几个月                    ,ChatGPT 的爆火             ,让人们惊叹于人工智能强大的聊天能力                     。GPT4 出来后       ,可以看到                     ,在聊天之外             ,人工智能的能力已不断扩展其外延       。

ChatGPT 用的语言模型是 GPT-3.5      。在谈到 GPT-4 比前一个版本强大在哪里时,OpenAI

称                     ,虽然这两个版本在随意的谈话中看起来很相似                    ,但“当任务的复杂性达到足够的阈值时,差异就会出现                    ”              ,GPT-4

更可靠      、更有创意                    ,并且能够处理更细微的指令                     。该公司表示       ,GPT-4 响应禁止内容请求的可能性比其前一个版本低 82%              。OpenAI

表示              ,在内部评估中                    ,GPT-4 产生正确回应的可能性要比 GPT-3.5 高出 40%      。

而且 GPT-4 是多模态的       ,同时支持文本和图像输入功能                    。此外       ,GPT-4 比以前的版本“更大       ”                    ,这意味着其已经在更多的数据上进行了训练             ,并且在模型文件中有更多的权重       ,这也使得它的运行成本更高              。

OpenAI 称它使用了微软 Azure 来训练模型                     ,但没有公布有关具体模型大小或用于训练它的硬件的详细信息。

史上最强大模型

正如之前传言             ,GPT-4确实拥有多模态能力,可以接受图像输入并理解图像内容                    。 并且可接受的文字输入长度也增加到3.2万个token(约2.4万单词)                     。 升级之后                     ,GPT-4在各种职业和学术考试上表现和人类水平相当。 比如模拟律师考试                    ,GPT-4取得了前10%的好成绩,相比之下GPT-3.5是倒数10%             。 做美国高考SAT试题              ,GPT-4也在阅读写作中拿下710分高分                     、数学700分(满分800)                     。

怎样面对GPT4

GPT-4 再次给我们敲响了警钟:拥有如此强大的编程能力                    ,AI 真的会取代程序员?

前段时间       ,前哈佛大学计算机科学教授              、谷歌工程主管 Matt Welsh 还曾对此发出断言              ,表示“生成式 AI 将在 3 年内终结编程       ”                    ,放在当下来看       ,也许 Welsh 所言非虚       。

Welsh 认为       ,由于 ChatGPT 和 Copilot

等技术的出现                    ,编程正处于从人类工作转变为机器人工作的转折点             。在他看来             ,程序员需要演变成 AI

程序的“老师                    ”——或者产品经理       ,或者代码评审人员                     。他认为这两个人类角色相对来说不那么受机器人的影响       。“不要指望你的程序员职业生涯会一直持续下去                     ,因为机器正在取代这个角色      。             ”Welsh说道                     。

也许我们正处于一个动荡的周期之中             ,现在的问题不是会不会被取代,而是 AI 将在多大程度上改变软件行业                     ,而我们也需要为未来做好准备:现在就必须习惯人工智能                    ,毕竟让 AI 帮助我们编程就在不远的未来              。

申请 GPT-4 API

目前,OpenAI 已面向开发者开放 GPT-4 API 的申请通道              ,大家想提前使用的话                    ,可以先提交申请       ,进入 waitlist 中等待通过      。

申请通道:https://openai.com/waitlist/gpt-4-api

获得访问权限后              ,用户当前还是只能向 GPT-4 模型发出纯文本请求                    ,图像请求可能得等稍晚一些时间才对外开放                    。
声明:本站所有文章       ,如无特殊说明或标注       ,均为本站原创发布              。任何个人或组织                    ,在未征得本站同意时             ,禁止复制      、盗用                    、采集              、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益       ,可联系我们进行处理                    。

创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!

展开全文READ MORE
感知机的计算过程(机器学习强基计划1-1:图文详解感知机算法原理+Python实现) wordpress自动发货(WordPress自动超链-提升博客SEO的利器)