
随着OpenAI图像生成的主要升级,出现了新问题。 Openai首席执行官Sam Altman表示:Chatgpt对文学和传记应用的需求很高,我们的GPU正在“填充”(可溶性,最初打算溶解)。在努力提高效率的同时,我们将暂时对CHATGPT图像生成介绍一些费率限制。图像来源:社交平台这意味着OpenAI将对CHATGPT图像生成实施临时速度限制,降低每单位时间处理请求的成本,减轻多余的GPU的压力,并优先确保主要功能的稳定性,例如文本和对话世代,这将临时临时。根据OpenAI的官方网站,当地时间3月25日,Open人工智能研究中心(OpenAI)宣布正式启动GPT-4O图像生成。扩展全文
图像来源:Openai的ficial网站
在启动此功能之后,它在“移动嘴来编辑照片”方面变得很受欢迎,并且在互联网平台上倒了许多从个人照片和知名模因中更改的“吉卜力”卡通风格。
“您可以通过移动嘴来编辑照片”是指通过简单的文本说明或语音命令直接编辑,更改或生成图像,甚至不使用复杂的图像编辑工具(例如Photoshop)。功能的核心在于将自然语言技术处理与图像生成技术的整合,这大大降低了图像编辑的阈值。
GPT-4O是一种多模式AI模型,可以接收集成的文本输入,音频和图像,并产生相应的图像输出。这意味着用户可以要求AI提出或通过语音命令更改图像,而不是仅限于文本说明。
奥特曼甚至对高空交通造成了后悔该功能是:“在过去的十年中,我一直在AI上努力工作,试图帮助获得额外的智慧来治愈癌症和其他事物。几乎没有人在我醒来并收到数百条消息,人们说您是在gibli style style style style style stam altman a antman a altman a aftman的新头像上绘制的,在chatgptptpptpptpptptar上形成
根据OpenAI的说法,GPT-4O图像生成的功能具有四个主要好处:准确的文本渲染,严格的后续指令,深入呼吁知识和创意扩展功能。
根据扬齐晚间新闻和Ziniu新闻的报道,为了验证其实际表现,记者进行了许多实际试验。在测试“ Yangzi晚上新闻/Zi Niu新闻”一词时,GPT-4O可以准确地恢复了一些英语内容,但是识别汉字的能力需要改进。整个过程持续了大约30秒,而一代人的速度更加稳定。n期望。
图片来源:Yangzi晚上新闻·ZI NIU新闻
在另一项测试中,图像是Marawe的优化正在谈论谈话。首先,GPT-4O首先要生产“戴着黑色太阳镜的老虎”,很快就展示了一张丰富的照片。老虎头发的质地清晰可见,老虎的眼睛可以通过太阳镜可见。随后,记者进一步输入了命令“放置这位老虎侦探并产生游戏场景”。新生成的图像不仅完美地意识到场景的变化,而且还保持主题特征的一致性,显示出牢固的上下文连接。
图片来源:Yangzi晚上新闻·ZI NIU新闻
对于复杂情况的处理能力,测试是通过“设计包含12个不同内容的4x3网格地图,每个对象都需要准确显示TINAID功能”进行测试。 GPT-4O成功应对这一挑战,从蓝星,红色三角形到闪电彩虹,细节精确。但是,这可能是由于对中国人的理解不足以及在生成模式中缺乏指示所致。
在测试实用性时,记者试图提出专业场景图像。例如,有必要“创建传统的中国风格的餐厅菜单,并描述Maoxuewang菜和酸菜鱼”。 GPT-4O菜单不仅在文本布局中优雅,而且还与菜肴中的样式描述完美匹配,并且整体视觉效果令人愉快。此外,生产科学图的能力同样出色。记者已经输入了“使用牛顿PRI的实验捕获示意性实验”的说明,该模型迅速释放出清晰的教学结构图像。
尽管存在这些缺点,但改变GPT-4O图像产生的功能仍然很重要。准确的文本渲染功能,高符合复杂的INS在许多对话执行中的推翻和类似的表现为创意设计,教育和教学,游戏开发和其他领域提供了强大的工具。正如Openai首席执行官Sam Altman所说,此功能的启动标志着“自由自由的新高高”,用户将打开更多的视觉潜在创意。
作为AI领域的领先球员,OpenAI背后的GPU预备队自然是该行业的最高水平。根据公司咨询公司Omdia的评论,微软作为Openai的主要投资者在2024年购买了近485,000名NVIDIA的Hopper Chips,是其主要竞争对手Meta的两倍,使其成为NVIDIA GPUS最大的买家。使用Microsoft的Azure云基础架构培训了大型OpenAI模型。
可以说,由于新功能,OpenAI面临的问题反映了资源和对AI多模式技术开发的需求之间的平衡问题。一方面,AI应用程序仍然非常需要计算NG资源,例如GPU。另一方面,该行业将继续呼吁技术更改以充分利用现有资源。
图像来源:视觉中国
根据《北京业务日报》的报道,更新GPT-4O图像生成功能后,OpenAI产品的较大更新是Refininggpt-5 AD。 OpenAI首席执行官Sam Altman在今年2月表示,OpenAI将把新的GPT-5车型带到ChatGPT和API服务。GPT-5将包括许多公司技术,包括推理模型技术,而GPT-5在接下来的几个月中可能推出。
与不清楚的GPT-5节点的发布相比,Altman突然宣布了GPT路线图,这可能是因为Openai面临着用户的损失压力。阿尔特曼(Altman)早些时候曾说过,DeepSeek不会像前几年那样使Openai的顶端占据最大的优势,并说他个人认为Openai在开放式体重模型资源和研究结果和需求方面是历史上错误的一部分制定各种开放资源的方法。
此前,根据《华尔街日报》的报道,《 Openai》内GPT-5项目代码“ Orion”的开发已经开发了近两年,目前面临着严重的挑战。根据原始计划,该项目应在2024年中期完成,但该项目被严重捕获。
OpenAI进行了至少两个大型培训课程,每个培训课程都需要几个月来处理大量数据,以使Orion聪明。一位前Openai高管说,如果GPT-4的表现与高中生一样多,那么GPT-5的目标就是在某些活动中达到医生的水平。但是,熟悉该项目的人说,“猎户座”培训每次都会有新的问题,并且该软件将无法满足研究人员的期望。
Dongwu Securities发布了一份研究报告,指出已确定已修复产品线和L的期望ARGE模型。 GPT-5发布时间可能会提前,或者由于最近的重大更新和保持DeepSeek的性能,它威胁了OpenAI产品地图,并希望加快产品更改的速度。
研究公司Gartner预测,到2026年,多模式模型的商业价值将拥有45%的AI市场。尽管诸如Google和Microsoft之类的巨头继续增加投资,但AI开发从一般工具到工业基础设施都出现,但是各方也需要探索改善社会道德和监管框架。
经济新闻综合北京业务日报,扬齐晚间新闻·Zi niu新闻,OpenAI的官方网站,公共信息
阳光日 - 新的经济又回到了苏胡(Sohu),以查看更多