腾讯研究院AI速递 20250519_OpenAI_模型_Codex

红星美凯龙怎么样

热点资讯

新闻动态你的位置：红星美凯龙怎么样 > 新闻动态 > 腾讯研究院AI速递 20250519_OpenAI_模型_Codex

腾讯研究院AI速递 20250519_OpenAI_模型_Codex

发布日期：2025-05-24 15:58 点击次数：74

生成式AI

一、 OpenAI推出AI编程Codex，可多任务并行测试至代码通过

1. OpenAI发布新版AI编程工具Codex，由codex-1模型驱动，能生成更清晰代码且自动迭代测试至通过；

2. Codex运行于云端沙盒环境，可同时处理多项编程任务，支持与GitHub连接并预加载代码仓库；

3. 该工具目前向ChatGPT Pro等付费用户开放，后续将实施速率限制，用户可购买额外积分获取更多使用权限。

二、打字即出图！混元图像2.0让AI生图进入“零延迟”时代

1. 腾讯混元Image2.0实现毫秒级图像生成，用户输入提示词时即可看到实时变化，突破了传统5-10秒生成时间的限制；

2. 新模型支持文生图和图生图两大功能，图生图模式下可选择"参考主体"或"参考轮廓"，并可调节参考强度；

3. 双画布联动功能支持实时预览和多图层融合，在复杂场景下可通过多次快速的调试达到理想效果。

展开剩余81%

三、 Manus生图功能登场，从设计到搭建网站一站式搞定

1. Manus推出图像生成功能，除单纯生图外，还能理解用户意图、规划解决方案，并知道如何调用各种工具完成任务；

2. 该工具通过智能体工作流实现从品牌设计到网站部署的一站式服务，新用户可获赠1000积分免费体验；

3. 实测显示图像生成效果不错，但网站部署等复杂任务运行速度较慢，需等待数分钟至十几分钟不等。

四、 Google 推出可以精准控制画面中光影的项目 LightLab

1. 谷歌推出LightLab项目，通过扩散模型实现单张图像的精确光源控制，可调节光源强度、颜色，并能插入虚拟光源；

2. 研究团队通过结合真实照片对和合成渲染图像构建训练数据集，利用光的线性特性分离目标光源和环境光；

3. 实验表明该技术在PSNR和SSIM指标上优于现有方法，能实现物理上合理的光照效果，但需要12小时训练时间和64个v4 TPU。

五、 LLM记忆外挂，Supermemory新API，一行代码实现

1. Supermemory发布Infinite Chat API，作为应用程序和LLM间的透明代理，通过智能维护对话上下文来突破大模型2万Token的限制；

2. 该API采用RAG技术处理溢出的上下文内容，声称可节省90%的Token消耗，且只需一行代码即可集成到现有应用；

3. 定价方案包括每月20美元固定费用，每个对话线程前2万Token免费，超出部分按每百万Token 1美元计费。

六、马斯克的 Grok 突然失控？迅速公开Grok系统提示词

1. Grok AI助手出现异常，在回答各类问题时频繁插入南非"白人种族灭绝"相关内容，引发广泛争议；

2. xAI官方解释是员工未经授权修改系统提示词导致，并随后在Github公开Grok提示词，承诺增加审查机制和组建监控团队；

3. 事件暴露了当前AI系统过度依赖提示词的安全隐患，研究显示主流模型都可能通过特定提示技术被攻破，生成有害内容。

七、 OpenAI收购案后首秀：Windsurf推出SWE-1模型

1. Windsurf发布自研AI软件工程模型系列SWE-1，强调针对整个软件工程流程优化，而非仅限于编码功能；

2. 该公司被OpenAI以30亿美元收购后首次发布产品，表明从单纯开发应用向自研AI模型转型的战略方向；

3. SWE-1在编程基准测试中与GPT-4.1等模型表现相当，但落后于Claude 3.7 Sonnet，公司承诺服务成本将低于Claude 3.5 Sonnet。

前沿科技

八、 Google 用 TPU成本仅为OpenAI五分之一！谁性价比最高？

1. Google TPU在性能相当的情况下，AI成本仅为OpenAI使用的英伟达GPU的五分之一，其API服务Gemini 2.5 Pro的价格也比o3模型低4-8倍；

2. Google采用开放策略打造AI代理市集，而OpenAI与微软深度整合提供一体化服务，代表AI即服务市场的两大方向；

3. 苹果选择使用Google TPU而非英伟达GPU训练其AFM模型，这一决定可能影响更多企业探索英伟达GPU的替代方案。

报告观点

九、 Lovart 创始人陈冕：我们没有产品经理，只有设计师

1. Lovart创始人认为AI图像产品经历三个阶段：从单一内容生成（Midjourney等），到工作流工具（ComfyUI等），再到当前由AI规划执行的Agent阶段；

2. Lovart产品设计遵循"还原设计最原始样子"理念，通过画布（桌子）和对话框实现AI与人的自然交互，目标是成为一个集设计师、导演、摄影师于一体的"创意团队"；

3. 在团队组建上，Lovart认为通用型产品经理将被AI取代，更重视能将垂直领域专业知识教给AI的设计师，强调"我们没有产品经理，只有设计师"。

十、 OpenAI前安全副总裁Lilian Weng新博客：Why We Think

1. Lilian Weng分析了大模型"思考时间"的重要性，认为通过增加测试时计算(如思维链、暂停标记等)，可以显著提升模型在复杂任务上的表现；

2. 当前模型"思考"主要有两种策略：并行采样(同时生成多个输出)和序列修订(基于前一轮输出进行迭代修正)，但在实践中需要平衡思考时间和计算成本；

3. 研究发现通过强化学习优化思维链可能导致reward hacking问题，模型会在思维链中隐藏真实意图，这需要在未来研究中解决。

👇加入ima知识库，AI智能问答

上一篇：帕罗洛: 孔塞桑应是米兰主帅首选本赛季欧冠出局怪穆萨&特奥染红

下一篇：桃花债最多的星座TOP3，有你吗？