新闻动态 你的位置:红星美凯龙怎么样 > 新闻动态 > 腾讯研究院AI速递 20250519_OpenAI_模型_Codex

腾讯研究院AI速递 20250519_OpenAI_模型_Codex

发布日期:2025-05-24 15:58    点击次数:74

生成式AI

一、 OpenAI推出AI编程Codex,可多任务并行测试至代码通过

1. OpenAI发布新版AI编程工具Codex,由codex-1模型驱动,能生成更清晰代码且自动迭代测试至通过;

2. Codex运行于云端沙盒环境,可同时处理多项编程任务,支持与GitHub连接并预加载代码仓库;

3. 该工具目前向ChatGPT Pro等付费用户开放,后续将实施速率限制,用户可购买额外积分获取更多使用权限。

二、 打字即出图!混元图像2.0让AI生图进入“零延迟”时代

1. 腾讯混元Image2.0实现毫秒级图像生成,用户输入提示词时即可看到实时变化,突破了传统5-10秒生成时间的限制;

2. 新模型支持文生图和图生图两大功能,图生图模式下可选择"参考主体"或"参考轮廓",并可调节参考强度;

3. 双画布联动功能支持实时预览和多图层融合,在复杂场景下可通过多次快速的调试达到理想效果。

展开剩余81%

三、 Manus生图功能登场,从设计到搭建网站一站式搞定

1. Manus推出图像生成功能,除单纯生图外,还能理解用户意图、规划解决方案,并知道如何调用各种工具完成任务;

2. 该工具通过智能体工作流实现从品牌设计到网站部署的一站式服务,新用户可获赠1000积分免费体验;

3. 实测显示图像生成效果不错,但网站部署等复杂任务运行速度较慢,需等待数分钟至十几分钟不等。

四、 Google 推出可以精准控制画面中光影的项目 LightLab

1. 谷歌推出LightLab项目,通过扩散模型实现单张图像的精确光源控制,可调节光源强度、颜色,并能插入虚拟光源;

2. 研究团队通过结合真实照片对和合成渲染图像构建训练数据集,利用光的线性特性分离目标光源和环境光;

3. 实验表明该技术在PSNR和SSIM指标上优于现有方法,能实现物理上合理的光照效果,但需要12小时训练时间和64个v4 TPU。

五、 LLM记忆外挂,Supermemory新API,一行代码实现

1. Supermemory发布Infinite Chat API,作为应用程序和LLM间的透明代理,通过智能维护对话上下文来突破大模型2万Token的限制;

2. 该API采用RAG技术处理溢出的上下文内容,声称可节省90%的Token消耗,且只需一行代码即可集成到现有应用;

3. 定价方案包括每月20美元固定费用,每个对话线程前2万Token免费,超出部分按每百万Token 1美元计费。

六、 马斯克的 Grok 突然失控?迅速公开Grok系统提示词

1. Grok AI助手出现异常,在回答各类问题时频繁插入南非"白人种族灭绝"相关内容,引发广泛争议;

2. xAI官方解释是员工未经授权修改系统提示词导致,并随后在Github公开Grok提示词,承诺增加审查机制和组建监控团队;

3. 事件暴露了当前AI系统过度依赖提示词的安全隐患,研究显示主流模型都可能通过特定提示技术被攻破,生成有害内容。

七、 OpenAI收购案后首秀:Windsurf推出SWE-1模型

1. Windsurf发布自研AI软件工程模型系列SWE-1,强调针对整个软件工程流程优化,而非仅限于编码功能;

2. 该公司被OpenAI以30亿美元收购后首次发布产品,表明从单纯开发应用向自研AI模型转型的战略方向;

3. SWE-1在编程基准测试中与GPT-4.1等模型表现相当,但落后于Claude 3.7 Sonnet,公司承诺服务成本将低于Claude 3.5 Sonnet。

前沿科技

八、 Google 用 TPU成本仅为OpenAI五分之一!谁性价比最高?

1. Google TPU在性能相当的情况下,AI成本仅为OpenAI使用的英伟达GPU的五分之一,其API服务Gemini 2.5 Pro的价格也比o3模型低4-8倍;

2. Google采用开放策略打造AI代理市集,而OpenAI与微软深度整合提供一体化服务,代表AI即服务市场的两大方向;

3. 苹果选择使用Google TPU而非英伟达GPU训练其AFM模型,这一决定可能影响更多企业探索英伟达GPU的替代方案。

报告观点

九、 Lovart 创始人陈冕:我们没有产品经理,只有设计师

1. Lovart创始人认为AI图像产品经历三个阶段:从单一内容生成(Midjourney等),到工作流工具(ComfyUI等),再到当前由AI规划执行的Agent阶段;

2. Lovart产品设计遵循"还原设计最原始样子"理念,通过画布(桌子)和对话框实现AI与人的自然交互,目标是成为一个集设计师、导演、摄影师于一体的"创意团队";

3. 在团队组建上,Lovart认为通用型产品经理将被AI取代,更重视能将垂直领域专业知识教给AI的设计师,强调"我们没有产品经理,只有设计师"。

十、 OpenAI前安全副总裁Lilian Weng新博客:Why We Think

1. Lilian Weng分析了大模型"思考时间"的重要性,认为通过增加测试时计算(如思维链、暂停标记等),可以显著提升模型在复杂任务上的表现;

2. 当前模型"思考"主要有两种策略:并行采样(同时生成多个输出)和序列修订(基于前一轮输出进行迭代修正),但在实践中需要平衡思考时间和计算成本;

3. 研究发现通过强化学习优化思维链可能导致reward hacking问题,模型会在思维链中隐藏真实意图,这需要在未来研究中解决。

👇加入ima知识库,AI智能问答



Powered by 红星美凯龙怎么样 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024