刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测
今天凌晨1点,OpenAI开源了一个全新的AI Agent评测基准——PaperBench。 这个基准主要考核智能体的搜索、整合、执行等能力,需要对2024年国际机器学习大会上顶尖论文的复现,包括对论文内容的理解、代码编写以及实验执行等方面的能力。 根据OpenAI公布的测试数据显示,目前知名大模型…
1小时暴涨100万用户!GPT-4o新功能彻底杀疯了,免费使用
今天凌晨,OpenAI联合创始人兼首席执行官Sam Altman发布在线急购GPU的消息:如果有人能提供10万单位的GPU资源并能尽快交付,请马上联系我们! 同时正在逐步控制局面。但大家应该预料到,由于我们在应对算力方面的挑战,OpenAI的新发布内容将会延迟,可能会出现一些问题,并且服务有时也会变…
Agent重大突破!OpenAI智能体支持MCP,已开源
今天凌晨2点,OpenAI对Agent SDK进行了重大更新支持MCP服务,可以统一接口标准解锁无限工具。 现在Agent可以快速集成网络搜索、专业分析、本地查询、网络追踪等各式各样的工具,这对于开发超复杂自动化智能体来说帮助巨大。 例如,在开发一个需要同时进行文件处理、数据查询和网络信息收集的智能…
刚刚,OpenAI发布新文生图模型,免费、逼真到难以分辨
今天凌晨2点,OpenAI进行了技术直播,对GPT-4o和Sora进行了重大更新,提供了全新文生图模型。 除了文生图之外,该模型还支持自定义操作、连续发问、风格转换、图像PPT等超实用功能,例如,更改图片的宽高比、图像物体中的角度,用十六进制代码指定精确颜色等。 尤其是生成图像的逼真度,肉眼几乎看不…
彻底颠覆教育!每天用AI学习2小时,成绩超美国98%学校
今天凌晨3点,OpenAI联合创始人兼总裁Greg Brockman分享了,一个AI颠覆传统教育的消息。 美国得克萨斯州的Alpha School学校,每天只让学生和AI学习2小时,其他时间全部用来学习演讲、金融、社交、语言、团队协作、跑步、游泳、骑车等生存技能。 教育结果显示,Alpha Scho…
比DeepSeek、o1高3倍!首创无服务器强化微调,只需十几个数据点,
今天凌晨,知名大模型训练、开发平台Predibase发布了,首个端到端强化微调平台(RFT)。 与传统的监督式微调相比,RFT不依赖大量的标注数据,而是通过奖励和自定义函数来完成持续的强化学习,同时支持无服务器和端到端训练方法,从数据管理、训练模型到应用部署可以在同一个平台全部完成。 也就是说,你只…
英伟达全力发展AI Agent!开源专属大模型,最强AI工厂
今天凌晨,全球AI领导者英伟达(Nvidia)在美国圣何塞举办了“GTC 2025”全球产品、开发者大会,涵盖大模型、AI Agent、实体机器人、AI专用芯片、量子计算等技术分享。 其中,英伟达在官网宣布与Oracle(甲骨文)达成技术合作,提供160多种原生AI工具和100多个微服务,帮助企业构…
AI Agent再迎一巨头!Zoom发布全平台Agent,智能体大爆发
今天凌晨,全球视频会议领导者Zoom在官网宣布,发布一系列AI Agent产品来增强全平台功能,同时Zoom进入全新的智能体自动化时代。 本次通过Agent增强的产品包括Zoom Meetings、Zoom Phone、Zoom Team Chat、Zoom Docs、Zoom Contact Ce…
免费使用!百度重磅发布文心4.5、X1,视频解读+深度思考
昨天,百度发布了两款大模型文心4.5和X1,已全部上线并且免费使用。 文心4.5是一款多模态模型,能对文字、图片、视频、音频等内容进行综合解读。例如,给一个视频,让其对内容识别然后再写一份深度分析(非常不错可以解读英文)。能力大幅度超过OpenAI的GPT-4o。 X1和DeepSeek-R1一样具…
云计算巨头AI战略分化:谁将定义企业级AI的未来规则?
AI大模型的商业化进程正在重塑云计算行业的竞争逻辑。从2023年的“技术验证年(POC)”,到2024年的“规模生产年”,当企业级客户的需求从追逐单一模型的“极致性能”转向寻求性能、成本、安全与场景适配性的平衡,头部云厂商的战略分野已然清晰——亚马逊云科技于昨天凌晨在Amazon Bedrock平台…