AI 前沿

大模型动态、AI工具实测、实战落地

62RSS
Factorio 学习环境:让 AI Agent 在游戏中自主学习建造工厂

Factorio 学习环境:让 AI Agent 在游戏中自主学习建造工厂

Factorio Learning Environment (FLE) v0.3.0 发布,为 AI Agent 提供了一个在复杂游戏中自主学习建造工厂的开源评测平台,展示了大型语言模型在长程规划与动态环境适应方面的能力边界。

LLM 评估体系存在系统性弱点,牛津大学研究揭示

LLM 评估体系存在系统性弱点,牛津大学研究揭示

牛津大学互联网研究所联合全球42位研究者对445个AI基准测试进行系统性审查,发现绝大多数测试缺乏统计严谨性和清晰的定义,可能误导对AI能力与安全的判断。

Nxtscape:开源 Agent 浏览器让 AI 自主浏览网页

Nxtscape:开源 Agent 浏览器让 AI 自主浏览网页

BrowserOS(Nxtscape)是一款开源的 Agentic 浏览器,基于 Chromium 分叉构建,让 AI 能够自主浏览网页、提取信息并执行操作,是 ChatGPT Atlas、Perplexity Comet 和 Dia 的隐私优先替代方案。

OpenCode:开源 AI 编码助手的新选择

OpenCode:开源 AI 编码助手的新选择

OpenCode 是一款月活超 650 万开发者的开源 AI 编码助手,支持终端、IDE 和桌面端,可连接 75 家以上 LLM 提供商,且以隐私优先为设计原则。

消息称 Anthropic 新一轮 9000 亿美元估值融资或两周内完成

消息称 Anthropic 新一轮 9000 亿美元估值融资或两周内完成

Anthropic 要求投资者在48小时内提交新一轮融资认购意向,本轮融资金额约500亿美元,估值可能达到9000亿美元,预计两周内完成。

苹果对 AI 驱动的 Mac 需求感到意外:Q2 财报超出预期

苹果对 AI 驱动的 Mac 需求感到意外:Q2 财报超出预期

苹果最新财报显示 Mac 销量超预期,AI 工作负载需求成为增长驱动力,M系列芯片的 AI 性能优势正在推动用户换机潮。

ChatGPT Images 2.0 在印度大受欢迎,但在全球其他地区表现平平

ChatGPT Images 2.0 在印度大受欢迎,但在全球其他地区表现平平

OpenAI 于周四表示,印度已成为 ChatGPT Images 2.0 最大的用户市场,但第三方数据显示该功能在全球范围内的增长有限,仅在部分新兴市场出现明显峰值。

谷歌 Gemini AI 助手将登陆数百万辆汽车

谷歌 Gemini AI 助手将登陆数百万辆汽车

谷歌宣布将 Gemini AI 引入搭载 Google 内置系统的汽车,标志着从现有 Google Assistant 的重大升级。该功能将首先在美国推出英语版本,兼容现有车辆可通过软件更新获得。

马斯克出庭作证:xAI 使用 OpenAI 模型训练 Grok

马斯克出庭作证:xAI 使用 OpenAI 模型训练 Grok

马斯克在法庭上承认 xAI 使用 OpenAI 模型通过蒸馏方法训练 Grok,这起案件揭示了 AI 行业关于模型蒸馏的法律灰色地带。

在批评 Anthropic 限制 Mythos 后,OpenAI 也限制了其网络安全工具 Cyber 的访问

在批评 Anthropic 限制 Mythos 后,OpenAI 也限制了其网络安全工具 Cyber 的访问

在 Sam Altman 批评 Anthropic 限制其网络安全工具 Mythos 后,OpenAI 也宣布将对其 GPT-5.5 Cyber 工具仅向特定网络安全防御者开放。

软银创建自动化数据中心建设机器人公司,目标 1000 亿美元 IPO

软银创建自动化数据中心建设机器人公司,目标 1000 亿美元 IPO

软银计划创建一家专注于自动化数据中心建设的机器人公司,并已着眼于1000亿美元的 IPO 目标,以应对 AI 基础设施需求爆发。

Stripe 推出 Link 数字钱包:自主 AI 智能体也能用了

Stripe 推出 Link 数字钱包:自主 AI 智能体也能用了

Stripe 推出专为 AI 时代打造的数字钱包 Link,让自主 AI 智能体能够执行购物、预订等需要支付操作的任务。