
Factorio 学习环境:让 AI Agent 在游戏中自主学习建造工厂
Factorio Learning Environment (FLE) v0.3.0 发布,为 AI Agent 提供了一个在复杂游戏中自主学习建造工厂的开源评测平台,展示了大型语言模型在长程规划与动态环境适应方面的能力边界。
大模型动态、AI工具实测、实战落地

Factorio Learning Environment (FLE) v0.3.0 发布,为 AI Agent 提供了一个在复杂游戏中自主学习建造工厂的开源评测平台,展示了大型语言模型在长程规划与动态环境适应方面的能力边界。

牛津大学互联网研究所联合全球42位研究者对445个AI基准测试进行系统性审查,发现绝大多数测试缺乏统计严谨性和清晰的定义,可能误导对AI能力与安全的判断。

BrowserOS(Nxtscape)是一款开源的 Agentic 浏览器,基于 Chromium 分叉构建,让 AI 能够自主浏览网页、提取信息并执行操作,是 ChatGPT Atlas、Perplexity Comet 和 Dia 的隐私优先替代方案。

OpenCode 是一款月活超 650 万开发者的开源 AI 编码助手,支持终端、IDE 和桌面端,可连接 75 家以上 LLM 提供商,且以隐私优先为设计原则。

Anthropic 要求投资者在48小时内提交新一轮融资认购意向,本轮融资金额约500亿美元,估值可能达到9000亿美元,预计两周内完成。

苹果最新财报显示 Mac 销量超预期,AI 工作负载需求成为增长驱动力,M系列芯片的 AI 性能优势正在推动用户换机潮。

OpenAI 于周四表示,印度已成为 ChatGPT Images 2.0 最大的用户市场,但第三方数据显示该功能在全球范围内的增长有限,仅在部分新兴市场出现明显峰值。

谷歌宣布将 Gemini AI 引入搭载 Google 内置系统的汽车,标志着从现有 Google Assistant 的重大升级。该功能将首先在美国推出英语版本,兼容现有车辆可通过软件更新获得。

马斯克在法庭上承认 xAI 使用 OpenAI 模型通过蒸馏方法训练 Grok,这起案件揭示了 AI 行业关于模型蒸馏的法律灰色地带。

在 Sam Altman 批评 Anthropic 限制其网络安全工具 Mythos 后,OpenAI 也宣布将对其 GPT-5.5 Cyber 工具仅向特定网络安全防御者开放。

软银计划创建一家专注于自动化数据中心建设的机器人公司,并已着眼于1000亿美元的 IPO 目标,以应对 AI 基础设施需求爆发。

Stripe 推出专为 AI 时代打造的数字钱包 Link,让自主 AI 智能体能够执行购物、预订等需要支付操作的任务。