AI 前沿
大模型动态、AI工具实测、实战落地

IBM 发布 0.7nm 芯片技术:纳米堆叠或在未来十年延续摩尔定律
IBM 发布全球首个 sub-1nm 芯片技术,采用纳米堆叠 (CFET) 架构,在指甲盖大小上容纳近 1000 亿个晶体管,性能提升最高 50%,能效提升最高 70%。

OpenAI 联手 Broadcom 发布 Jalapeño:首款自研 AI 推理芯片
OpenAI 与 Broadcom 合作推出首款定制 AI 推理芯片 Jalapeño,专为 LLM 推理优化,性能对标 Nvidia Blackwell 和 Google TPU,计划 2026 年底部署。

Baidu Unlimited OCR:开源无限 OCR 模型,单次解析整份文档,435 点登顶 Hacker News
百度开源了 Unlimited OCR 模型(MIT 许可),实现了真正意义上的「一次性长视野文档解析」——无需分页、无需预处理,单次推理即可完成整份多页文档的结构化文本提取,在 Hacker News 上获得 435 分。

Claude 自主操控机器狗,速度比人类快 37.7 倍:Anthropic Project Fetch 第二阶段
Anthropic 发布 Project Fetch 第二阶段研究:Claude Opus 4.7 在零人类协助下操控机器狗完成复杂任务,平均每项仅需 2.4 分钟,而去年的人类团队需要 72 分钟。

瑞士发布完全开源 AI 模型 Apertus:主权 AI 的新范本
瑞士由 EPFL、ETH Zurich 和 CSCS 联合开发的 Apertus 成为首个完全开源的大语言模型,支持 1000+ 语言,100% 符合欧洲数据保护法规。

GLM-5.2 发布:753B 开源大模型登顶 Intelligence Index,性价比碾压闭源
智谱 AI 发布 GLM-5.2,753B 参数 MoE 架构、MIT 许可证、1M token 上下文窗口,Intelligence Index v4.1 开源模型排名第一,输入仅 $1.4/M tokens。

运行本地大模型已经够好了:2026 年本地 LLM 生态的里程碑
Vicki Boykis 实测表明,本地模型已可达到闭源旗舰模型 75% 的编码能力,Gemma 4 + LM Studio + Pi agent 的组合正在改变开发者工作流。

OpenAI 如何为 9 亿用户构建低延迟语音 AI:WebRTC 架构深度解析
OpenAI 工程博客详解如何在 Kubernetes 上以 Relay + Transceiver 架构支撑 ChatGPT Voice 和 Realtime API 的全球实时语音服务。

拜耳与 Thoughtworks 联手打造 PRINCE:一个可靠的 Agentic RAG 系统从零到生产
从关键词搜索到多智能体协同,拜耳的临床前药物研发平台展示了构建生产级 AI 系统的工程实践:上下文工程、缰绳工程、回退机制与可观测性

更大的模型不是出路:GPT-5.5 幻觉率 86%,是开源 GLM-5.2 的三倍
独立研究者的对比测试发现,GPT-5.5 的幻觉率高达 86%,而 MIT 开源模型 GLM-5.2 仅为 28%。更大参数的模型不仅没有更聪明,反而更不愿意承认自己不知道——这揭示了 AI 行业尚未解决的三难困境。

LLM 不再「简单」:从 Transformer 堆叠到异质化架构的进化之路
Meta 前工程师 Ian Barber 撰文指出,LLM 架构已经走过了简单的 'Transformer 堆叠' 时代,进入了类似推荐系统的异质化复杂阶段。注意力变体激增、MoE 全面扩散、多模态深度集成——现代 LLM 的复杂度已不可同日而语。

NVIDIA 开源 SkillSpector:扫描发现 26% 的 AI Agent 技能存在安全漏洞
NVIDIA 发布开源安全扫描器 SkillSpector,对 42,447 个公开 AI Agent 技能的分析发现:26.1% 存在至少一个漏洞,5.2% 显示有恶意意图。覆盖提示注入、数据窃取、权限提升、供应链攻击等 16 类 64 种风险模式。