AI 前沿

大模型动态、AI工具实测、实战落地

共 77 篇RSS

📌 置顶

IBM 发布全球首个 sub-1nm 芯片技术，采用纳米堆叠 (CFET) 架构，在指甲盖大小上容纳近 1000 亿个晶体管，性能提升最高 50%，能效提升最高 70%。

OpenAI 与 Broadcom 合作推出首款定制 AI 推理芯片 Jalapeño，专为 LLM 推理优化，性能对标 Nvidia Blackwell 和 Google TPU，计划 2026 年底部署。

百度开源了 Unlimited OCR 模型（MIT 许可），实现了真正意义上的「一次性长视野文档解析」——无需分页、无需预处理，单次推理即可完成整份多页文档的结构化文本提取，在 Hacker News 上获得 435 分。

Anthropic 发布 Project Fetch 第二阶段研究：Claude Opus 4.7 在零人类协助下操控机器狗完成复杂任务，平均每项仅需 2.4 分钟，而去年的人类团队需要 72 分钟。

瑞士由 EPFL、ETH Zurich 和 CSCS 联合开发的 Apertus 成为首个完全开源的大语言模型，支持 1000+ 语言，100% 符合欧洲数据保护法规。

智谱 AI 发布 GLM-5.2，753B 参数 MoE 架构、MIT 许可证、1M token 上下文窗口，Intelligence Index v4.1 开源模型排名第一，输入仅 $1.4/M tokens。

Vicki Boykis 实测表明，本地模型已可达到闭源旗舰模型 75% 的编码能力，Gemma 4 + LM Studio + Pi agent 的组合正在改变开发者工作流。

OpenAI 工程博客详解如何在 Kubernetes 上以 Relay + Transceiver 架构支撑 ChatGPT Voice 和 Realtime API 的全球实时语音服务。

从关键词搜索到多智能体协同，拜耳的临床前药物研发平台展示了构建生产级 AI 系统的工程实践：上下文工程、缰绳工程、回退机制与可观测性

独立研究者的对比测试发现，GPT-5.5 的幻觉率高达 86%，而 MIT 开源模型 GLM-5.2 仅为 28%。更大参数的模型不仅没有更聪明，反而更不愿意承认自己不知道——这揭示了 AI 行业尚未解决的三难困境。

Meta 前工程师 Ian Barber 撰文指出，LLM 架构已经走过了简单的 'Transformer 堆叠' 时代，进入了类似推荐系统的异质化复杂阶段。注意力变体激增、MoE 全面扩散、多模态深度集成——现代 LLM 的复杂度已不可同日而语。

NVIDIA 发布开源安全扫描器 SkillSpector，对 42,447 个公开 AI Agent 技能的分析发现：26.1% 存在至少一个漏洞，5.2% 显示有恶意意图。覆盖提示注入、数据窃取、权限提升、供应链攻击等 16 类 64 种风险模式。