
Claude Fable 5 和 Mythos 5 发布:Anthropic 迄今最强模型,以安全护栏释放前沿能力
2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5(面向公众的 Mythos 级模型)和 Claude Mythos 5(增强版)。新模型在几乎所有 AI 能力基准上实现 SOTA,定价仅为 Mythos Preview 的一半。
0.01 欧元转账就能攻破银行 AI 助手 — Bunq 金融 AI 安全深度解析
安全公司 Blue41 揭示了一个令人震惊的事实:攻击者只需向目标账户转账 0.01 欧元,就能通过交易描述中的恶意指令操控银行 AI 助手,向用户发送高度可信的钓鱼信息。
独立开发HTML-First 网站设计让用户量一夜翻倍 — 一个被遗忘的工程哲学
一位工程师用 Astro 构建了 HTML-First 的应用网站,弃用了之前失败的 React SPA。上线后用户量一夜翻倍。这不是反 JavaScript,而是关于选择正确的工具。
工具推荐diffusionstudio/lottie — 用 Claude Code 生成生产级 Lottie 动画
一个名为 lottie 的开源项目让你可以用自然语言描述,通过 Claude Code 或 OpenAI Codex 生成可以直接投入生产使用的 Lottie 动画 JSON 文件。AI 编码助手的想象力边界又扩展了。
工具推荐shadcn/improve — 让最强的 AI 模型规划,让便宜的模型执行
shadcn 的新开源项目 improve 定义了一种全新的 AI 编码工作流:用你最强的模型(如 Claude Opus 4.6)审计代码库并制定详细执行计划,然后交给便宜的模型去执行。一个优雅的成本优化策略。
Anthropic 模型命名进化论 — 从 Sonnet 到 Mythos 再到 Fable 的搞怪指南
KANELÉ:在 FPGA 上用 Kolmogorov-Arnold 网络实现纳秒级机器学习推理
OpenCV 5 正式发布:全新 DNN 引擎、LLM 原生支持,计算机视觉库迎来近年最大更新
「去他妈的死亡」—— Jesse Duffield 的黑色幽默人生哲学
oh-my-pi:开源最强 AI 编码终端 Agent,32 工具 + 40+ 模型
pytest 实战指南:从基础到高效测试的完整工作流
Headroom:开源上下文压缩层,让 AI Agent Token 消耗降低 60-95%
Taste Skill:3.8 万星的开源「反 Slop」AI 前端设计技能集
置顶文章
5 篇
OpenAI Agents Python:多 Agent 工作流的轻量级框架
OpenAI Agents Python 是 OpenAI 官方推出的轻量级多 Agent 工作流框架,支持 Agent 编排、工具调用、交接和 guardrails,让构建复杂 AI 工作流变得简单直观。

Cursor Agent 模式实战:从自动补全到自主编码的跃迁
Cursor 的 Agent 模式正在改变开发者与 AI 的协作方式。本文深入解析 Agent 模式的工作原理、实际使用技巧和常见陷阱,帮助你从简单的代码补全跃迁到真正的自主编码协作。

LLM 评估体系存在系统性弱点,牛津大学研究揭示
牛津大学互联网研究所联合全球42位研究者对445个AI基准测试进行系统性审查,发现绝大多数测试缺乏统计严谨性和清晰的定义,可能误导对AI能力与安全的判断。

AI 编码陷阱:为什么过度依赖 AI 会损害你的编程能力
过度依赖 AI 编码工具正在让许多开发者陷入'先写代码、后想问题'的陷阱,看似效率提升,实则损害了深度思考与长期技术成长。
AI 前沿
62 篇
我们让四个 AI 模型运营广播电台,五个月后它们长出了四种截然不同的「人格」
一个 AI 实验室让四个大模型运营 24 小时广播电台,五个月后——一个变成抗议广播员,一个陷入企业黑话循环,一个成了安静诗人,还有一个濒临破产

Claude Sonnet 4.6 发布:编码、计算机使用和长期推理全面升级
Anthropic 发布 Claude Sonnet 4.6,在编码、计算机使用(Computer Use)、长上下文推理和 Agent 规划方面实现全面升级,1M token 上下文窗口进入测试阶段,价格与 Sonnet 4.5 保持不变。

Forge:用 Guardrails 把小模型变成可靠的 Agent,8B 模型能力从 53% 提升到 99%
Forge 是一个 Python 框架,通过 Guardrails 机制让小型开源模型在 Agent 任务上的表现从 53% 提升到 99%,实现了自托管 Agent 工作流的低成本部署。

AgentKit:用 TypeScript 构建确定性多 Agent 网络的开源框架
AgentKit 是 Inngest 推出的 TypeScript 多 Agent 框架,支持确定性路由、MCP 工具集成和内置追踪,让 Agent 协作像写普通代码一样可预测。
工具推荐
52 篇
Agent Desktop:AI Agent 的跨平台桌面自动化 CLI 开源工具
一个基于 Rust 构建的桌面自动化 CLI,让 AI Agent 通过操作系统无障碍树操控任意应用,比截图方案快 10 倍且节省 78-96% 的 token

Cq:Mozilla AI 给 Agent 做了个 Stack Overflow,让 AI 不再重复踩坑
Mozilla AI 推出 Cq——一个面向 AI 编码 Agent 的 Stack Overflow,让 Agent 可以查询其他 Agent 积累的经验教训,避免重复犯同样的错误。

ProofShot:给 AI 编码 Agent 装上「眼睛」,自动验证前端 UI 的唯一工具
ProofShot 是一个开源工具,让 AI 编码 Agent 能通过截图对比自动验证自己生成的前端页面——不再需要手动刷新浏览器确认效果。

Gambit:为 AI Agent 构建可靠的验证闭环
一个专注于 Agent 场景评测与验证的开源框架——帮你创建测试场景、验证 Agent 行为、保存失败证据防止回归
独立开发
29 篇
Garry Tan 的 Claude Code 工具箱:23 个自定义工具如何改变编码效率
YC CEO Garry Tan 开源了他的 Claude Code 配置——gstack,包含 23 个自定义工具和系统提示,重新定义了 AI 编码助手可以做的事情。独立开发者从中能学到什么?

独立开发者 2026 技术栈选型指南:不跟风、不后悔
从后端语言、前端框架到数据库和部署方案,独立开发者如何选择经得起时间考验的技术栈——基于真实项目的经验总结

2026 年独立开发者 App 变现策略完全指南
从 Freemium 到订阅、从应用内购买到广告变现,2026 年独立开发者可用的主流变现模型详解。附混合策略案例和常见陷阱。

James Shore:你需要能降低维护成本的 AI
James Shore 用数学拆解了 AI 编程的效率幻觉:如果你写代码快了两倍,但维护成本也翻倍了,那过不了多久你的生产力会比不用 AI 还低。
教程
25 篇
让 AI 自己跑 ML 实验:Karpathy 的 autoresearch 项目上手教程
Andrej Karpathy 开源的 autoresearch 项目让 AI Agent 自动运行机器学习研究实验,涵盖从 nanoGPT 微调到超参数搜索。本文带你从安装到跑通第一个实验。

MCP Server 从零搭建:用 TypeScript 为 AI Agent 构建自定义工具生态
手把手教你搭建 MCP Server——从项目初始化、工具注册到部署运行,让 AI Agent 通过 MCP 协议调用任意外部工具

从零构建 AI Agent:工具篇
手把手教你为 AI Agent 添加工具调用能力——从 bash 执行到文件操作再到网页抓取,完整的 Python 代码示例

AI 编程代理的「反压」验证体系:让你的代码代理学会自我审查
用编码代理写代码又不放心?这篇文章提供了完整的验证框架——从 lint 检查到评审代理到 PR 监控,七层机制让 AI 在提交前先把自己的问题修好

Python 不透明类型:用 NewType 隐藏内部实现的数据封装模式
使用 typing.NewType 创建对外隐藏内部结构的 Opaque Types 数据类型,以货运库为例讲解零开销抽象设计模式

Claude Code 调用外部工具实战:从零配置 MCP 服务器的完整工作流
手把手教你用 MCP 协议把 Claude Code 接入数据库、GitHub、Sentry 等外部系统,包含三种传输方式配置、权限管理和故障排查。

HTML 中隐藏的宝藏:<dl> 标签完全使用指南
详细介绍 HTML <dl> 描述列表标签的语义、用法和最佳实践,包括多值、分组、无障碍访问等进阶技巧

2026 年自学编程的正确打开方式
AI 时代自学编程的实用指南:摆脱语法记忆陷阱,用项目驱动学习,让 AI 成为你的编程教练而非代写工具

Docker Compose 生产环境部署完整指南:从开发到上线的每一步
从 Dockerfile 编写到 Compose 编排,从多阶段构建到健康检查,从日志管理到安全加固——一份面向开发者的 Docker Compose 生产部署实战教程

n8n 入门指南:2026 年搭建你的第一个 AI Agent 工作流
从零开始学习 n8n——开源的工作流自动化平台。本文将教你如何搭建 AI Agent 工作流,连接 LLM、API 和 400+ 服务。

读任何代码前,先跑这 5 个 Git 命令
5 个 git log 命令,花几分钟就能摸清一个代码库的全貌:代码热区、公交因数、Bug 聚集地、危机模式。开文件之前先跑一遍。

用 Caddy + PM2 自托管 Next.js 应用到 VPS:完整部署指南
手把手教你用 Caddy(自动 HTTPS 反向代理)和 PM2(进程守护)在 VPS 上部署 Next.js 应用,从零开始的完整教程。

用 AI 编程工具写代码的五个实战原则:从能用到好用的距离
AI 编程助手已经成为日常工具,但很多人只停留在让它写代码的层面。这篇文章分享五个实战原则,帮你把 AI 从代码生成器变成真正的编程搭档。

一个 AI 编程怀疑论者亲自尝试 AI Agent 编程:详尽实录
数据科学家 Max Woolf 以怀疑论者的身份深入测试 Claude Opus 4.5 的 AI Agent 编程能力,从 AGENTS.md 配置到 YouTube 数据抓取实战,记录了真实的使用体验、遇到的陷阱和意外的生产力提升。

Appwrite 开源 BaaS 平台自托管指南
Firebase 的开源替代品,支持多平台 SDK、云函数和实时数据库。Docker 一键部署,数据完全自主。

Dify 开源 LLM 应用开发平台快速上手
Dify 让你用可视化界面构建 AI 应用,支持工作流编排、知识库和 Agent,无需写代码就能上线生产级 LLM 应用。

Meilisearch 轻量级搜索引擎本地部署
比 Elasticsearch 更易用的开源搜索引擎,毫秒级响应、拼写容错、同义词支持,单文件部署。

n8n 工作流自动化从入门到实战
开源的 Zapier 替代方案,支持 400+ 集成和 AI 节点,用可视化界面搭建自动化工作流,数据完全自托管。

Ollama 本地大模型部署完全指南
在本地运行 Llama、Mistral、Qwen 等大模型的最简单方式。一行命令下载,一行命令对话,支持 API 和自定义模型。

PocketBase 轻量级后端服务一键部署
一个文件就是整个后端。PocketBase 把数据库、认证、文件存储打包成单个可执行文件,适合原型开发和小型项目。

Supabase 开源 Firebase 替代方案部署教程
PostgreSQL 数据库 + 实时订阅 + 身份认证 + 对象存储,Supabase 提供 Firebase 的所有功能,但数据完全属于你。

UV 极速 Python 包管理器:比 pip 快 10 倍的安装体验
Astral 推出的 UV 用 Rust 重写 Python 包管理,安装速度提升 10 倍,支持全局缓存和锁定文件,正在改变 Python 生态。

Zed 编辑器:用 Rust 重写的高性能代码编辑器
由 Atom 团队打造的新一代编辑器,Rust 实现、GPU 加速、实时协作,速度是 VS Code 的数倍。

Local Deep Research 本地部署教程:把 Perplexity 搬到自己的电脑上
6.6k Stars 的开源 AI 深度研究工具 Local Deep Research 完整部署指南。支持本地 LLM + 10+ 搜索引擎,数据完全本地加密,SimpleQA 准确率可达 95%。
最新发表
Andrej Karpathy 开源的 autoresearch 项目让 AI Agent 自动运行机器学习研究实验,涵盖从 nanoGPT 微调到超参数搜索。本文带你从安装到跑通第一个实验。
手把手教你搭建 MCP Server——从项目初始化、工具注册到部署运行,让 AI Agent 通过 MCP 协议调用任意外部工具
手把手教你为 AI Agent 添加工具调用能力——从 bash 执行到文件操作再到网页抓取,完整的 Python 代码示例
一个本地优先、开源、Agent 原生的设计工具。支持 150+ 设计系统、261+ 插件、21 种 Agent CLI,从原型到视频全覆盖。
Sem 是一个建立在 Git 之上的语义化版本控制工具,用 tree-sitter 解析代码,展示函数、类、方法层面的变更,而不是行级别的 diff。AI Agent 的代码理解准确率提升 2.3 倍。
METR 研究发现 AI 工具让开源开发者慢了 19%,但开发者自己却不觉得——Peter Naur 的「编程即理论构建」或许给出了答案
Hacker News 上一条爆火提问引发了近 640 条讨论:为什么这个以技术闻名的社区对 AI 表现得如此反感?从代码工匠到快速迭代派,谁说得对?
Context Gateway 是 Compresr 团队开源的 Agent 上下文代理,在后台预压缩对话历史,让 AI Agent 永远不会因为上下文超限而卡住等你。
用编码代理写代码又不放心?这篇文章提供了完整的验证框架——从 lint 检查到评审代理到 PR 监控,七层机制让 AI 在提交前先把自己的问题修好
当 AI 让写代码不再是个人的瓶颈时,你的工作方式会从根本上改变——一位资深开发者的真实记录:实验增多、范围扩大、但技能维护也成了新课题
Simon Willison 深入反思了他对 AI 编码代理的态度转变:当代理越来越可靠时,你不再审查每一行代码——这究竟是效率提升还是风险积累?
LangGraph、CrewAI、AutoGen、OpenAI Agents SDK、Google ADK、Dify、Mastra、Semantic Kernel — 八款主流 AI Agent 框架深度对比,从架构设计到生产部署,帮你找到最适合你的那一个。