2026-06-29
今日趋势综述
今天的信号:前沿模型能被一夜拔掉,攥在自己手里的 AI 栈才靠得住
把这周几条放一起看,方向出奇一致,而且带着一点警示意味。最大的事件是『政府关停模型』:6 月 12 日,Anthropic 为遵守一纸美国出口管制令,在数小时内对全球所有客户关停了刚在 6 月 9 日高调发布的 Fable 5 和 Mythos 5——因为没法实时核验每个用户的国籍,唯一能合规的办法就是对所有人、所有地区全部断供。直到 6 月 26 日,最强的网络安全模型 Mythos 5 才被重新授权给约 100 家美国关键基础设施机构和联邦机构,而 Fable 5 至今没有恢复;同一天,OpenAI 的 GPT-5.6 Sol 也只向政府逐一批准的少数伙伴预览。这件事第一次硬邦邦地证明了一个以前只是理论的风险:你赖以干活的那个最强模型,可能因为一道与你无关的命令,在几个小时内对你彻底消失——不是变慢、变贵,而是直接没了。把单一供应商的 SDK 焊死进产品的人,那一刻无处可去。
耐人寻味的是,今天 GitHub 趋势榜上最火的开源工具,几乎都在不约而同地回答同一个问题:怎么把 AI 栈攥回自己手里。Nous Research 的 hermes-agent 冲到约 20.5 万星,它是个『随你成长』的自托管 agent——能从经验里自己长出技能、能跑在一台 $5 的 VPS 上、能从 Telegram/Discord 指挥,最关键的是『用任何你想用的模型,一条命令切换、零锁定』。cognee 约 2.5 万星,把 agent 的长期记忆做成完全本地、数据不出本机的知识图谱,专为那些不能把记忆交给云的场景而生。连微软都在 Build 2026 端出完全自研、不靠蒸馏第三方模型的 5B 编码模型 MAI-Code-1-Flash,直接塞进 GitHub Copilot——宁可自己从头造,也不只是租别人的能力。学界的 LLM-as-an-Investigator 则补上方法论的一课:让 agent 先取证、维护多个竞争假设、问清楚再下结论,别顺着用户那句『我觉得是 X』就拍脑袋——把判断权和证据握在流程里,而不是交给模型的第一反应。
那普通人该从这周学到什么?一句话:别把自己的命门押在某一个『神模型』上。真正能穿越政策波动、供应商变脸、价格起伏的,是三样你能自己说了算的东西——可迁移(像 hermes-agent 那样一行命令换供应商,不被任何一家绑死)、可自托管(像 cognee 那样把数据和记忆留在自己机器上)、和可掌控的流程(像那篇论文那样,把判断、取证、验收沉淀成你定义的步骤而非模型的随机发挥)。落到挣钱上,今天最实在的现金流样本是把 AI 内容生产做成可复制的『出版/邮件代笔』服务:底层模型谁都能换,你卖的是稳定交付的结果和那套跑通的流程——这恰恰是『不依赖单一模型』的最佳示范。记住这周的主线:当最强的能力可能被一键拔掉,稀缺的不再是『接入了哪个模型』,而是『换谁都能照样干活』的那套属于你自己的能力、数据和流程。
Key Points
- **零供应商锁定**:Nous Portal/OpenRouter/OpenAI/自有端点随便用,`hermes model` 一条命令切换、零代码改动,今天哪个模型被拔了就换下一个
- **自托管 + 自我进化**:能跑在 $5 VPS / serverless 上,内置学习闭环——从使用中长出技能、检索过往对话、跨会话越来越懂你,记忆资产留在你自己机器上
- **随处指挥**:单网关同时接 Telegram/Discord/Slack/WhatsApp/Signal/CLI,人在外面用手机就能指挥它在云端 VM 上持续干活
Key Points
- **一道命令,全球归零**:6-12 一纸出口管制令让刚发布三天的 Fable 5 / Mythos 5 在数小时内对全球所有用户断供,证明前沿能力可以『一夜消失』
- **按批准发放的新范式**:6-26 Mythos 5 仅重新放给约 100 家美国关键基础设施机构(Fable 5 仍未恢复),GPT-5.6 Sol 也只对政府批准伙伴预览
- **架构教训**:把单一供应商 SDK 焊死进产品的人无处可去——故障是『总量归零』而非降级,没有多供应商兜底就等于把命门交给别人
Key Points
- **自研不蒸馏**:5B 参数、端到端由微软自己造、明确不蒸馏第三方模型,直接拿生产 Copilot harness 训练,学会和真实工具协作而非只刷离线榜
- **小模型反超**:SWE-Bench Pro 51.2% vs Claude Haiku 4.5 的 35.2%,高出 16 分,主打性价比
- **自适应省 token**:『自适应解答长度』让简单题保持简洁、难题才多花推理,解更难问题最多省 60% token,已在 Copilot 各档与企业版逐步上线
Key Points
- **本地优先、数据不出本机**:完全可本地运行,不依赖云、不调外部 API、数据不离开你的环境,天然适合气隙/合规场景与看重数据主权的个人
- **知识图谱式记忆**:从文档/图片/音频/Slack 抽取结构化知识建成可查询知识图谱,多跳问题(跨多份资料连事实)正确率明显胜过纯切块召回
- **核心能力不收高墙费**:实体抽取/关系映射/多跳查询在每一档(含开源自托管)都是标配,对比某些竞品把图谱锁在 $249/月后面更对个人友好
Key Points
- **治谄媚病**:直击 LLM『顺着用户的猜测过早下结论』的通病,强制 agent 先估模糊度、问清楚、收集足够证据再收敛
- **多假设竞争**:维护一组相互竞争的假设并按回答不断更新可信度,像侦探一样排查,而非一口咬定第一个看似合理的解释
- **真实基准 + 开源评测**:三智能体评测框架 + 取自真实论坛排障帖、覆盖电气/液压/机械的结构化基准,把『有据诊断』做成可复现的评测
Key Points
- **结构化内容最好外包**:邮件/newsletter 内容结构化、可重复,最适合 AI 辅助流程,客户为稳定优质邮件按月付 $3K–10K,毛利厚、可复制
- **出版成本被打穿**:AI 辅助出书相较 $5K–50K/本的人工代笔成本骤降,让『高频出书的个人作者』变成可服务、肯付费的新客群
- **模型可换、卖的是结果**:底层用哪个模型可随时切换,你交付的是稳定内容和跑通的流程——天然抗『某个模型被拔掉』的风险