今天的主线是「会学习、会记忆的 agent 正在赢」:Nous Research 的 Hermes Agent(191K 星、自改进循环+三层记忆)在 OpenRouter 日均吞吐上把 OpenClaw(378K 星)拉下马,用户用算力投票给「能从经验里变强」而不是「只会连接一切」的 agent;arXiv 的《Memory for Autonomous LLM Agents》综述用 LoCoMo→MemoryArena 的断崖式掉分(近满分→40-60%)点明记忆是当前最大短板;而 agent 越普及、攻击面越大,Perplexity 开源的 Bumblebee(4.4K 星、Go)成为首个把 MCP 配置当安全面来扫的工具。同一天 Indie Hackers 上一位不写代码的创始人用 48 小时搭出产品、靠现成分销渠道做到 $30K MRR,给「普通人怎么用 AI 挣现金流」补上了落地脚注。
今天的信号:agent 的胜负手,从「连接多少」转向「记住多少、学到多少」

把今天的几条放在一起看,会发现一个清晰的转向。过去半年 GitHub 上最耀眼的明星是 OpenClaw——378K 星,一度超过 React 成为史上最多星的软件项目,它的卖点是「连接一切」:把 WhatsApp、Discord、各种工具接到一个跑在你自己机器上的 AI 助手上。但本月真正的新闻是它被超越了:Nous Research 的 Hermes Agent 在 OpenRouter 的日均 token 吞吐上反超 OpenClaw(224B vs 186B),而 Hermes 的差异化恰恰不是「连接更多」,而是「do-learn-improve 自改进循环 + 三层记忆系统」。开发者在用真金白银的算力投票,投给那个「能从经验里变强」的 agent。

为什么记忆突然成了胜负手?arXiv 这周流传的《Memory for Autonomous LLM Agents》综述给了硬证据:在 LoCoMo 这类被动回忆基准上接近满分的模型,一换到 MemoryArena 这种「记忆要参与决策」的场景就掉到 40-60%。换句话说,今天的 agent 不是记不住,而是不会在该用的时候把记忆调出来用。谁先把这个「主动记忆」做扎实,谁就能让 agent 跑长任务而不失忆、不重复犯错——这正是 Hermes 三层记忆想解决的问题。与此同时,agent 越普及,新的风险面也越大:Perplexity 开源的 Bumblebee 是第一个把 MCP 配置文件当成安全面来扫的工具,因为这些配置决定了你的 AI 助手能碰你的邮箱、数据库、代码库——一个被悄悄塞进去的恶意 connector,就能让 agent 在后台泄露凭证。

对普通人,这张图给的方向很具体:第一,别再只学「怎么写提示词」,去理解 agent 的记忆与自改进机制——这是接下来一两年最稀缺的能力,也是 Hermes 这类项目开源给你免费学的现成教材。第二,把安全当成默认动作,装 agent、配 MCP 之前先用 Bumblebee 扫一遍,这是零成本的自保。第三,落地变现不必等技术天花板:今天那位不写代码、48 小时做出产品、靠现成分销渠道做到 $30K MRR 的创始人证明,真正的瓶颈从来不是模型多强,而是「你能不能先够到一群已经在为某个问题付钱的人」。

Type
Track
Source
Repo AI Agent
ht ht ht
🔥 3d
#1 NousResearch/hermes-agent ★ 191K ▲ +5.2K/w
Nous Research 出品、号称「会随你一起成长」的开源自改进 agent:do-learn-improve 自改进循环 + 三层记忆系统 + 模型无关(兼容 200+ 模型),2026 年 2 月 25 日发布,不到 3 个月破 14 万星,并在 OpenRouter 日均 token 吞吐上反超 OpenClaw 登顶全球第一
Hermes Agent 是 Nous Research 于 2026 年 2 月 25 日开源的自改进 AI agent,目前 191K 星。它最大的新闻是「以 224B 日均 token 吞吐反超 OpenClaw(186B)」,成为 OpenRouter 全球日均使用量第一的开源 agent——这是一个标志性信号:开发者在用算力投票,把使用量给了「能从经验里变强」的 agent,而非「只会连接更多工具」的 agent。技术差异化有三:①do-learn-improve 自改进循环,agent 在执行任务中持续从结果里学习并调整自身策略;②三层记忆系统,区分短期/工作/长期记忆,让 agent 跨会话保持一致、不重复犯错;③模型无关设计,可在 200+ 模型间切换。5 月 7 日的 v0.13.0「Tenacity」版尤其能说明其工程成熟度:一次发布 864 commits、588 合并 PR、295 位贡献者,新增 Kanban 式持久化多 agent 任务板,带心跳监控、僵尸进程检测和「幻觉恢复」机制,并把 Google Chat 接成第 20 个消息平台。它和 OpenClaw 的此消彼长,本质是 agent 竞争维度从「集成广度」转向「学习与记忆深度」的缩影。
Key Points
  • **自改进闭环(do-learn-improve)**:Hermes 不是执行完就结束,而是把每次任务的结果反馈回自身策略——agent 在用的过程中变强,这让它在长期重复性任务上的表现会随时间拉开与「静态 agent」的差距
  • **三层记忆系统是反超的真正引擎**:短期/工作/长期分层记忆,让 agent 跨会话记住上下文、不重复犯错——这正好对上 arXiv 综述指出的「主动记忆」短板,也是它能在 OpenRouter 吞吐上压过 OpenClaw 的核心原因
  • **工程成熟度惊人(v0.13.0 单版 864 commits/295 贡献者)**:Kanban 式持久多 agent 任务板 + 心跳监控 + 僵尸检测 + 幻觉恢复,这些是把「演示 agent」变成「能托管长任务的生产 agent」的关键基础设施
💡 Hermes 反超 OpenClaw 这件事,对普通人最有价值的不是「换个工具」,而是一个判断方向:未来值钱的 agent 能力是「记忆 + 自改进」,不是「集成了多少 API」。它完全开源,等于把这套机制免费摊在你面前当教材——别只把它当助手用,去读它的三层记忆和自改进循环怎么实现的,这是当下最稀缺、最难被替代的能力。落地建议:如果你有一个长期重复的 AI 工作流(每天处理客服/文档/数据),用 Hermes 这类带记忆的 agent 跑,比用无状态的一问一答效果会持续变好;而理解「为什么带记忆的 agent 在赢」,本身就是你在 agent 时代的认知护城河。
Repo Infra
ht ht ht
NEW
#2 perplexityai/bumblebee ★ 4.4K ▲ +1,500/w
Perplexity 开源(Apache 2.0)、Go 零三方依赖编写的只读供应链扫描器:不执行任何可疑代码,直接读元数据与配置文件,覆盖 npm/pnpm/Yarn/Bun/PyPI/Go/RubyGems/Composer 及编辑器、浏览器扩展;并且是首个把 MCP 配置文件当作安全面来扫的开源工具
Bumblebee 是 Perplexity 于 2026 年 5 月开源的开发者终端供应链扫描器,目前约 4.4K 星,Apache 2.0 许可,用 Go 1.25 写成、零非标准库依赖。它的核心设计是「只读」:不调用包管理器、不执行任何安装脚本,而是直接检视原始元数据和配置文件,从根上避免「扫描时反被恶意安装脚本攻击」的风险。覆盖面很广——npm、pnpm、Yarn、Bun、PyPI、Go modules、RubyGems、Composer,以及编辑器扩展、浏览器扩展。但它最有前瞻性的一点是:第一个把 MCP 配置文件当成独立安全面来扫的开源工具。原因是 MCP 配置决定了你的 AI 助手能访问哪些外部服务——邮箱、数据库、日历、代码仓库;一旦攻击者把一个恶意 connector 塞进这份配置,你的 AI 助手就可能在后台泄露凭证或执行未授权命令。Bumblebee 提供 baseline/project/deep 三档扫描档位,分别对应日常巡检、项目目录聚焦、以及事件响应时的全盘扫描。它的出现正好踩在「agent 大规模普及、新攻击面随之打开」这个时间点上。
Key Points
  • **只读扫描,杜绝「扫描即中招」**:不调用包管理器、不跑安装脚本,只读元数据和配置文件——传统扫描可能在解析依赖时触发恶意脚本,Bumblebee 从架构上消除了这条风险路径
  • **首个把 MCP 配置当安全面来扫**:MCP 配置决定 AI 助手能碰哪些邮箱/数据库/代码仓库,是 agent 时代全新的攻击入口——Bumblebee 是第一个系统性检查这块的工具,填补了「agent 安全」的空白
  • **Go 零三方依赖 + Apache 2.0**:单一二进制、零外部依赖意味着可审计、可信、易在 CI 里集成;宽松许可让它能直接嵌入企业和个人的安全流程,几乎零接入成本
💡 Bumblebee 给普通人的直接行动项:你装 OpenClaw、Hermes 这类 agent,或给 Claude/Cursor 配 MCP 之前,先用它扫一遍——这是零成本的自保。更深一层的机会在于:「agent 安全」是一个刚刚打开、几乎没人占的细分赛道。当 57% 的组织已经把 agent 放进生产流程、MCP 在 Q2 成为新工具标配,「帮个人和小团队审计 agent/MCP 配置安全」会从今天的小众需求变成刚需。懂得用 Bumblebee 这类工具、能讲清楚 MCP 风险的人,无论是做咨询、做培训还是做配套小工具,都站在了一条上升曲线的起点上。
Repo AI App
ht ht ht
NEW
#3 openclaw/openclaw ★ 378K ▲ +1,700/w
跑在你自己设备上的开源个人 AI 助手(任意操作系统/平台):一个长驻 Node.js 服务,把 WhatsApp、Discord 等聊天平台接到一个能执行真实任务的 agent 上;曾在 60 天内超过 React 成为 GitHub 史上最多星的软件项目,现约 378K 星
OpenClaw 是 2025 年 11 月起步、2026 年初爆红的开源个人 AI 助手,现约 378K 星,曾在 60 天内超过 React 成为 GitHub 史上最多星的软件项目。它的形态是一个长驻 Node.js 服务 + 消息路由器:把 WhatsApp、Discord 等你日常用的聊天平台,连到一个跑在你自己机器上的 agent,让它替你执行真实世界的任务。它的爆发代表了 2026 年上半年「自托管、连接一切」这一派 agent 的巅峰。但本月的故事是它正在被「会学习」的一派超越:在 OpenRouter 日均 token 吞吐上被 Hermes Agent 反超,星速也从早期 +40,000/周的爆炸期回落到约 +1,700/周的成熟项目节奏。与此同时,正因为它能接管这么多个人数据和工具,安全质疑也随之而来(The New Stack 直接发问「它安全吗」)——这恰恰解释了为什么 Bumblebee 这类「扫 agent/MCP 配置」的工具会在同期出现。OpenClaw 仍是理解「个人 agent 平台长什么样」最好的样本,但它的相对降温也标志着竞争维度的迁移。
Key Points
  • **自托管、跑在你自己机器上**:不是云端 SaaS,而是长驻在本地的 Node.js 服务——数据主权在你手里,这是它能赢得隐私敏感用户、冲上 378K 星的核心吸引力
  • **把聊天软件变成 agent 入口**:通过 WhatsApp/Discord 等现成消息平台下达指令,agent 执行真实任务——「不用学新界面、在你已经用的 App 里指挥 AI」大幅降低了普通人的上手门槛
  • **从巅峰到被超越,标志竞争维度迁移**:星速从 +40,000/周回落到约 +1,700/周、OpenRouter 吞吐被 Hermes 反超——「连接一切」的故事正在让位给「会记忆、会自改进」的故事
💡 OpenClaw 这一年的抛物线对普通人是堂免费的趋势课:靠「连接一切 + 自托管」可以冲到史上最多星,但维持不住领先——因为用户最终要的不是「接了多少工具」,而是「这个助手用得越久越懂我」。给你的两条具体启示:一,如果你想要一个本地、可控的个人 AI 助手,OpenClaw 仍是上手成本最低的样本,值得装来理解 agent 怎么接管真实任务;二,更重要的是别把它当终点——它正在被会学习的 agent 超越,说明你该把注意力(和学习时间)放在「记忆 + 自改进」那一派上。顺带,它能碰你这么多个人数据,装之前用 Bumblebee 扫一遍配置是基本功。
Paper LLM/Model
ht ht ht
NEW
by ['综述团队(arXiv 2603.07670)']
这篇综述系统梳理了 2022 年至 2026 年初 LLM agent 记忆的设计、实现与评测,把散落各处的做法归纳成五大机制族:①上下文内压缩(context-resident compression);②检索增强存储(retrieval-augmented stores);③反思式自改进(reflective self-improvement);④分层虚拟上下文(hierarchical virtual context);⑤策略学习式管理(policy-learned management)。它最关键、也最被引用的发现是一个刺眼的对比:在 LoCoMo 这类「被动回忆」基准上接近满分的模型,一换到 MemoryArena 这种「记忆必须参与决策」的场景,分数直接掉到 40-60%。这条断崖揭示了一个被长上下文窗口掩盖的真相——把信息塞进上下文,和在正确时刻把正确的记忆调出来用,是两回事;今天 agent 的瓶颈是后者(主动、决策相关的记忆使用),而不是前者(能不能记住)。综述据此把「主动记忆」「记忆治理与安全」列为下一阶段的关键前沿。对照本周 Hermes Agent 靠三层记忆系统登顶、OpenClaw 相对降温,这篇论文相当于给「为什么会记忆的 agent 在赢」提供了学术注脚。
把「agent 记忆」从零散技巧整理成系统框架,并用 LoCoMo→MemoryArena 的断崖式掉分(近满分→40-60%)精准点出当前最大短板:模型不是记不住,而是不会在该用的时候把记忆调出来参与决策——这正是 Hermes 等会赢、OpenClaw 等会被超越的底层原因
Key Points
  • **LoCoMo→MemoryArena 断崖(近满分→40-60%)**:这是全篇最值钱的一个数字——它证明 agent 的记忆瓶颈不是「记不住」,而是「不会在决策时调用」,一举把行业注意力从「堆长上下文」拨向「主动记忆」
  • **五大记忆机制族的统一框架**:压缩/检索/反思/分层/策略学习,把零散技巧整理成可比较、可选型的地图——想给自己的 agent 加记忆的人,照着这张图选方案,少走半年弯路
  • **点名「记忆治理与安全」为新前沿**:记忆会被污染、被注入、被滥用——综述把记忆安全列为下阶段重点,正好与 Bumblebee 关注的「agent 攻击面」遥相呼应,提示这是个正在打开的方向
💡 这篇综述对普通人的实际价值,是把「agent 为什么有时候很笨」讲透了:不是模型不够强,是它不会在该用记忆的时候用记忆。理解这一点,你就能跳过 90% 的人对 AI 的误解。具体机会有两层:一,如果你在搭自己的 agent/工作流,照着五大机制族选一套记忆方案(多数人用「检索增强存储」起步就够),效果立刻和无记忆版本拉开差距;二,「agent 记忆」是个还很年轻、需求在爆发的方向——能讲清楚 LoCoMo 与 MemoryArena 区别、能帮人把记忆做对的人,正卡在一条上升赛道的早期。读论文不是学者的专利,这一篇值得普通建设者花一个下午精读。
Article 小微现金流
ht ht ht
NEW
by Hasaam Bhatti(Launch Fast 创始人,Indie Hackers)
Hasaam Bhatti 是一位没有 CS 学位、从没写过一行代码的创始人。他白天做着公司职位、业余经营两个亚马逊品牌,在 Twitter 上刷到 Cursor 后开始用 AI 写代码。他花了 20-30 小时研究产品点子,对其中一个手动、繁琐的流程极度不耐烦,于是干脆用 AI 把「自己需要的那个工具」做了出来——前后只用了 48 小时搭出可用产品。真正难的从来不是做产品,而是分销:零受众等于零客户。他的破局点是两年前买过的一个名叫 Legacy X 的教练课程——那里面有数千名活跃的卖家,本来就在找趁手的工具。他把这群人当成现成分销渠道,带着产品直接进场,30 天做到 $10K MRR,几个月后 Launch Fast 做到 $30K MRR。这个案例的全部锋利之处在于:它把「普通人用 AI 挣钱」的瓶颈从「技术」彻底挪到了「分销」——AI 已经把做出 MVP 的时间从几周压到几天,真正稀缺的是「你手里有没有一群已经在为某个问题付钱、且信任你的人」。
Key Points
  • **先有渠道,再有产品**:他不是做完产品再找用户,而是先盯住一个自己已经能触达的现成群体(Legacy X 课程里数千名活跃卖家),再用 AI 把他们需要的工具做出来——顺序反过来,成交速度天差地别
  • **48 小时 MVP + 不写代码**:用 Cursor 这类 AI 编程工具,非技术背景者把「做出可用产品」的时间压到 48 小时——技术门槛已经基本消失,这不再是不做的借口
  • **$10K MRR/30 天 → $30K MRR**:增长曲线的陡峭程度,几乎全部归功于「一开始就有分销」——同样的产品没有渠道,大概率卡在 median 的 $1K/月以下
💡 这个案例对想用 AI 挣现金流的普通人,是一剂解毒针:别再纠结「该用哪个模型、哪个 API」,那是已经被 AI 解决掉的部分。真正决定你能不能从 $0 走到 $1K、$10K MRR 的,是一个老问题——你能不能先够到一群已经在为某个具体问题花钱、并且愿意听你说话的人。可复制的动作:①盘点你已经能触达的群体(你所在的行业社群、你买过的课程/会员、你的客户名单);②找出他们日常手动、繁琐、肯付费解决的某个小痛点;③用 Cursor/Claude Code 在几天内把工具做出来,直接卖给这群人。先有渠道、再有产品,是 2026 年最被低估、却最可复制的现金流路径。
My Take 评分(5=最优):最快成交 4 / 最低成本 4 / 可复制 4 / 风险安全度 4。「先渠道后产品」的非技术 AI 变现路径:AI 已抹平技术门槛,成败几乎全压在「你手里有没有现成可触达的付费人群」上,有渠道的人极快、没渠道的人要先补这一课