hermes-agent以185K星成为最受关注的「会自我进化的AI agent」;turbovec以单日1533星成为今日最快上升项目,用Rust重新定义RAG向量索引;O'Reilly和Fortune同时宣判tokenmaxxing时代终结——今日信号是:AI基础设施在向「精准、高效、自学习」快速演化,投入越多token不等于产出越高。
今天的信号:AI基础设施升级,「堆token」时代宣告终结
今天最值得关注的不是某个新模型,而是三个同时出现的信号共同指向一个转折点。第一,NousResearch的hermes-agent以185K星证明:一个会「自己写技能、自己优化技能、跨会话不忘记」的agent已经不是概念——这是真实可用的开源系统,它把agent从「每次对话重新出发」变成了「持续成长的合作伙伴」。同一天,mvanhorn的last30days-skill展示了这个生态的另一面:任何人都可以把自己的专业知识打包成一个agent技能,在10分钟内让Claude Code学会在Reddit、X、YouTube、HN上独立做研究。 第二,基础设施层的技术在同步成熟。turbovec用Rust重写了向量索引,基于Google的TurboQuant算法,pip install一行命令、不需要训练步骤,就能跑出比FAISS更快的结果——这让RAG应用的部署门槛从「需要ML工程师调参」降到了「普通开发者可以直接用」。microsoft/pg_durable则把「持久化工作流执行」塞进PostgreSQL扩展,不再需要Temporal或Redis这样的独立服务——对于想用AI agent自动化业务流程但不想引入复杂基础设施的团队,这是一个实质性的简化。 第三,O'Reilly Radar和Fortune在同一周发出同一个信号:tokenmaxxing时代正式结束。Amazon员工为了维持token使用量统计而运行无意义的agent任务,Uber在2026年前四个月就烧完了全年token预算,Microsoft取消了部分产品团队的Claude Code订阅——堆token不等于产出,这一点开始被CEO级别的管理者意识到。这对个人意味着:能建立「有节制、有目的、高产出」AI工作流的人,才是真正会被持续重用的技术人才——而不是会跑最多token的人。
Type
Track
Source
Repo AI Agent
GH OI
2d streak
#1 NousResearch/hermes-agent ★ 185.9K ▲ +7,800/w
自学习AI agent框架,跨会话持久记忆+自主写入和优化可复用技能,运行时与你一起成长
NousResearch于2026年2月发布hermes-agent,核心差异化在于三个机制的组合:跨会话持久记忆(存储用户提到的人、项目、决策,下次对话自动恢复上下文)、自主技能创建(agent把重复执行的任务轨迹提炼成可复用代码技能,存入本地技能库)、后台异步执行(sleep模式仍可运行定时任务)。v0.12.0引入Curator——一个每7天自动对技能库进行评分、合并重复、淘汰低质技能的自动管理进程。支持Telegram、Discord、Slack、WhatsApp、Signal、CLI六种接入方式,从单一gateway进程统一管理。48小时内达7K星,4个月内积累185K星,成为2026年增长最快的开源AI agent框架之一。
Key Points
  • **持久记忆无需配置**:对话历史、用户偏好、项目信息自动跨会话保留——解决了Claude Code、Cursor等工具「每次对话都从零开始」的最大痛点
  • **技能自我进化**:v0.12.0的Curator进程每7天自动评分、合并、淘汰技能库条目,agent的能力随使用时间持续提升,不需要人工维护
  • **多平台统一**:Telegram/Discord/Slack/WhatsApp/Signal/CLI通过单一gateway接入,跨平台对话历史和context完全打通
💡 hermes-agent代表的机会是「把你的专业知识转化为agent的持久技能」。如果你在某个领域有深度积累(行业研究、法律条款、产品文档),可以通过日常使用hermes-agent的过程让它逐步「学会」你的工作方式。6个月后,你会拥有一个真正熟悉你工作上下文的agent助手,而其他人还在每次对话中重新解释背景。这是一种无声的、随时间复利积累的个人竞争优势。
Repo AI Agent
GH
2d streak
#2 mvanhorn/last30days-skill ★ 30.8K ▲ +7,700/w
Claude Code技能包:让agent自主在Reddit、X、YouTube、HN、Polymarket和全网研究任何主题并生成有引用的综合摘要
last30days-skill是一个Claude Code agent技能,安装后直接调用slash命令,agent会自动在Reddit、X、YouTube、HN、Polymarket、通用网络搜索中研究指定主题的过去30天内容,合并去重信号,输出带来源引用的中文或英文综合摘要。底层使用WebSearch、yt-dlp字幕提取、Reddit API、HN Algolia API的组合,全程在agent内部执行,无需用户介入中间步骤。2026年1月创建,3月起爆发式增长,当前30,771星,今日新增1,097星。
Key Points
  • **零介入研究**:一条slash命令触发多平台并行搜索,agent自行判断哪些来源权威、哪些信号重复,输出综合结论而非原始链接堆砌
  • **多平台覆盖**:Reddit(社区讨论)+ X(即时观点)+ YouTube(视频字幕)+ HN(开发者视角)+ Polymarket(市场预期)五维覆盖,避免单一平台信息偏差
  • **可组合**:作为技能模块可与hermes-agent、OpenClaw等框架集成,成为更大agent工作流的研究子任务节点
💡 last30days-skill展示了一个被低估的能力:把「研究能力」打包成agent技能,意味着任何人都可以在自己专业领域复制这个模式。如果你是医疗、法律、金融、教育领域的从业者,可以在这个技能框架基础上定制专属数据源(医学数据库、法律文书、行业报告),制作出通用工具没有的垂直领域研究agent——这种定制化技能是极难被通用工具替代的个人护城河。
Repo Infra
GH Ma
2d streak
#3 RyanCodrai/turbovec ★ 7.1K ▲ +5,800/w
基于Google TurboQuant算法的Rust向量索引库,Python可用,无需训练步骤,比FAISS快12-20%
turbovec是一个用Rust编写、提供Python绑定的向量索引库,底层使用Google Research在ICLR 2026发表的TurboQuant算法——一种无需码本训练、在数学上接近Shannon下界失真率的向量量化器。核心优势:pip install turbovec一行安装;不需要单独的训练阶段,直接add向量即可实时检索;ARM的手写NEON内核和x86的AVX-512BW内核让性能比FAISS IndexPQFastScan快12-20%(ARM)或持平(x86)。2026年3月创建,5月起进入GitHub热榜,今日以1,533新星成为当日增速最快的项目。
Key Points
  • **无训练阶段**:传统向量量化需要先用大量样本训练码本,turbovec基于TurboQuant的data-oblivious特性完全跳过这一步——corpus随时增长、无需重建索引
  • **一行安装**:pip install turbovec,MIT许可,Python 3.8+兼容,无需CUDA或GPU——个人开发者和小团队可以在普通服务器上运行
  • **性能超越FAISS**:ARM架构下比FAISS IndexPQFastScan快12-20%,x86下持平甚至更优,在内存占用上也有明显优势
💡 turbovec的出现降低了「生产级RAG」的门槛。过去,优化向量检索性能需要ML工程师手工调参FAISS的训练过程;现在,一个普通开发者可以用turbovec在几分钟内搭起性能不亚于企业级方案的向量索引。对个人的机会:如果你在构建RAG应用(文档问答、代码搜索、客服知识库),把技术栈从FAISS升级到turbovec,不需要额外学习成本,但可以向客户展示「更优的基础设施选型」——这是一个低成本提升技术说服力的机会。
Repo Infra
GH HN
NEW
#4 microsoft/pg_durable ★ 1.4K ▲ +1,200/w
PostgreSQL扩展,在数据库内部实现持久化工作流执行,无需Temporal、Redis等外部服务
pg_durable是Microsoft发布的PostgreSQL扩展(用pgrx构建),把持久化工作流执行(durable execution)的能力直接嵌入PostgreSQL,无需引入Temporal、Inngest、Trigger.dev等独立编排服务。核心原理:pg_durable函数是一张SQL步骤构成的有向图,PostgreSQL在执行过程中自动打checkpoint;崩溃或失败时,从最近checkpoint恢复,而不需要重头重跑。底层由两个Rust库支撑:duroxide(确定性回放、子编排、timer)和duroxide-pg(PostgreSQL state backend)。提供调度、条件判断、并行执行三类原语作为SQL DSL。目前为preview状态,提供PostgreSQL 17/18的Debian包。
Key Points
  • **零基础设施增量**:对已经在用PostgreSQL的团队来说,不需要新增任何服务就能获得生产级工作流持久化能力——消除了「为了一个agent workflow引入整套Temporal的复杂度」的痛点
  • **故障自动恢复**:数据库崩溃、步骤失败、网络中断后自动从最近checkpoint继续执行,不需要业务代码实现补偿逻辑
  • **SQL原生**:工作流定义是SQL,不是YAML或外部DSL——已有PostgreSQL技能的开发者无需学习新范式,agent的持久化状态和业务数据在同一个数据库中
💡 pg_durable解决的是AI agent落地中一个很现实的问题:agent任务通常跨越多步、可能中断,如何保证「断了能续」。Temporal等方案功能完整但引入了巨大的运维复杂度;pg_durable把这个能力压缩进一个PostgreSQL扩展,让个人开发者和小团队也能为agent工作流提供企业级可靠性保障。如果你正在构建涉及多步骤、需要可靠执行的AI自动化系统(订单处理、内容生成管道、数据同步),这是值得评估的基础设施简化方案。
Article AI Agent
Te
NEW
by Mike Loukides(O'Reilly Media VP of Content)
O'Reilly六月技术雷达聚焦三个关键转变:一、tokenmaxxing时代终结——agent可以让生产率飙升,但也可以以惊人速度消耗token,企业开始意识到token用量不是生产力的代理指标;二、MCP协议重大更新,候选版本计划7月28日发布,核心变化是将MCP改为无状态协议、对接OAuth/OpenID授权标准;三、agent从「执行任务」进化为「运营业务」,Cloudflare+Stripe联合agent已可自主开账户、注册域名、部署应用,并内置机器对机器支付协议。
Key Points
  • **tokenmaxxing终结**:O'Reilly明确指出衡量AI生产力应看工作质量而非token消耗量——高效团队会按任务选择最低成本模型,而不是默认用最贵的
  • **MCP无状态化**:Agentic AI Foundation计划的MCP更新将把协议改为无状态,并对接OAuth/OpenID——这意味着agent间的授权管理将向现有web安全标准靠拢,降低企业合规难度
  • **agent进入运营层**:Cloudflare+Stripe联合agent和iWallet的机器对机器支付协议,证明agent不再只是「执行任务的工具」,而是可以独立运营商业流程的自主系统
💡 O'Reilly雷达的价值在于它是技术选型的提前量——通常比实际大规模采用早6-18个月。MCP无状态化是一个值得现在关注的信号:当MCP对接OAuth/OpenID标准后,企业里懂agent授权架构的人会成为内部稀缺资源。不需要等到协议发布,现在开始理解OAuth/OpenID和MCP的交叉点,就是在建立一个未来6个月内会升值的技术判断力。
Paper AI Agent
arXiv Hu
NEW
by Chenyu Zhou, Huacan Chai, Wenteng Chen 等21位作者(arXiv 2604.08224,2026年4月10日)
论文核心论点:现代LLM agent的构建逻辑已从「修改模型权重」转向「重组模型运行时环境」。过去需要模型内部处理的能力,现在被「外化」为四类基础设施:记忆存储(跨时间状态外化)、可复用技能(程序性专长外化)、交互协议(交互结构外化)和harness工程(协调上述三者成为可治理执行的统一层)。论文引入「认知工具」概念作为理论框架,论证agent基础设施不只是辅助组件,而是把模型难以可靠内部解决的认知负担转化为可以更可靠处理的外部形式。
首篇从「认知外化」视角系统梳理agent基础设施四大支柱的综述论文,提供了理解2026年agent生态爆发的统一理论框架
Key Points
  • **四支柱框架**:记忆、技能、协议、harness工程——这四个维度覆盖了当前agent基础设施的所有主要争论,为混乱的「agent工程」讨论提供清晰边界
  • **解释爆发原因**:从理论角度说明了为什么hermes-agent(记忆+技能)、last30days-skill(技能外化)、MCP(协议标准化)在2026年同时爆发——这是同一个更大趋势的不同切面
  • **harness作为统一层**:提出harness工程(编排、监控、权限治理)是把记忆/技能/协议「粘合」成可靠生产系统的核心——这是当前最缺乏工具和方法论支持的领域
💡 这篇论文提供了一个实用的「自我定位框架」:你在agent生态中的哪一层投入最多?记忆层(数据工程、持久化)、技能层(workflow自动化、领域专长打包)、协议层(MCP集成、agent间通信)还是harness层(编排、监控、权限)?harness层目前工具最少、理论最弱、但需求最紧迫——如果你在企业里部署agent,这是最容易建立深度差异化的技术领域,也是论文明确指出最需要研究的空白。
Opinion AI App
RD X Te
NEW
#7 Jeremy Kahn Fortune AI编辑,Eye on AI Newsletter作者
「tokenmaxxing时代已经结束。Amazon员工为维持token使用量统计而运行毫无意义的agent任务,Uber前四个月烧完了全年token预算,Microsoft取消了部分产品团队的Claude Code订阅——堆token不等于产出,CEO们终于意识到了这一点。」
Jeremy Kahn在Fortune报道了企业AI部署的「token账单冲击」现象:2025-2026年间,大量企业以token消耗量作为AI生产力的代理指标(称为tokenmaxxing),结果导致员工为了数字好看而运行无意义任务,实际业务产出并未对应提升。现在这一趋势正在逆转——企业开始限制哪些员工可以使用高级AI模型,强制按任务选择最低成本的合适模型,衡量标准回归「工作质量」而非「token数量」。同期发布的Azeem Azhar(Exponential View)分析将其定性为通用技术的「生产力J曲线」——先下降、再回升,这是历史上每次重大技术采用的普遍规律。
💡 tokenmaxxing终结的信号对个人有双重含义:第一,那些能用更少token、更有目的性地完成高质量工作的人,将在团队中获得更高可信度——因为他们的产出看得见摸得着,不需要靠token数字证明自己在「努力用AI」。第二,「AI成本工程」正在成为企业真实需求——懂得如何设计token高效的agent workflow、选择合适模型分级调用的人,是当前最稀缺的AI工程技能之一。这不是在逆潮流,而是在顺应下一个周期的企业采购优先级。
Hall of Fame
#1buildpipe4d
#2chopratejas/headroom4d
#3Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward2d
#4CopilotKit/CopilotKit2d
#5NVIDIA/cosmos2d
#6NousResearch/hermes-agent2d
#7Project Vend Phase 2:AI agent可以独立运营真实商业了2d
#8RyanCodrai/turbovec2d
#9The End of Software Engineering: How AI Agents Are Fundamentally Restructuring the Software Paradigm2d
#10lfnovo/open-notebook2d