今天trending的三个repo——ECC、hermes-agent、karpathy-skills——揭示了同一方向:开发者正在把AI agent从「聊天工具」打磨成「可配置同事」;Anthropic同步发布企业生态和Mythos安全测试两大信号。
今天的信号:「配置AI员工」比「使用AI工具」更值钱
今天trending的三个repo——ECC(249个技能包)、hermes-agent(越用越懂你)、karpathy-skills(4条行为准则)——做的是同一件事:把AI agent从被动响应的工具,变成主动学习的可培养系统。ECC给Claude Code装上技能库和记忆层,hermes-agent让AI跨会话记住你的项目和偏好,karpathy-skills则用Karpathy的观察结晶出「别猜测、别过度设计、别乱改代码」的行为约束。这不是在用AI,这是在「培训AI员工」。 Anthopic今天同步发出两个企业信号:Claude Partner Network正式分级(Select/Preferred/Global Premier),说明AI咨询服务市场开始规范化,10万+申请中4万家已入选;Claude Mythos扩展到150个机构、15国关键基础设施,自4月起已发现10,000+严重安全漏洞——这说明AI的代码分析能力已经超过绝大多数人类安全研究员。ERL论文则从学术层面确认:agent可以从经验中提炼启发式规则,成功率持续提升。 对个人来说,这三个趋势合在一起指向同一个机会:**会「给AI配置行为规范和技能工作流」的人,正在成为最稀缺的人才**。ECC和karpathy-skills爆红,恰恰因为它们解决了「AI能干但不听话」的核心问题。如果你能在某个垂直行业里——法律、财务、医疗、制造——把你的领域know-how变成agent的技能配置和约束规则,这就是你在AI时代真正的护城河。
Type
Track
Source
Repo DevTools
GH
NEW
#1 affaan-m/ECC ★ 206K ▲ +12,000/w
AI agent多平台技能库与性能优化系统
不只是配置文件,而是一套完整的agent增强系统:63个专用agent、249个可复用技能、79个命令实现,覆盖代码审查、安全扫描、测试、部署等完整工作流。支持Claude Code、Codex、Cursor、Gemini等7+平台。
Key Points
  • **规模惊人**:249个公开技能包跨越编码/研究/安全/企业运营等领域,2月Cerebral Valley x Anthropic黑客马拉松一等奖
  • **跨平台统一**:同一套技能库在Claude Code、Cursor、OpenCode等7+平台通用,不绑定单一厂商
  • **工程级质量**:1282个测试、98%覆盖率、102条静态分析规则,是真正生产可用的agent配置系统
💡 ECC的爆红揭示了一个新职业:「Agent配置工程师」。249个技能包中最受欢迎的不是写代码,而是代码审查、安全扫描、架构分析——这些恰恰是需要深度领域知识才能写好规则的地方。如果你在某个行业有积累,把你的判断标准翻译成agent skill,就是别人花钱雇不走的能力。
Repo AI Agent
GH TS
2d streak
#2 NousResearch/hermes-agent ★ 179K ▲ +3,800/w
有持久记忆和自学习能力的开源个人AI agent
一个真正「越用越懂你」的AI agent:自动从历史对话中提炼技能、跨会话保留项目上下文、用Telegram/Discord/Slack/WhatsApp等多渠道接入。支持200+模型供应商,零厂商锁定。最新版v2026.5.29,过去30天发布62个版本。
Key Points
  • **持久记忆**:不只记住你说了什么,而是主动提炼出「解决方案模式」——下次类似问题自动调用
  • **多端接入**:Terminal、Telegram、Discord、WhatsApp、Signal、Email均可驱动,真正的「无处不在的AI同事」
  • **模型无锁定**:Nous Portal、OpenRouter 200+模型、本地Ollama均支持,随时切换不改代码
💡 hermes-agent代表了AI agent的下一阶段:从「单次对话工具」变成「长期学习伙伴」。对个人的机会:最先学会「训练」自己专属agent的人(给它输入你的工作流程、行业知识、个人偏好),会在效率上比普通用户拉开代差。这不是使用技巧,是一种新的「人机协作资产」。
Repo DevTools
GH X
NEW
#3 multica-ai/andrej-karpathy-skills ★ 167K ▲ +2,500/w
基于Karpathy观察的CLAUDE.md行为准则文件
一个单独的CLAUDE.md文件,把Andrej Karpathy对LLM编程失误的观察提炼成4条行为准则:明确假设、简单优先、外科手术式修改、目标驱动执行。两个镜像账号合计220K星,已成为AI编程配置的事实标准之一。
Key Points
  • **来源权威**:Karpathy(OpenAI联创、Tesla AI前总监)的亲身观察 → Forrest Chang将其翻译成可执行规则
  • **四条黄金准则**:先说假设再写代码、只解决被要求的问题、只改需要改的、把任务转化成可验证的成功标准
  • **病毒式扩散**:从一个CLAUDE.md文件到220K颗星,证明「给AI设定行为边界」是开发者的真实痛点
💡 karpathy-skills的成功证明:你不需要写一行新代码,只需要把「如何与AI合作不踩坑」的经验结构化,就能产生巨大价值。这对每个行业都成立——把你领域里「AI最容易犯哪些错」整理成约束规则,就是一个有潜力的开源项目或咨询产品。
Article AI App
An Te Ya
NEW
by Anthropic
Anthropic发布Claude Partner Network服务轨道(Services Track)和合作伙伴中心(Partner Hub)。三级认证体系:Select(10名认证从业者+2个生产部署)、Preferred(100名认证+15个客户)、Global Premier(1000名认证+100个客户+3大洲覆盖)。自3月以来已有4万家企业申请、1万名顾问获得认证。
Key Points
  • **市场信号**:企业AI咨询服务已经大到需要认证分级——这意味着有资格的AI实施顾问正在成为稀缺资源
  • **具体门槛**:最低门槛(Select级)只需10名认证人员+2个生产部署——对小型咨询团队可操作
  • **生态闭环**:合作伙伴在Hub里可被企业客户搜索到,相当于Anthropic为认证顾问建了一个「官方市场」
💡 这个Partner Network的建立,直接创造了一批新的就业机会:企业AI实施顾问。如果你能拿到Claude认证、积累2-3个生产部署案例,就符合入门级门槛,可以被企业客户通过官方Hub找到。AI时代的「资质认证」正在从个人技能转移到可验证的交付记录,这是一个传统咨询行业改造自身的窗口。
Article LLM/Model
An Te CN Da
NEW
by Anthropic
Anthropic将Project Glasswing(Claude Mythos Preview用于关键基础设施安全审计)扩展到150个新机构、15+国家,覆盖电力、水务、医疗、通信和硬件行业。自4月上线以来已发现10,000+严重漏洞。Anthropic预计6-12个月内其他公司也将拥有同等能力的模型。
Key Points
  • **能力突破**:Claude Mythos在漏洞挖掘上已超越「最顶尖的人类安全研究员之外的所有人」——这是AI能力的里程碑
  • **规模验证**:4月至今10,000+严重漏洞,平均相当于每天发现100+个,人类团队不可能达到这个速度
  • **窗口警告**:Anthropic明确表示6-12个月内其他公司也会有同级别模型,且可能没有同等安全约束
💡 AI安全能力超越人类,对个人来说有两层机会:一是「AI辅助安全测试」会成为中小企业可负担的服务,懂得如何配置和引导此类工具的安全顾问需求暴增;二是IT基础设施领域的人员应该意识到,过去「足够难以被攻击」的系统现在对AI来说可能不再安全,系统修复和加固的需求将持续增长。
Paper AI Agent
arXiv Hu IC
NEW
by Marc-Antoine Allard et al.
提出Experiential Reflective Learning(ERL)框架:agent执行任务后反思轨迹、提炼启发式规则(heuristics),下次遇到类似任务时检索相关规则注入上下文。在Gaia2基准上比ReAct基线提升7.8%,且启发式规则比少样本轨迹提示更易跨任务迁移。
提出ERL框架让LLM agent从任务轨迹中提炼可迁移启发式规则,在Gaia2基准上成功率提升7.8%
Key Points
  • **核心创新**:不是靠微调模型,而是在推理时动态注入经验提炼出的规则——部署成本极低
  • **实验验证**:Gaia2基准7.8%提升,关键发现是「选择性检索」必不可少,全量注入反而有害
  • **工程意义**:原理和hermes-agent的「技能挖掘」高度吻合,说明「从失败中学习」正成为agent标准组件
💡 ERL的思路对工程实践有直接指导意义:与其训练更大的模型,不如让现有模型「记录自己做错了什么」并提炼成规则。对个人来说,你现在就能用这个原理手动建立自己的「agent错误笔记」——把AI在你领域犯的典型错误记录下来,整理成规则喂回给它,效果会持续改善。这不需要PhD,需要的是领域知识和耐心。
Thread AI Agent
DE RD
NEW
DEV Community / Reddit
开发者社区对比两个爆款开源agent运行时:OpenClaw(210K星,快速从9K飙升)和hermes-agent(174K星,周增长3800颗且在加速)。核心争论在于两者定位不同——OpenClaw侧重「速度和轻量」,hermes更强调「记忆和自学习」。
hermes-agent的周增长速度已经反超OpenClaw,但总星数落后——说明后者起步晚但势头更强
实际用起来差异明显:OpenClaw适合搭建对话管线,hermes适合需要「跨会话上下文」的个人助手场景
两者都支持本地模型(Ollama),这才是关键——不依赖API就能跑意味着成本可以趋近于零
💡 这场争论背后是一个更大的问题:agent运行时会不会像操作系统一样winner-take-most?目前来看还没有定论,但社区倾向认为「记忆能力」会是长期差异化关键——毕竟用了一年的agent和只用一天的agent,能提供的价值截然不同。如果你要选一个长期投入学习的运行时,选择「越用越懂你」的那个。
Hall of Fame
#1buildpipe4d
#2chopratejas/headroom4d
#3Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward2d
#4CopilotKit/CopilotKit2d
#5NVIDIA/cosmos2d
#6NousResearch/hermes-agent2d
#7Project Vend Phase 2:AI agent可以独立运营真实商业了2d
#8RyanCodrai/turbovec2d
#9The End of Software Engineering: How AI Agents Are Fundamentally Restructuring the Software Paradigm2d
#10lfnovo/open-notebook2d