今日GitHub趋势被「skills」全面占领——obra/superpowers(223.5K星,+1,205今日)、addyosmani/agent-skills(51.6K星)、phuryn/pm-skills、google/skills同天登榜,skills正在成为AI代理时代的npm;harry0703/MoneyPrinterTurbo(85K星,+1,471今日)重返趋势,AI一键短视频批量变现需求持续旺盛;H Company发布Holo3.1(74.2% OS-World准确率、140ms延迟、12GB VRAM可本地运行),桌面控制agent进入消费级硬件门槛;今日信号:agent能力竞争从「选哪个模型」正式转向「装哪些技能」。
今天的信号:Skills正在成为AI时代的npm,你的agent装了什么?
今天GitHub Trending页面出现了一个高度集中的信号:多个「skills」仓库同天上榜——obra/superpowers(223.5K星,今日+1,205)、addyosmani/agent-skills(51.6K星,今日+781)、phuryn/pm-skills、google/skills、mvanhorn/last30days-skill——五个项目在同一天同时进入视野。这不是随机现象,而是一个正在发生的生态位迁移:AI代理竞争的核心维度,正在从「用哪个底层模型」转向「你的agent安装了什么技能包」。历史上,npm出现之前开发者手写所有工具函数;2026年,「技能包」正在扮演同样的角色——只不过从前是代码模块,现在是「agent行为规范」。obra/superpowers(Jesse Vincent开发)提供了完整的TDD驱动方法论:设计前先明确需求、强制RED-GREEN-REFACTOR循环、subagent并行执行。addyosmani/agent-skills(Chrome DevTools工程师Addy Osmani出品)则把23个生产级工程技能打包,编码了Google工程文化的具体原则。Google自己也在发布google/skills——官方机构开始为agent建立「官方技能集」,标准化程度正在快速提高。 lsdefine/GenericAgent(12.8K星)给出了另一种哲学的答案:与其预装人类设计的技能包,不如让agent在完成真实任务时自己进化出技能树,每次成功完成新任务就把执行路径结晶为可复用技能,下次遇到相似任务时直接调用——token消耗比同类agent少6倍。两条路并行出现在今天的趋势榜:「可安装的人工设计技能库」vs「agent自我进化的活的技能树」。这不是简单的技术选择,而是对「AI代理的本质是工具还是自主体」这个更深问题的不同回答。对于普通人,现在就可以行动的是:把obra/superpowers或addyosmani/agent-skills装入你正在使用的Claude Code或Cursor,你的coding agent工作质量会立刻上一个台阶——这是成本最低、见效最快的agent能力升级方式。 与此同时,H Company在Hugging Face发布的Holo3.1让「本地桌面控制agent」进入消费级门槛:74.2%的OS-World基准成功率,140ms操作延迟,最小12GB VRAM即可运行。这意味着一台消费级GPU就可以在本地运行一个能操控屏幕、完成任意GUI任务的AI代理——不需要云端API、不泄露数据、不付持续API费用。技能生态成熟 + 本地计算机控制能力可及,两个趋势同时到位:普通人自行组装、自行运行、自主可控的AI代理系统,第一次在技术和成本上同时变得现实。
Type
Track
Source
Repo AI Agent
GH
2d streak
#1 obra/superpowers ★ 223.5K ▲ +1,205/w
AI编程代理的完整开发方法论与技能框架:TDD驱动、设计优先、subagent并行执行,15+可复用技能覆盖测试/调试/协作全链路,适配Claude Code、Codex、Cursor、Gemini CLI等主流代理平台
superpowers是Jesse Vincent(Prime Radiant)构建的agentic软件开发方法论框架,核心理念是用一套可安装的技能包让AI代理按照「人类顶级工程师才会遵循的工作流」写代码。区别于仅提供prompt的框架,superpowers强制实施三个关键纪律:①设计前通过结构化追问明确需求,以「可消化的小块」呈现设计供验证;②强制TDD循环(RED-GREEN-REFACTOR),测试在实现前必须失败再变绿;③subagent驱动,每个任务分发给全新子代理,两阶段审查(规格合规+代码质量)。15+技能库覆盖测试、调试、meta任务和协作工作流,兼容Claude Code、Codex CLI、Cursor、Gemini CLI、GitHub Copilot CLI等所有主流平台。19,872 forks,850 watchers,Discord社区活跃。总星数223.5K,今日+1,205,与addyosmani/agent-skills、phuryn/pm-skills、google/skills同天登上GitHub趋势榜,是skills生态系统化的最强信号之一。
Key Points
  • **强制TDD不可绕过**:superpowers不建议TDD,它强制执行——RED-GREEN-REFACTOR循环是工作流中的硬性检查点,agent不能在测试失败时声明成功,消除AI代理「自我批准」的核心问题
  • **设计优先于代码**:每个任务开始前,agent通过结构化追问明确需求,先提交设计方案等待人工确认,再开始编码——把「写之前先想清楚」这一顶级工程师习惯内化为工作流约束
  • **全平台通用无锁定**:一套技能库适配Claude Code、Cursor、Gemini CLI、Codex、Copilot六个主流平台——更换coding agent时已积累的工作流规范可以直接迁移,不被单一平台绑定
💡 superpowers把「高级工程师对AI代理的使用方式」打包成了可以直接安装的技能集合。如果你在用Claude Code或Cursor写代码却时常对AI输出质量感到不满,问题很可能不是模型不够好,而是缺少「约束AI工作流的结构」——superpowers就是这个结构。安装它之后,你的coding agent会在写代码之前先明确需求、先写测试、先提交设计等待确认,而不是直接生成一堆可能走错方向的代码。这是让AI输出「值得信任」而非「需要反复纠错」的工程方法论,也是223K星背后真实的价值:它不是在卖AI功能,而是在卖「AI时代的工程纪律」。
Repo AI Agent
GH
NEW
#2 addyosmani/agent-skills ★ 51.6K ▲ +781/w
Chrome DevTools工程师Addy Osmani出品的23个生产级工程技能:覆盖spec/plan/build/test/review/ship全链路,编码了Google工程文化(Hyrum定律、Beyonce规则、主干开发),适配Claude Code/Cursor/Gemini CLI等6+平台
addyosmani/agent-skills由Google Chrome DevTools高级工程师Addy Osmani创建,将他在Google工程实践中积累的「资深工程师才会遵循的工作规范」编码为23个可安装的AI代理技能。7个核心命令(/spec、/plan、/build、/test、/review、/code-simplify、/ship)覆盖从需求到上线的全开发生命周期,每个技能包含逐步工作流、反合理化表(应对常见走捷径借口)、红旗警示和验证要求。技能中融入了Google工程文化的具体原则:Hyrum定律(所有可观测行为都会被人依赖)、Beyonce规则(若你改动破坏了测试,你需要知道)、主干开发(避免长存活分支)。设计上是「过程,不是散文」——每个技能是step-by-step工作流,不是建议性描述。兼容Claude Code(推荐)、Cursor、Gemini CLI、Windsurf、OpenCode、GitHub Copilot六个平台。51.6K总星,5,696 forks,今日+781星。
Key Points
  • **Google工程文化的直接移植**:技能中包含Hyrum定律、Beyonce规则等具体Google工程原则——不是抽象建议,而是操作化为agent在执行每一步时的具体检查行为,这是其他skills包难以复制的来源权威性
  • **反合理化(anti-rationalization)设计**:每个技能专门设计了「反合理化表」,列出AI代理最常用来跳过关键步骤的借口及应对方式——这是对AI代理「找借口规避流程」这一实际问题的精准应对
  • **/ship命令端到端发布清单**:从git工作流到CI/CD到弃用管理到文档到上线检查,/ship把「上线」这件事变成有明确完成标准的可验证流程,而不是「写完了就推送」
💡 addyosmani/agent-skills最实际的应用:如果你在构建一个需要稳定输出质量的AI辅助开发工作流,把这套技能装入Claude Code或Cursor,你的coding agent就会自动遵循Google级别的工程标准——需求明确前不动手、测试覆盖前不上线、代码审查前不合并。对于独立开发者,最有价值的是/spec和/review两个技能:/spec让agent在写代码之前先输出一份结构化设计文档(保存成「决策记录」);/review把代码质量、安全性、性能优化包装成一次系统性审查。这两步是大多数独立开发者最容易省略、也最容易在后期付出代价的环节——现在有了可以强制执行的技能包,不执行才是主动放弃竞争优势。
Repo AI Agent
GH arXiv
NEW
#3 lsdefine/GenericAgent ★ 12.8K ▲ +约200/w
3.3K行种子代码孵化的自进化agent:9个原子工具授予LLM完整系统控制权(浏览器/终端/文件系统/键鼠/屏幕视觉/手机ADB),每完成一个新任务自动将执行路径结晶为可复用技能,比同类agent少消耗6倍token
GenericAgent由lsdefine(复旦大学)开发,设计哲学与当日其他trending skills框架截然相反:不预装技能,让agent在完成真实任务的过程中自己进化出属于自己的技能树。核心:9个原子工具(浏览器、终端、文件系统、键盘鼠标输入、屏幕视觉、手机ADB等)构成基础工具集,agent通过约100行Agent Loop获得对本地计算机的系统级控制权。自进化机制:每次成功完成新任务,系统自动将执行路径结晶为技能存入私人技能库,下次遇到相似任务时直接调用而不从头规划——由此形成一棵越用越丰富、完全属于你的私人技能树。token效率:基于上下文信息密度最大化(Contextual Information Density Maximization),比同类agent少消耗6倍token,相关技术报告于2026年4月在arXiv发布。模型无关,支持Claude、Gemini、Kimi、MiniMax及所有OpenAI兼容端点。2026年1月16日发布,12.8K星,1,474 forks,持续维护中,含L4会话存档记忆和scheduler cron集成。
Key Points
  • **不预装,自进化**:与obra/superpowers等「预装人类设计技能包」不同,GenericAgent从零开始——在完成真实任务中自动生长出属于你自己的技能库,你的agent变成了「越用越聪明」的私人助理
  • **6倍token节省**:上下文信息密度最大化(CIDM)机制让agent用更少token完成更多工作——对API成本敏感的个人开发者,这是选择GenericAgent而非其他agent框架的硬性经济理由
  • **完整系统控制**:浏览器操作、终端执行、文件系统读写、键鼠控制、屏幕视觉、手机ADB——9个原子工具让agent可以做任何你在电脑上能做的事,而不仅限于代码辅助或文本生成
💡 GenericAgent代表了一种不同的AI使用哲学:你不是在「使用AI工具」,而是在「训练一个只属于你的私人助理」。每次用它完成一个任务,它就把那次经验存成技能;你的技能树越丰富,它后续工作消耗的token越少、成功率越高。这对有大量重复性高级任务(自动化工作流、桌面操作、数据采集)的人特别有价值:第一次教它怎么做,以后它自己会。想用AI打通复杂桌面工作流的人——「每天早上抓取竞品更新、整理成报告、自动发邮件」这类任务——GenericAgent是目前最轻量、最灵活的本地全系统控制agent选项之一。
Repo AI App
GH
2d streak
#4 harry0703/MoneyPrinterTurbo ★ 85K ▲ +1,471/w
一键AI生成高清短视频:输入话题→自动生成脚本→匹配Pexels/Pixabay素材→生成字幕+TTS配音+背景音乐→输出完整竖屏/横屏视频,支持批量生成,适配抖音/TikTok/YouTube Short格式
MoneyPrinterTurbo是目前GitHub上最受欢迎的AI短视频自动化工具,85K星、12K forks,今日重返GitHub趋势榜(+1,471星)。用户输入一个视频话题或关键词,系统自动完成全流程:①AI大模型生成视频脚本(支持OpenAI/Claude/Gemini/DeepSeek等10+提供商);②自动从Pexels/Pixabay/Coverr匹配和拼接视频素材;③多语言TTS配音(支持实时预览);④AI生成并嵌入字幕(字体/位置/颜色/大小全可配);⑤添加背景音乐(可控音量);⑥输出9:16竖屏(1080×1920)或16:9横屏(1920×1080)成品视频。支持批量生成。提供Web UI和REST API两种使用方式,MVC架构方便二次开发,支持Docker部署。
Key Points
  • **全流程零中断**:从话题到成片,脚本/素材/字幕/配音/音乐/剪辑全自动——区别于「AI辅助剪辑」类工具,这是真正的「输入话题,输出可发布视频」,中间不需要人工干预
  • **10+LLM提供商适配**:脚本生成支持OpenAI、Claude、Gemini、DeepSeek等主流大模型,可根据成本和质量需求自由切换脚本生成引擎,深度贴近中文内容需求
  • **批量生成+API支持**:支持一次性批量生产多个视频并提供REST API——这为「内容工厂」式的规模化运营提供了技术基础,也方便集成进更大的自动化内容分发工作流
💡 MoneyPrinterTurbo的实际变现路径非常直接:选一个有持续搜索量的垂直话题(理财技巧、英语学习、健身建议、科技新闻等),用它每天批量生成多条竖屏短视频,在抖音/TikTok/YouTube Short上持续发布,等待自然流量变现。关键洞察:内容平台的算法不在意视频是否AI生成,它只在意完播率和互动率——选对话题比内容是否「AI味」更重要。技术门槛已被这个工具消除,真正的差距在于:选题能力(找到「信息密度高但视频内容少」的话题)+ 发布节奏的坚持。门槛在于运营纪律,不在于技术。
Article LLM/Model
ht ht ht
NEW
by H Company(Hugging Face博客,2026年6月2日)
H Company在Hugging Face发布Holo3.1,这是目前速度最快的本地桌面控制agent模型系列之一。核心突破:在OS-World基准上达到74.2%成功率(前代Holo3为68.1%),AndroidWorld 35B-A3B模型从67%提升至79.3%,4B/9B轻量版本从58%提升至71%。硬件门槛:最低仅需12GB VRAM即可运行完整agent栈,140ms操作延迟(点击/输入/滚动/拖拽等GUI操作)。模型家族跨越0.8B到35B-A3B四个规格,开源权重发布于Hugging Face(Hcompany/Holo-3.1-*系列)。新增能力:扩展支持从桌面/浏览器到移动端(Android),引入原生函数调用支持,优化量化检查点便于本地部署。操作空间:标准化为click(x,y)、type(text)、scroll(direction)、drag_and_drop等离散命令,便于与现有agent框架集成。
Key Points
  • **12GB VRAM门槛,消费级可及**:12GB VRAM是RTX 3060/4060等主流消费级显卡的配置——Holo3.1意味着不需要A100或云端API,用一台游戏电脑就可以在本地运行「能操控自己桌面的AI代理」
  • **OS-World 74.2%**:这是桌面控制agent的标准化基准——74.2%意味着每4个GUI任务约有3个可以无人工干预完成,相比68.1%的前代,这是质量上的实质性跃升而非边际改进
  • **开源权重+原生函数调用**:全系列开源权重发布于Hugging Face,新增原生函数调用支持——开发者可以直接集成进现有agent框架(LangChain、GenericAgent等),无需重写工具调用逻辑
💡 Holo3.1对普通人的实际意义:「让AI操控我的电脑帮我做事」这件事,今天的技术门槛已经降到了普通游戏电脑的水准。以前这类能力需要GPT-4V API调用,成本高、数据出境、延迟大;现在可以在本地12GB显卡上以140ms延迟运行。具体机会:用Holo3.1结合GenericAgent这类本地agent框架,可以构建一个完全在本地运行的「桌面自动化助理」,处理需要GUI操作的重复任务(自动填报、数据采集、截图整理、多窗口信息同步)。不需要API key,不泄露屏幕内容,成本近乎为零。这是个人AI自动化工具栈里最值得关注的能力空白之一,而且窗口刚刚打开。
Product 小微现金流
ht ht ht
NEW
#6 Synthflow AI — 白标AI电话前台:向垂直行业小微业主收月费的可复制路径 Pay-as-you-go从$0起;Agency套餐$899/月含2,000分钟;白标+转售工具包$2,000/月(企业版含) 直接可用
by Synthflow AI(2024年创立,2026年白标生态快速扩张)
Synthflow是一个无代码AI语音代理平台,允许用自然语言构建能接打电话、预约、回答问题的AI语音前台,无需编程。面向代理商的商业模式:购买Synthflow白标套餐($2,000/月)后以自己品牌出售AI前台服务给小微企业,每个客户收$299-499/月,Synthflow的实际成本约$0.07-0.16/分钟。具体成本结构:单客户月均200分钟通话,Synthflow成本约$14-32/月,向客户收$299-499/月,毛利润约$267-485/客户/月。目标场景:牙科诊所、美容院、餐厅、律所、健身房等需要接听预约电话但不想雇前台的本地小微业主;这类业主每月为人工前台付$1,500-3,000,愿意为$299-499的AI方案买单。部署时间:在Synthflow可视化界面中,一个可用的预约接待agent约20-45分钟完成配置,无需开发资源。
Key Points
  • **极高毛利润结构**:向客户收$299-499/月,Synthflow成本约$14-32/月——毛利润率约90-95%,是AI服务变现中成本结构最优的模式之一,且规模效应明显(客户越多,固定白标成本被摊薄越多)
  • **垂直突破+可复制**:选定一个垂直行业(如牙科诊所),打磨一套标准话术+集成(CRM、日历预约系统),然后在本地或全国复制销售——相同的配置可以服务多个同类客户,交付边际成本接近零
  • **解决真实且昂贵的痛点**:漏接电话 = 漏接业务,对牙科/美容/餐饮类高频预约行业尤其致命——AI前台解决的不是「用AI很酷」的需求,而是「每个未接来电都是损失的钱」这个可量化痛点
💡 AI语音前台代理商模式的可行路径:选定一个高频接听电话的本地垂直行业(牙科是最常被提到的)→用Synthflow配置一套该行业专用话术和预约集成→找10家本地诊所做免费试用(一周)→转化2-3家收$299-499/月→用这2-3家的案例继续扩客户。启动资金:Synthflow Agency套餐$899/月 + 白标工具包$2,000/月 = $2,899/月固定成本,签4个客户就回本,10个客户就有超过$2,000净利润/月。最快路径:不购买白标,直接用Synthflow Agency套餐自己提供服务,客户不需要知道后台用什么——这样前三个月固定成本仅$899/月,更快验证客户意愿。
My Take 评分(5=最优):最快成交 4 / 最低成本 4 / 可复制 5 / 风险安全度 4。垂直AI前台服务:成本结构极优、标准化程度高、解决可量化痛点——适合有一定销售能力(能拉到第一批本地客户)但技术背景不需要很强的人优先考虑
Hall of Fame
#1buildpipe4d
#2chopratejas/headroom4d
#3Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward2d
#4CopilotKit/CopilotKit2d
#5NVIDIA/cosmos2d
#6NousResearch/hermes-agent2d
#7Project Vend Phase 2:AI agent可以独立运营真实商业了2d
#8RyanCodrai/turbovec2d
#9The End of Software Engineering: How AI Agents Are Fundamentally Restructuring the Software Paradigm2d
#10harry0703/MoneyPrinterTurbo2d