今日趋势综述
今天的主线是『一个人开始指挥一支 agent 队伍』——YC 总裁 Garry Tan 把自己那套 23 个工具的 Claude Code 配置开源成 gstack(约 11.7 万星),让单个人在 Claude Code 里同时扮演 CEO、设计、工程经理、QA、发布等角色按流程出活;Stably 的 Orca(约 8300 星,今天还在更新)把『并行跑一队 coding agent』做成桌面/手机都能用的 ADE,一个提示扇出给多个 agent 在隔离的 git worktree 里同时干、再横向对比;YC S24 的 Palmier Pro(约 9200 星)则把 AI 直接搬进 macOS 视频剪辑器,靠 MCP 让 Claude/Codex 和你在同一个工程里实时协作。学界的 Agent-Omit 从另一头补:教 agent 学会『该省就省』——自适应地略过冗余的思考和观察,用 8B 小模型逼近七个前沿 agent 的效果,把跑 agent 的成本压下来。落到现金流,最稳的不是卖工具订阅,而是『卖结果』:自己用 AI 当某个客户的内容团队/获客团队,月费 $1.5K–4.5K,AI 干八九成、你只审校,瓶颈在拿客户不在产能。把这串起来:当一个人能稳定指挥一队 agent,普通人的位置是当那个『设计流程、调度 agent、对最终结果负责』的指挥者和交付者。
今天的信号:一个人开始指挥一队 agent,会编流程、能交付结果的人最值钱

把今天几条放一起看,方向出奇一致:2026 年的竞赛,已经从『用一个 agent』变成『指挥一队 agent』。最有代表性的是 gstack——YC 总裁 Garry Tan 干脆把自己每天用的那套 Claude Code 配置原样开源出来:23 个工具,分别充当 CEO 评审、设计评审、工程经理、QA、安全官、发布与部署等角色,强制走『想→规划→构建→评审→测试→上线』的结构化流程。它几天冲到约 11.7 万星说明一件事——大家想要的不再是『一个更聪明的助手』,而是『一支按流程协作、能把活从头干到尾的虚拟团队』。Stably 的 Orca 从工程侧把这件事做实:它是专门用来并行跑一队 coding agent 的开发环境,一个提示扇给多个 agent,各自在隔离的 git worktree 里同时干,再把结果横向对比挑最好的;兼容 Claude Code、Codex、Cursor 等 30 多种 agent,桌面和手机都能盯着。一句话:『同时跑很多个 agent、再择优』正在变成新的日常工作方式。

Palmier Pro 把同一股劲带到了消费级软件:一个 YC S24 团队做的开源 macOS 视频剪辑器,时间线像 Premiere,但通过 MCP 让 Claude、Codex、Cursor 这些 agent 和你在同一个工程里实时协作、一起剪。它说明 agent 不只是在写代码,正在被嵌进每一类专业软件,成为和你并肩干活的『同事』。而学界的 Agent-Omit 则在补另一头的隐忧——agent 队伍跑起来很烧 token:它训练 agent 学会自适应地『该省就省』,略过冗余的思考和观察,用一个 8B 小模型就逼近七个前沿 agent 的效果,把效率-成本的平衡点往前推。把 gstack(流程)+ Orca(并行调度)+ Palmier(嵌入专业软件)+ Agent-Omit(压成本)拼起来,你能看到清晰的一条线:跑一队 agent 这件事,正在被工程化、平民化、低成本化。

那普通人该站哪?答案不在『拥有一个 agent』,而在『会指挥一队 agent,并对最终结果负责』。注意 gstack 的设计哲学:它值钱的地方不是 23 个工具本身,而是 Garry Tan 把『一个产品该怎么被想清楚、评审、测好、发出去』的流程沉淀了进去——AI 负责执行,人负责定义流程和把关结果。这恰好指向今天最实在的现金流样本:别去卖一个 $9/月的 AI 工具订阅,去给一个具体客户当『内容团队』『获客团队』,月费 $1.5K–4.5K,AI 干八九成、你每周花几小时审校,真正的瓶颈是拿客户而不是产能。把今天拼成一句话:当一个人就能指挥一支 agent 队伍,稀缺的不再是会用 AI,而是会设计流程、会调度 agent、会为交付结果兜底的『指挥者』——这正是普通人能占住、且越来越值钱的位置。

Type
Source
Repo DevTools
GH OI st
NEW
#1 garrytan/gstack ★ 约11.7万 ▲ +约数万(2026-03 创建后随 Garry Tan 公开自己 Claude Code 配置而爆发式增长,本周持续在 GitHub 趋势榜高位,仓库每日更新)/w
gstack 是 Y Combinator 总裁兼 CEO Garry Tan 把自己每天用的那套 Claude Code 配置原样开源出来的产物——一套 23 个工具的集合,让单个开发者在 Claude Code 里同时拥有一支『虚拟工程团队』。这 23 个工具按角色和阶段分工:规划与评审(office-hours、plan-ceo-review、plan-eng-review、plan-design-review、autoplan)、设计(design-consultation、design-shotgun、design-html、design-review)、开发(review、investigate、ship、land-and-deploy)、测试与 QA(qa、canary、benchmark)、文档(document-release、document-generate)、安全与运维(cso 安全审计、setup-deploy)以及一批工具类技能(browse、learn、retro、codex、spec、diagram、make-pdf 等)。它解决的核心问题是:传统做产品需要 CEO、设计、工程经理、QA 等一堆专职角色,而 gstack 把这些角色和『想→规划→构建→评审→测试→上线』的结构化流程固化进 Claude Code,让一个人也能以团队的速度和章法把产品稳定地发出去——并刻意用流程防住 AI 编码常见的跑偏。
gstack 是今天『一个人指挥一队 agent』这条主线最直白、也最有分量的代表。它的看点不在于又一套提示词模板,而在于出自 YC 总裁 Garry Tan 之手、并把他真实的工作流沉淀了进来:Tan 公开说自己靠这套东西『发的产品比以往任何时候都多』,还拿它对比 2013 年算出夸张的生产力倍增。几天冲到约 11.7 万星说明,开发者真正想要的已经不是一个更聪明的聊天助手,而是一支按流程协作、能把活从头干到尾的虚拟团队。它和今天的 Orca(并行调度一队 agent)、Palmier(把 agent 嵌进专业软件)是同一件事的不同切面——大家在合力把『跑一队 agent 干活』工程化、平民化。对个人最大的价值是:你可以直接照搬一位顶级实践者验证过的完整流程,省去自己从零摸索『AI 该怎么被组织起来出活』的漫长试错。
Key Points
  • **YC 总裁的真实工作流**:Garry Tan 把自己每天用的 Claude Code 配置原样开源,23 个工具覆盖 CEO/设计/工程经理/QA/发布等角色,不是模板而是被验证过的流程
  • **用流程防跑偏**:强制『想→规划→构建→评审→测试→上线』的结构化链路,把 AI 编码最常见的失控和返工挡在前面
  • **爆发式采纳**:2026-03 创建后几天冲到约 11.7 万星、每日更新,是『一个人以团队速度出活』这股潮流的标志性项目
💡 对普通人,gstack 最值得抄走的不是那 23 个工具,而是它背后的认知:在 AI 时代,稀缺的不是执行力(AI 管够),而是『把一件事该怎么想清楚、怎么评审、怎么测好、怎么发出去』的流程设计能力。Garry Tan 的护城河正是把这套流程显式化了——AI 负责干,人负责定义流程和把关结果。可落地的两步:一是直接上手——把 gstack 装进 Claude Code,照着它的角色和阶段跑一个你自己的小项目,亲身体会『让 AI 按团队流程出活』和『随便聊两句让它写代码』差在哪;二是迁移思路——无论你做什么(写作、运营、咨询、接单),都试着把自己脑子里那套『好东西是怎么一步步做出来的』拆成明确的阶段和验收点,再交给 AI 去执行。记住今天的主线:会编流程、会指挥 agent、会为结果负责的人,正在跑赢只会发指令的人。
Repo DevTools
GH OI
NEW
#2 stablyai/orca ★ 约8300 ▲ +约数百(2026-03 创建,本周在 GitHub 趋势/devtools 榜活跃,仓库今天仍在更新 pushed 2026-06-27)/w
Orca 是 Stably AI 做的『agent 开发环境(ADE)』,专门用来并行地指挥一整队 coding agent,自我定位是『面向 100x builder 的 AI 编排器』。它的核心能力是并行 worktree:把一个提示同时扇出给多个 agent,每个 agent 在隔离的 git worktree 里独立干活,方便你把多套实现摆在一起横向对比、择优采用。配套能力包括:手机端(iOS/Android)随时监看和操控正在跑的 agent;WebGL 渲染、可无限分屏的高级终端;Design Mode——点选 UI 元素就把 HTML/CSS/截图直接喂给 agent;原生集成 GitHub 与 Linear(浏览 PR、issue、项目看板);SSH worktree 让 agent 跑在远端机器上并能完整编辑文件;以及可脚本化的 Orca CLI(worktree create、snapshot、click 等命令)。它兼容任何 CLI 形态的 agent——Claude Code、Codex、OpenCode、Pi、Cursor、GitHub Copilot 等 30 多种,且强调『用你自己的订阅』来跑,不再额外锁一层费用。
如果说 gstack 解决的是『一个人怎么按团队流程出活』,Orca 解决的就是它的物理基础:当你想同时跑很多个 agent,怎么不乱。它把『并行跑一队 agent、再择优』这件正在成为日常的事做成了顺手的工具——隔离 worktree 防止互相踩踏、横向对比帮你挑最好的实现、手机端让你离开电脑也能盯着。约 8300 星、今天仍在更新,且兼容 30 多种主流 agent、强调用你自己的订阅,说明它走的是『中立编排层』路线,而不是绑死某一家。它和 gstack 是天然互补的一对:一个给你流程和角色,一个给你并行跑这些角色的运行环境。对个人开发者,它的意义是把『同时指挥多个 agent』从手忙脚乱的多终端切换,变成一个能横向对比、能远程盯、能脚本化的正经工作台。
Key Points
  • **并行 worktree 择优**:一个提示扇给多个 agent,各自在隔离 git worktree 同时干,再横向对比挑最好的实现,把『跑一队 agent』变得不乱
  • **中立兼容 + 用你自己的订阅**:支持 Claude Code/Codex/Cursor/Copilet 等 30+ CLI agent,不额外锁费用,走中立编排层路线
  • **桌面+手机+远程**:iOS/Android 随时监看操控、SSH worktree 让 agent 跑在远端、Design Mode 点选 UI 直接喂给 agent,CLI 可脚本化
💡 对普通人,Orca 点明了一个正在落地的新工作方式:未来你的产出,可能不取决于你写得多快,而取决于你能同时管多少个 agent、并从它们的多套结果里挑出最好的那套。这套『并行 + 择优』的玩法,恰恰把价值从『动手执行』推向了『出题、评审、决策』——你负责把任务讲清楚、把多份答案比出高下,AI 负责并行产出。可落地的机会有两层:一是技能层——现在就练『同时给多个 agent 派活、再横向比对验收』的能力,这是『指挥一队 agent』的基本功,越早练越有复利;二是认知层——当产能不再是瓶颈(一队 agent 管够),你的稀缺性会越来越集中在『判断力』上:知道什么是好的、能在一堆看似都对的方案里挑对那个。Orca 这类工具普及后,会用它的人和不会用的人,产出差距会被并行度直接放大。
Product AI App
GH OI
NEW
#3 Palmier Pro:YC 团队做的开源 macOS 视频剪辑器,靠 MCP 让 Claude/Codex 和你在同一工程里一起剪 剪辑器本体 GPLv3 开源、免登录免费用;MCP server 与 agent chat 也开源;生成式 AI 功能(接 Seedance、Kling 等模型出图/出片)需登录订阅。仅支持 Apple Silicon 上的 macOS 26 (Tahoe)
by Palmier, Inc.(Y Combinator S24)
Palmier Pro 把今天『agent 走进专业软件、和你并肩干活』这股劲带到了消费级创作工具。它是一个 YC S24 团队做的、用 Swift 原生写的 macOS 视频剪辑器,时间线体验对标 Premiere Pro,但内置两类 AI 能力:一是生成式——接 Seedance、Kling 等模型直接在剪辑器里生成视频和图像素材;二是协作式——通过 MCP(Model Context Protocol)让 Claude、Codex、Cursor 这些 agent 和你在同一个剪辑工程里实时协作,等于给你的剪辑台配了个能听懂指令、能动手的 AI 助手。剪辑器本体和 MCP server 都按 GPLv3 开源、免登录就能当普通剪辑器用,只有生成式 AI 功能需要订阅。约 9200 星说明这种『把 agent 接口(MCP)做进专业软件、让 AI 成为同工程协作者』的形态正在被认可。它的信号意义大于工具本身:agent 不再只待在终端里写代码,而是开始嵌进每一类专业软件,成为和你共享同一份工程文件的『同事』。
Key Points
  • **MCP 让 agent 进剪辑工程**:Claude/Codex/Cursor 通过 MCP 和你在同一个视频工程里实时协作,AI 从『外部工具』变成『同工程协作者』
  • **开源本体 + 订阅生成**:剪辑器与 MCP server 按 GPLv3 开源、免登录免费用,只有接 Seedance/Kling 出图出片的生成功能需订阅,路径清晰
  • **YC 背书的新形态**:YC S24 团队、Swift 原生、对标 Premiere,约 9200 星,代表『agent 嵌进专业软件』的趋势正在从代码编辑器扩散到创作工具
💡 对普通人,Palmier Pro 的启发有两层。第一层是用法上的——如果你做视频/内容,它示范了一种新工作方式:不再是『自己剪 + 偶尔让 AI 生成个素材』,而是让 agent 进到你的工程里,按你的指令直接动手改时间线、调素材,你负责导演和把关。第二层、也是更值钱的一层是机会上的:MCP 正在成为『让 agent 接进任何专业软件』的标准接口,而绝大多数行业软件(财务、法务、设计、CRM、行业 ERP……)还没有自己的 MCP 协作层。这意味着一个清晰的窗口——给你最熟的那个行业软件/工作流,做一层『让 agent 能进来一起干』的 MCP 集成,往往比从零做个新 App 更轻、更快、也更容易找到肯付钱的人。记住趋势:agent 正从终端走进每一类专业软件,谁先把自己行业的『AI 协作接口』搭起来,谁就占住了那个垂直入口。
Paper AI Agent
arXiv GH
NEW
by Yansong Ning, Jun Fang, Naiqiang Tan, Hao Liu(usail-hkust,开源项目 usail-hkust/Agent-Omit)
Agent-Omit 盯的是 agent 走向规模化使用后一个很现实的痛点:跑一队 agent 很烧 token。在多轮『agent 与环境交互』里,每一步都让模型长篇思考、把每条观察结果都塞回上下文,既慢又贵。但作者指出:思考的必要性和观察的有用性,其实在不同回合差别很大——有些步骤根本不需要长考,有些观察对后续决策没什么用。Agent-Omit 因此提出一套统一训练框架,教 agent 自适应地『省略』冗余的思考和观察:先用少量冷启动数据(涵盖单轮和多轮的省略场景)微调出基本的省略行为,再用一种『感知省略』的 agentic 强化学习——配合双采样机制和专门设计的省略奖励——激励 agent 学会在该省的地方省、该想的地方想。结果很有说服力:训练出的 Agent-Omit-8B 在五个 agent 基准上,效果可比肩七个前沿 LLM agent,并在『效果-效率平衡』上胜过七种现有的高效 agent 方法。代码和数据已开源。一句话:它证明把 agent 调得又好又省,是可以专门训练出来的。
在大家都忙着让 agent『干更多、跑更久』时,这篇反向补上了被忽视的一环——怎么让 agent『该省就省』,自适应地略过冗余的思考和观察,用更小的模型在更低成本下拿到接近前沿的效果。它把 agent 的竞争从『堆能力』拉回到『能力-效率的平衡』。
Key Points
  • **自适应省略**:按回合判断『这步要不要长考、这条观察有没有用』,自适应略过冗余思考和观察,直击多轮 agent 又慢又贵的痛点
  • **两步训练法**:少量冷启动数据微调出省略行为 → 用双采样 + 省略奖励的 agentic RL 激励自适应省略,方法可复现、已开源
  • **小模型打平前沿**:Agent-Omit-8B 在五个基准上效果可比肩七个前沿 agent,并在效果-效率平衡上优于七种现有高效 agent 方法
💡 对普通人,这篇论文的现实意义不在算法细节,而在它预示的一个趋势:跑 agent 的成本正在被快速压下来。今天你嫌 agent 队伍烧钱、跑得慢,未来这类『又好又省』的技术普及后,用一个 8B 级小模型就能干接近前沿的活——这意味着自建/自托管 agent 的门槛和成本会大幅降低,普通人和小团队也能负担得起『常驻一队 agent 帮你干活』。可落地的两点:一是别被当下的高成本吓退,效率优化的方向非常确定,早点把『怎么用 agent 干活』的能力练起来,等成本塌下来你正好吃到红利;二是迁移这套思路到自己身上——它的核心洞察『不是每一步都值得用力,分清哪里该省哪里该深思』,本身就是高效做事的通用法则,把精力省在没价值的环节、押在关键决策上,人和 agent 都适用。
Product 小微现金流
in re
NEW
#5 卖结果不卖工具:自己用 AI 当客户的『内容/获客团队』,月费 $1.5K–4.5K、AI 干八九成你只审校 按客户月费 retainer:每个客户约 $1,500–4,500/月;典型 AI 工具成本约 $380/月(多客户合计);单人可带 11–12 个客户,月收入区间约 $10K–30K 直接可用
by Indie Hackers 社区真实案例(AI 服务型代理 / build-in-public)
这是今天技术信号落到普通人现金流的最直接一条,且和上面 gstack/Orca『一个人指挥一队 agent』完全同源:2026 年最稳的 AI 赚钱姿势,不是卖一个 $9/月的工具订阅,而是自己用 AI 给一个具体客户当『内容团队』或『获客团队』,按月收 retainer。多个 Indie Hackers 真实案例给出一致的数字:你交付的不是一个 dashboard 的访问权,而是成品——发出去的文章、优化好的落地页、每周的广告创意、自动跟进的线索;同样底层都用 AI,但你卖的是结果。典型形态是单人带 11–12 个客户、每客户 $1,500–4,500/月,AI 自动化掉八九成的活,自己每周花几小时审校把关,整月 AI 工具成本约 $380。换算下来单人月收入常落在 $10K–30K 区间。关键判断是:在这套模式里,瓶颈不是产能(AI 管够),而是获客——能不能持续找到肯为『结果』付月费的客户。它本质上就是把 gstack 那套『一个人按团队流程出活』的能力,对准一个具体行业的具体痛点卖出去。
Key Points
  • **卖结果不卖工具**:交付成品(文章/落地页/广告创意/跟进好的线索)而非工具访问权,$3K/月的 retainer 远胜 $9/月订阅,客单价高、毛利厚
  • **真实数字可参考**:单人带 11–12 客户、每客户 $1.5K–4.5K/月,AI 干八九成、每周几小时审校,月 AI 成本约 $380,月收入区间约 $10K–30K
  • **瓶颈在获客不在产能**:AI 把生产能力管够后,唯一卡点是持续拿到肯为结果付月费的客户——所以壁垒在你的行业关系和分发,不在技术
💡 对想挣现金流的普通人,这条把今天所有技术信号变现的路径说得最透:你不需要会训模型、不需要自研工具,你需要的是『用 AI 替某个具体客户把一件具体的活干完并交付结果』。它对个人特别友好的地方在于:一是现金流健康——月费 retainer 一上来就是正现金流,不用先烧钱做产品;二是壁垒来自领域和关系而非技术——你越懂某个行业(最好是你本来就熟的那行)真正在乎什么结果,越能交付到点子上,也越难被替代;三是可复制——给一个客户跑通的『AI 内容团队』或『线索自动跟进』,几乎能原样卖给同行业的下一家。最务实的第一步:选一个你熟悉的窄行业、锁定一个它们肯为之付钱的具体结果(更多预约、更多内容产出、更快跟进线索),先低价给一家跑出真实成果,再拿这个案例去复制收费。记住瓶颈在获客——把『怎么持续找到客户』当成头号功课,比打磨工具重要得多。
My Take 评分(5=最优):最快成交 4 / 最低成本 5 / 可复制 4 / 风险安全度 4。卖结果不卖工具的服务型现金流,月费 retainer 一上来就正现金流,最适合懂某行业、能对交付结果负责的个人切入;唯一硬功课是持续获客。