今天的主线是『模型能力正在快速商品化,个人和团队的差异化越来越来自把外部资产做好』——省 token 的上下文工程(rtk 用一个 Rust 二进制把 dev 命令输出压掉 60–90%)、能被加载复用的品味与技能(taste-skill 约 5 万星,专治 AI 生成的『通用 slop』)、以及能真正去操作电脑的 agent harness(字节 UI-TARS-desktop 把多模态 computer-use 做成开源栈),学界则用《Externalization in LLM Agents》把记忆/技能/协议/harness 这套『外化能力』统一成一个研究框架。落到能收钱的场景:给医美/口腔等本地诊所做『沉睡客户数据库唤醒』——用 GoHighLevel/ServiceAgent 这类现成栈,把躺在系统里 200–800 个老客户用 AI 自动 SMS/对话唤回预约,一次唤醒约能找回 8–15% 客户、对 500 人名单约合 2.4 万–4.5 万美元被找回收入,agency 单客月费 $2K–$10K,是一条单位经济极清晰的现金流路子。把这串连起来:普通人最值钱的功夫,是把『省、品、能动手』这三类外部资产做扎实,再把它对准一个有真实钱漏洞的具体场景去收钱。
今天的信号:模型在变成水电,个人的护城河从『会用模型』转向『把外部资产做好』——省 token、攒品味/技能、让 agent 能动手

把今天榜上几条放一起看,会发现它们在回答同一个问题:当模型本身越来越像水电(强、便宜、人人能调),价值到底沉到哪去了?答案是『模型之外的那一层』。rtk 这个 Rust 写的 CLI 代理短时间冲到约 6.5 万星,干的事极朴素——把你跑 dev 命令时灌给 LLM 的那一大坨输出压掉 60–90%,单二进制、零依赖。它没训练任何模型,只是把『喂给模型的上下文』管得更省,就解决了一个让无数人天天烧钱的真问题。这和这几天的 codebase-memory-mcp、headroom 是同一条线:2026 年真正的成本战场是 token 和上下文,谁更省谁更有竞争力。

第二类外部资产是『品味与技能』。Leonxlnx/taste-skill 约 5 万星,做的事是给 AI 装上『审美』——用一份可加载的 SKILL.md,专门治 AI 生成界面时那种千篇一律的『generic slop』,还能调设计的变化度、动效、密度。它能这么火说明一件事:当人人都能让 AI 生成东西,真正稀缺的是『生成得不一样、有品』,而这种品味是可以被结构化、被打包成 agent 能复用的技能件的。学界这边,《Externalization in LLM Agents: A Unified Review of Memory, Skills, Protocols and Harness Engineering》干脆把记忆、技能、协议、harness 这一整套『把能力外化到模型之外』的做法统一成一个研究框架——这正是过去半年所有热点(skills、memory、MCP、harness)的共同底层。第三类资产是『能动手的 harness』:字节的 UI-TARS-desktop(约 3.7 万星)把多模态的 computer-use agent 做成开源栈,让 agent 不只是聊天,而是能真的去点你的屏幕、操作软件——呼应了 GPT-5.6 把『电脑操作』当主攻方向的趋势。省、品、能动手,三件事都在模型之外。

但外部资产做得再漂亮,最终要落到一个能持续收钱的场景里。今天这条很实在:给本地诊所做『沉睡客户数据库唤醒』。几乎每家开了几年的医美/口腔诊所,系统里都躺着 200–800 个很久没来的老客户——这是已经付过获客成本、却被晾着的纯利润。用 GoHighLevel 或 ServiceAgent 这类现成栈,把这份名单导进去,让 AI 自动发个性化短信(『你的项目该补做了,要不要帮你约一下?回 YES』)并由对话 AI 接着把预约谈成,典型唤回率 8–15%;对一份 500 人的名单,按客单价 $600 算,一轮就能找回约 2.4 万–4.5 万美元收入,agency 按月收 $2K–$10K、毛利极高。把今天拼成一句话:先把『省 token 的上下文工程、可复用的品味/技能、能动手的 harness』这三类模型之外的资产练扎实,再把它对准一个像『数据库唤醒』这样钱漏洞清清楚楚的具体场景——模型变成水电之后,普通人的窗口就在这层『外部资产 + 具体场景』里。

Type
Track
Source
Repo DevTools
ht ht
NEW
#1 rtk-ai/rtk ★ 约6.5万 ▲ +约数千(2026-01 创建,近几月快速积累到约 6.5 万,本周仍在 GitHub/Trendshift 趋势榜,仓库每天在更新)/w
一个用 Rust 写的 CLI 代理:它夹在你和 AI 编程 agent 之间,把跑常见 dev 命令(构建、测试、git、依赖安装等)时产生的那一大坨冗长输出在送进 LLM 之前先压缩/过滤掉,号称把这些命令的 token 消耗砍掉 60–90%,且不丢关键信息。单个静态二进制、零依赖,装上即用,目标是让 agent 跑 shell 命令时又快又省。
rtk 直击 agent 真正跑起来时最疼的成本之一:shell 命令输出。今天的编程 agent 一旦开始跑构建、测试、装依赖,命令输出动不动几千上万行,全灌进上下文既烧 token 又拖慢、还容易把模型的注意力淹没。rtk 的思路很克制——不训练模型、不改 agent,而是在中间加一层代理,把这些输出智能压缩、只留对决策有用的部分,号称省 60–90% token。它用 Rust 编成单个零依赖二进制,装上就能给 Claude Code、Codex 这类 terminal-first agent 提速降本。它能短时间冲到约 6.5 万星,和这几天的 codebase-memory-mcp、headroom 一道说明:把『喂给模型的上下文』管得更省,正在成为开发者最迫切的真需求。
Key Points
  • **省 60–90% token**:把 dev 命令的冗长输出在进 LLM 前先压缩过滤,一次构建/测试日志不再原样烧钱,直击 agent 的运行成本
  • **零摩擦**:单个 Rust 静态二进制、零依赖,夹在你和 agent 之间即插即用,不用改 agent 也不用配模型
  • **对准真痛点**:terminal-first agent(Claude Code/Codex 等)跑 shell 命令是 token 大头,rtk 专攻这一块,约 6.5 万星说明需求真实
💡 对普通人,rtk 把一个很值钱的认知摆上台面:在 agent 时代,『省上下文』本身就是一门可以变现的手艺,而且门槛不在于你会不会训模型。它只是聪明地处理了『喂给模型的那堆日志』,就解决了一个让无数人天天烧钱的真问题并因此爆火。你能学到的不只是『装上 rtk 让 Claude Code 更便宜更快』,更是一种思维:当你用 AI 干一件会产生大量中间输出的活(看构建日志、处理报错、分析一堆数据),别把原始内容一股脑塞进去,先想想哪些是模型做决策真正需要的、能不能先过滤压缩。把这种『什么该进上下文、怎么精简』的直觉练出来,正在成为用好 agent、把成本压住的关键功夫——对想靠 AI 提效或做产品的人都是实打实的护城河。
Repo Frontend
ht ht
NEW
#2 Leonxlnx/taste-skill ★ 约5万 ▲ +约数千(2026-02 创建,近几月涨到约 4.96 万,本周持续在趋势榜,近几天仍在更新)/w
一套给 AI 装上『审美』的可加载技能(Agent Skill):用 SKILL.md 格式的指令文件,通过 CLI 安装或直接贴进 Claude/Cursor/Codex 等编程 agent 的对话里,专门治 AI 生成界面时那种千篇一律、平淡无奇的『generic slop』。它给布局、排版、动效、间距等设计决策提供成体系的规则,还能用 1–10 的『旋钮』调设计变化度、动效强度、视觉密度,框架无关(React/Vue/Svelte 都行),并接入了 Vercel 的 Agent Skills 生态。约 4.96 万星,MIT 协议。
taste-skill 击中了 AI 生成时代一个越来越明显的痛点:当人人都能让 AI 生成界面,产出却长得都一样——同样的卡片、同样的渐变、同样的『AI 味』。它的解法不是再换个更强的模型,而是把『好品味』本身结构化成一份可加载、可复用的技能件:基于专门研究的反重复规则,加上可调的设计旋钮,让 AI 在 layout、typography、motion、spacing 上做出更讲究、更不雷同的选择。它框架无关、能贴进主流编程 agent,还提供品牌套件和图像生成等多个细分技能。约 5 万星说明:在『生成已经不稀缺』的当下,『生成得有品、不一样』成了真正被追捧的能力,而这种能力是可以被打包成 skill 来传播和复用的。
Key Points
  • **专治 AI slop**:基于反重复研究的设计规则,把 AI 默认输出的『通用、平淡』界面拉到有层次、有审美,解决生成同质化这个真痛点
  • **可调旋钮**:用 1–10 调设计变化度/动效/视觉密度,框架无关(React/Vue/Svelte),既能 CLI 安装也能直接贴进 Claude/Cursor/Codex
  • **约 5 万星 + 接入生态**:MIT 协议、接入 Vercel Agent Skills,把『好品味』做成可加载、可分享的技能件,而非一次性提示词
💡 对普通人,taste-skill 揭示了一个正在成形的机会:当『让 AI 生成东西』变成人人都会的基础操作,差异化就上移到了『生成得有品味、不一样』,而品味恰恰是可以被结构化、被打包成 agent 技能去复用甚至变现的。你不必是顶级设计师——它本身就是一份把好审美沉淀成规则的范本。可做的具体动作有两层:一是直接用它,让你用 AI 搭的页面、做的图立刻摆脱『AI 味』,在一堆同质产品里显得专业;二是更进阶——学它的做法,把你自己所在领域里『什么算做得好』的判断(不管是文案、PPT、数据图还是某个行业的交付物)沉淀成一份可加载的 skill。在生成不再稀缺的时代,『把品味和判断标准结构化成 AI 能用的技能』,正在成为一项门槛不高却很有复利的稀缺能力。
Repo AI Agent
ht ht
NEW
#3 bytedance/UI-TARS-desktop ★ 约3.7万 ▲ +约数百(2025-01 创建、持续迭代,本周仍在 AI agent 趋势榜,2026-06 仍频繁更新)/w
字节跳动开源的多模态 AI agent 栈:核心是让 agent 不只是聊天,而是能真正『看屏幕、动鼠标键盘』去操作桌面软件(computer use / GUI agent)。它连接前沿多模态模型与一套 agent 基础设施,提供桌面应用形态,让模型能基于屏幕截图理解界面、规划并执行点击/输入等操作,完成跨软件的实际任务。约 3.7 万星,TypeScript。
UI-TARS-desktop 代表 agent 从『会说』走向『会做』的方向。过去一年 agent 大多停在文本对话和调 API,而真实世界里大量任务是在 GUI 软件里完成的——填表、在多个 app 间搬数据、操作没有 API 的老系统。UI-TARS 把多模态模型(能看懂屏幕)和一套能执行操作的 agent infra 打包成开源桌面栈,让 agent 像人一样基于截图理解界面、规划动作、真的去点和输入。它来自字节、工程完成度高、约 3.7 万星,是开源 computer-use 这条线里分量很重的一个。它和 GPT-5.6 把『电脑操作』列为主攻方向是同一个信号:2026 年 agent 竞争的一个关键前沿,是『能不能可靠地替你操作真实软件』。
Key Points
  • **会动手的 agent**:基于屏幕截图理解 GUI 并执行点击/输入,能操作没有 API 的软件,把 agent 从『聊天』推到『代你操作电脑』
  • **开源完整栈**:连接前沿多模态模型 + agent 基础设施 + 桌面应用形态,来自字节、工程完成度高,可作为研究 computer-use 的范本
  • **踩中前沿**:呼应 GPT-5.6 把电脑操作当主攻方向的趋势,约 3.7 万星,是开源 GUI agent 这条线里分量最重的项目之一
💡 对普通人,UI-TARS 提示了一个该提前关注的方向:agent 正在学会『操作你的电脑』,这意味着未来很多『重复的鼠标键盘活』会被 agent 接管——而这既是威胁也是机会。机会在于:那些发生在 GUI 里、没有 API、又重复又繁琐的流程(在某个老旧系统里录数据、跨几个软件搬运信息、批量处理表单),正是 computer-use agent 最先能吃掉的;谁先把自己或某个行业的这类流程梳理清楚、用 GUI agent 自动化掉,谁就能把别人还在手动干的活变成自己的效率优势甚至服务产品。现在值得做的,是先在自己的工作里找出一段『纯靠点点点完成、毫无创造性』的流程,试着用这类工具跑通——理解 computer-use agent 能做什么、边界在哪,会让你在这波自动化里站在主动的一侧。
Paper AI Agent
ht ht
🔥 3d
by arXiv 预印本(2026 年,作者团队见原文)
这篇综述提出了一个很有解释力的统一视角:近一两年 agent 领域几乎所有热点——长期记忆(memory)、可加载技能(skills)、互操作协议(MCP 等 protocols)、以及把工具与控制流组织起来的脚手架(harness engineering)——本质上都是同一件事:把智能『外化』到模型权重之外。它把这四块放在一个框架里梳理:模型本身保持通用,而真正决定一个 agent 能干什么、干得好不好的,越来越是它身上挂的这些外部组件。文章系统比较了各类做法、评估方式,并指出一系列开放问题(如这些外部资产怎么跨平台移植、怎么管权限与安全、怎么协同)。把它和这几天的 skills 综述、memory 研究放一起看,信号很统一:agent 的工程重心正从『调模型』转向『设计模型之外的那层资产』。
把过去半年所有 agent 热点(记忆、技能、MCP 协议、harness)背后的共同底层——『把能力外化到模型之外』——第一次统一成一个研究框架,给散落的工程实践补上整体地图。
Key Points
  • **统一视角**:把记忆/技能/协议/harness 都归结为『能力外化』这一条主线,帮你一眼看清近半年所有 agent 热点的共同底层
  • **四块对照**:系统比较各类外化做法与评估方式,而不是只讲单点技术,适合建立完整认知而非追逐零散名词
  • **点出开放问题**:跨平台可移植、权限与安全、组件协同等——正是这些外部资产从能用走向能规模化、能放心用的关键卡点
💡 对普通人,这篇论文的价值是给你一张『往哪使劲』的地图。它说清了一件事:在模型趋同的当下,agent 的差异化不在模型本身,而在你给它配的那层外部资产——它的记忆怎么存、技能怎么打包、能调用什么工具、harness 怎么编排。这意味着普通人能下功夫、能积累、也能形成壁垒的地方,恰恰是这层『模型之外』:你不需要会训模型,但你可以把自己的领域经验做成可复用的 skill、把常用资料建成结构化的记忆、把某个工作流编排成顺手的 harness。论文把这件事正名成一个有方法、有框架的研究方向,等于在告诉你:认真去设计和积累『模型之外的资产』,是这个时代回报最确定的一类投入。
Article 小微现金流
ht ht ht ht ht
NEW
by 综合 GoHighLevel / ServiceAgent 等医美 AI 自动化实践(2026)
这是一条单位经济极清晰的小微现金流路子:给开了几年的本地诊所(医美、口腔、美容、健身等)做『沉睡客户数据库唤醒』。几乎每家这类店的系统里都躺着 200–800 个很久没回来的老客户——他们的获客成本早已付过,却被晾着不管,是纯利润漏点。做法是用 GoHighLevel 或 ServiceAgent 这类现成的白标 AI+CRM 栈:把店里的沉睡客户名单从原系统导出导入,让 Workflow AI 自动发个性化短信(『你好[名字],你的项目该补做了,要不要帮你约下次?回 YES』),再由 Conversation AI 接管对话,把价格、可约时间、确认一路谈到预约成交。典型唤回率约 8–15%:一份 500 人的名单约能唤回 40–75 人,按客单价 $600 算,单轮约找回 2.4 万–4.5 万美元被遗漏收入,每季度跑一轮约合每月 $8K–$15K 摊销收入。对服务商(agency)而言,平台成本侧 AI 约 $97/月 + 通信费、整套放进 GoHighLevel 约 $234–$314/月且可白标转售;按诊所规模收月费:年营收 $150 万的店接受 $2K–$5K/月,$300 万+ 的店付 $5K–$10K/月,毛利很高。门槛不在技术(全是现成栈),在于你愿不愿意去谈下本地客户、把这套流程跑顺。
Key Points
  • **对准纯利润漏点**:唤醒的是已付过获客成本的老客户,不是从零拉新——典型唤回率 8–15%,500 人名单按 $600 客单价单轮约找回 $2.4 万–$4.5 万
  • **全是现成栈**:GoHighLevel / ServiceAgent 白标 AI+CRM,导名单→自动 SMS→对话 AI 谈成预约,平台侧约 $97–$314/月,无需自研、可转售
  • **月费清晰**:按诊所规模收 $2K–$10K/月,毛利高;真正的门槛不是技术,而是去谈下本地客户、把交付流程跑顺
💡 对想挣现金流的普通人,这条路子的启发是:最好做、最快收钱的 AI 生意,往往不是发明新东西,而是用现成 AI 栈去堵一个客户看得见、算得清的钱漏洞。『沉睡客户』就是这样一个漏洞——老板都知道系统里躺着一堆老客户没人管,但没精力做;你用 GoHighLevel/ServiceAgent 这类白标工具把『自动唤回预约』这件事替他跑起来,价值立刻能用『多找回多少营收』量化,比卖一个抽象的『AI 工具』好成交得多。可落地的第一步:锁定一个你能接触到的本地行业(医美、口腔、美发、健身、装修都行),先免费或低价帮一家店跑一轮唤醒、拿到一个『找回 X 万收入』的真实结果,再拿这个案例去复制收月费。重点是先有一个可量化的成交案例,再谈规模。
My Take 评分(5=最优):最快成交 4 / 最低成本 4 / 可复制 5 / 风险安全度 4。用现成白标 AI+CRM 帮本地诊所唤醒沉睡老客户,价值可用『找回多少收入』量化,单位经济清晰、易复制,门槛在销售而非技术。