今天的主线是『经验正在被封装成可调用的标准件,而模型在快速变便宜变省——杠杆从「会用大模型」移到「把判断力沉淀成 skill + 把省下来的 AI 对准具体的活和钱」』。本周 GitHub 上一个只有一份 CLAUDE.md 的仓库 multica-ai/andrej-karpathy-skills 冲到约 18 万星:它把 Andrej Karpathy 总结的『大模型写代码会犯的毛病』提炼成四条原则(想清楚再写、能简则简、只做手术刀式改动、目标驱动循环),直接让你的 coding agent 少犯错——这说明真正稀缺的不是模型,而是把资深判断力压缩成可加载技能的能力。Google 的 TimesFM 2.5(约 2.5 万星,时间序列基础模型)把『基础模型』从语言扩展到预测,参数反而降到 200M、上下文拉到 16K,还配了 SKILL.md 让 Claude Code 等 agent 直接调用——基础模型正在万物化、且越来越省。OpenAI 六月发布的 GPT-5.6 不拼单轮聊天,而是把 token 效率再提 10–15%、上下文拉到 1.5M,专攻『长时间自主干活 + 电脑操作』——让 agent 长期跑起来的成本被一刀刀砍下来。palmier-pro(本周 +3.9K 星)则示范了 AI 原生应用怎么重做老软件:一个从头为 AI 设计的 macOS 视频剪辑器。最后一条落到现金流:Glitter AI 把『用 AI 帮小微企业把流程写成 SOP』做成月费产品。把这串连起来看,普通人最该练的是:把自己的经验封装成 skill、用更省的模型让 agent 长期替你干活、再把这套能力对准一个具体能收钱的痛点。
今天的信号:经验在被封装成可调用的 skill,模型在变便宜——个人的机会是『沉淀判断力 + 把省下来的 AI 对准具体的活和钱』

今天榜单上最反直觉的一条,是一个仓库里几乎只有一份 CLAUDE.md 的项目——multica-ai/andrej-karpathy-skills——本周冲到约 18 万星。它没有代码、没有模型,只把 Andrej Karpathy 关于『大模型写代码会犯什么毛病』的观察,提炼成四条能被 Claude Code、Cursor 直接加载的原则:不确定就先说清假设别瞎猜、只写解决眼前问题的最少代码、只做手术刀式的精确改动、把命令式任务改写成『定义成功标准然后循环验证』的目标。它能爆火,恰恰说明 2026 年中真正稀缺的东西已经不是模型本身,而是『把资深判断力压缩成一份可加载技能』的能力——同样一个 agent,挂不挂这份经验,产出质量差一截。这和上周 last30days、SkillSpector 们指向的是同一件事:技能(skill)正在变成这个时代的硬通货。

与此同时,模型这一端在朝两个方向同时变『便宜』。一个方向是基础模型万物化:Google 的 TimesFM 2.5 把『基础模型』从语言扩展到时间序列预测,参数不升反降到 200M、上下文拉到 16K,还专门写了 SKILL.md 让 agent 能像调工具一样调它——意味着『预测销量、预测负载、预测库存』这种过去要数据科学家定制建模的活,正在变成一个调用即用的标准件。另一个方向是 agent 的运行成本被持续压低:OpenAI 六月的 GPT-5.6 几乎不谈单轮聊天变强,全部火力都在『token 效率再提 10–15%、上下文拉到 1.5M、长时间自主任务和电脑操作完成率提升』——翻译成人话就是,让 agent 替你连续干几个小时活、且不烧爆预算,越来越现实。当能力在变便宜,先把它用起来的人就能拉开身位。

对个人,今天有三个很具体的动作。第一,开始攒你自己的 skill:把你在某个领域反复踩过的坑、反复用的判断(像 Karpathy 那样)写成一份 CLAUDE.md 或一个 skill,它会持续帮你和你的 agent 省时间,本身也是个能分享、能传播、甚至能变现的资产。第二,把注意力从『追最大的模型』转到『用最省的方式把活办成』:TimesFM 这种小而专的基础模型、GPT-5.6 这种主打省 token 的 agent 模型,都在告诉你——能用更小更省的组合把一件具体事跑起来,比堆参数更值钱,尤其当你要让它长期、批量地干。第三,把这套能力对准一个能收钱的痛点:palmier-pro 用 AI 重做视频剪辑、Glitter AI 用 AI 帮小微企业把流程写成 SOP 收月费,都是同一个公式——找一个具体到一个行业、一个工序的真实麻烦,用现在便宜了的 AI 把它做成稳定能交付的东西。模型在变便宜、经验在变成标准件,普通人真正的窗口,是趁现在把『我的判断 + 省钱的 AI + 一个具体痛点』这三件事拼起来。

Type
Track
Source
Repo DevTools
ht ht ht
2d streak
#1 multica-ai/andrej-karpathy-skills ★ 约18万 ▲ +约4.3K(本周 Trendshift/GitHub Trending 在榜,靠 Karpathy 名号与实用性快速扩散)/w
一个几乎只包含一份 CLAUDE.md 的仓库,把 Andrej Karpathy 关于『大模型写代码常犯的毛病』的观察,提炼成四条可被 Claude Code、Cursor 等直接加载的指导原则,用来当场纠正 coding agent 的坏习惯。可作为 Claude Code 插件(`/plugin marketplace add` 后安装),也可直接下载这份文件加进你项目的 CLAUDE.md。约 18 万星,是本周最反直觉的一个 GitHub 热门项目——没有代码、没有模型,只有一份『把资深经验写下来』的提示词。
这个仓库火得很说明问题:它没有任何代码或模型,本质上就是一份高质量的『给 agent 立规矩』的文档,却冲到约 18 万星。它针对的是每个用 AI 写代码的人都遇到过的痛点——模型会替你乱做假设还不吭声、爱把简单问题过度抽象、改 A 的时候顺手动坏了 B、不该改的注释和代码也乱删。Karpathy 的解法被归纳成四条原则:①想清楚再写——不确定就显式列出假设、给出多种理解、先问再做;②能简则简——只写解决眼前问题的最少代码,不加没要求的灵活性和抽象;③手术刀式改动——只改这次任务必须改的,匹配既有风格,只删因你改动而失效的代码,不碰原有的死代码;④目标驱动循环——把命令式指令改写成『定义可验证的成功标准,然后循环直到达成』。它能爆火,印证了一个判断:模型已经足够强,真正拉开差距的是『你有没有把好的工程判断喂给它』。
Key Points
  • **没代码却18万星**:仓库核心只是一份 CLAUDE.md,靠『把资深判断力写成可加载规则』本身就能成为硬通货——稀缺的不是模型,是经验
  • **四条治本原则**:想清楚再写 / 能简则简 / 只做手术刀式改动 / 目标驱动循环验证,正好对治大模型乱假设、过度抽象、误删代码三大毛病
  • **一键挂载到 agent**:既可作 Claude Code 插件安装,也能直接把这份文件并进你项目的 CLAUDE.md,立刻生效、零成本试
💡 对普通人,这个项目给的最大启发是:你完全可以、也应该开始攒『自己的 skill』。Karpathy 把他多年踩坑总结成四条原则,就值 18 万星;你在自己最熟的那个领域——不管是写某种代码、做某类设计、跑某个业务流程——一定也有一堆『AI 默认会做错、得提醒它别这样』的经验。把这些写成一份 CLAUDE.md 或一个 skill,它会持续帮你和你的 agent 省时间、提质量,而且这份积累是可分享、可传播、甚至可以做成产品或带来个人影响力的资产。更深一层的信号是:当模型变成商品,价值就上移到『你往里灌了什么判断』——会把领域经验结构化成 agent 能用的规则,正在成为 AI 时代一项门槛不高、回报却很实的元能力。现在就动手,把你脑子里那些『AI 总是搞错的地方』写下来,是今天就能开始的复利投资。
Repo LLM/Model
ht ht ht
NEW
#2 google-research/timesfm ★ 约2.5万 ▲ +约数百(本周随 2.5 版迭代与 LoRA 微调、SKILL.md 支持重回 Trending)/w
Google Research 开源的『时间序列基础模型(Time Series Foundation Model)』。它把基础模型那一套从语言迁移到了预测:用一个预训练好的通用模型,对销量、负载、库存、流量等任意时间序列做零样本/少样本预测,不必每个场景从头训练。最新的 2.5 版把参数压到 200M、上下文拉到 16K、预测步长可达 1K,并支持通过 HuggingFace+PEFT 做 LoRA 微调;还配了一份 SKILL.md,让 Claude Code 等 MCP agent 能像调工具一样直接调用它。可在 PyPI、HuggingFace、BigQuery ML、Google Sheets、Vertex AI 上跑,约 2.5 万星。
TimesFM 代表了一个容易被语言模型热度盖过、却很实在的方向:基础模型正在『万物化』,预测这种过去高度依赖定制建模的活,也开始有了通用底座。它的反直觉之处在于——2.5 版不是越做越大,而是把参数从 500M 降到 200M、还把上下文拉到 16K,性价比和易用性同时上升。更值得注意的是它在 2026 年的两个动作:一是支持 LoRA 微调,让你能用自己的数据低成本把它调到自家场景;二是写了 SKILL.md,把『怎么调用这个模型』变成机器可读、agent 可直接加载的技能——这意味着『预测未来一周的销量/客流/服务器负载』正在从『找个数据科学家建模』变成『让 agent 调一个现成基础模型』。它和今天 Karpathy skills 是一条线:能力都在被封装成可调用的标准件。
Key Points
  • **预测也有基础模型**:一个预训练通用模型零样本预测任意时间序列,省掉每个场景从头建模——把『预测』变成调用即用的能力
  • **更小更省**:2.5 版参数降到 200M、上下文拉到 16K,支持 LoRA 微调,能在 PyPI/HuggingFace/BigQuery/Sheets/Vertex 多处低成本跑
  • **配了 SKILL.md**:把调用方式写成 agent 可读的技能,Claude Code 等 MCP agent 能直接调它做预测——基础模型正在被『技能化』
💡 对普通人,TimesFM 的实在意义是:『预测』这件过去要数据科学背景才碰得动的事,正在变成你也能调用的现成能力。开个小店想预测下周备多少货、做运营想估下个月的流量、管服务器想提前知道负载峰值——以前要么靠拍脑袋,要么得请人建模;现在你可以拿一个开源基础模型,喂上自己的历史数据,甚至用 LoRA 简单微调,就能得到像样的预测,再借它的 SKILL.md 让 agent 自动帮你跑。更值得记住的是它示范的趋势:基础模型不会只停在聊天,它在向预测、操作、各类专业任务扩散,而且越来越小、越来越省、越来越能被 agent 直接调用。谁先意识到『我这个行业里某个靠经验拍脑袋的判断,现在能换成一个基础模型来做』,谁就能在自己的小生意或工作里先吃到这波红利。
Article LLM/Model
ht ht ht
NEW
by OpenAI(2026 年 6 月发布,延续约六周一迭代的节奏,接棒 4 月的 GPT-5.5)
GPT-5.6 是 OpenAI 六月发布的新版本,最值得注意的不是它又聪明了多少,而是它把火力几乎全压在了『让 agent 长期、便宜地干活』上。相比 4 月的 GPT-5.5,它在单轮对话质量上并非大跃进,重点全在三处:token 效率再提约 10–15%、上下文扩到约 1.5M、以及长时间自主任务和 Codex 电脑操作(Computer Use)的多小时任务完成率明显提升。它已成为 ChatGPT 付费档与 OpenAI API 的新默认模型,并提供偏重推理的 GPT-5.6 Pro 变体,同时进入 Codex、Azure OpenAI、ChatGPT Atlas 浏览器等。这条新闻的信号比『又一个更强模型』更重要:头部厂商的竞争重心,已经从『聊天多惊艳』转向『让 agent 连续办几小时事、且每一步都更省钱』——这正是把 agent 真正用起来的关键瓶颈。
Key Points
  • **主攻省钱而非更聪明**:token 效率较 5.5 再提约 10–15%,明确为『让 agent 长期、批量地跑而不烧爆预算』服务
  • **长时任务 + 电脑操作**:把火力放在多小时自主任务完成率和 Codex Computer Use 上——衡量的是『能不能真办成事』,不是『聊得好不好』
  • **1.5M 上下文 + 新默认**:上下文扩到约 1.5M,已成 ChatGPT 付费档与 API 新默认,另有偏推理的 5.6 Pro 变体
💡 GPT-5.6 对普通人的信号很清晰:决定你能不能把 AI 真正用起来的,越来越不是模型『聪明不聪明』,而是『让它连续干活到底贵不贵』。当头部厂商把版本更新的重点放在 token 效率和长时间自主任务上,说明大家公认的瓶颈已经从『质量不够』变成了『成本和续航不够』。对想用 agent 替自己干活、或想做 AI 小产品的人,这是好消息也是提醒:好消息是让 agent 跑几个小时的自动化流程正变得越来越划算;提醒是——你的竞争力会越来越体现在『会不会省着用』:把任务拆细、用便宜模型干粗活、只在关键步骤上贵模型、复用上下文和缓存。换句话说,2026 年的实用功夫不在『追最新最强』,而在『把一件具体的活,用最省的模型组合稳定地跑完』——这是任何想靠 AI 提效或赚钱的人都该尽早练的成本直觉。
Repo AI App
ht ht ht
NEW
#4 palmier-io/palmier-pro ★ 约5K ▲ +约3.9K(本周新增星数占绝大多数,星速高,Trendshift 周榜在榜)/w
一个『从头为 AI 设计』的开源 macOS 视频剪辑器(Swift 原生)。它不是给老剪辑软件外挂一个 AI 插件,而是把 AI 当成第一公民来重做剪辑这件事——本周约 5K 星里有近 3.9K 是这一周新增的,星速很猛,是本周冒头很快的 AI 原生应用之一。
palmier-pro 的看点不在某个具体功能,而在它的姿态:它是少数『为 AI 重新设计、而不是给旧软件贴 AI 补丁』的应用之一。过去十年的视频剪辑软件,AI 都是后来加的插件;而它从架构上就把『让 AI 理解素材、自动剪辑、用自然语言指挥』当成核心交互。一个原生 macOS 剪辑器能在一周内涨近 3.9K 星,说明两件事:一是创作者对『AI 原生的生产力工具』有强烈需求,二是单兵/小团队靠 AI 把一个老品类重做一遍,依然能在 2026 年快速获得关注。它和今天其它几条合起来给出同一个判断:能力(模型)变便宜之后,价值回到了『谁能围绕一个具体场景,把 AI 原生的体验做扎实』。
Key Points
  • **为 AI 重做,而非外挂插件**:把 AI 当第一公民重新设计视频剪辑的交互,而不是给老软件加个 AI 按钮
  • **一周 +3.9K 星**:约 5K 总星里近 3.9K 来自本周,星速很高,反映创作者对 AI 原生生产力工具的真实渴求
  • **原生 macOS / Swift 开源**:单兵或小团队也能切入、可学习其架构,示范了『小团队重做老品类』在 AI 时代依然成立
💡 palmier-pro 对普通人的启发是一个很实在的产品方向:去找那些『AI 还只是被当插件外挂』的老软件品类,用 AI 原生的思路把它重做一遍。视频剪辑、文档、表格、笔记、设计……这些工具大多诞生在 AI 之前,AI 都是后补的;而当模型变便宜、能力变强,从头按『AI 是核心交互』来设计的新一代工具,往往能给出老软件给不了的体验,也就有机会抢下用户。它还说明:在 2026 年,单兵或小团队靠把一个具体品类做扎实,依然能快速获得关注和早期用户——你不需要做通用大模型,只需要在一个你熟悉、且 AI 化程度还低的细分场景里,做出第一个真正『AI 原生』的好用工具。先选一个你自己天天用、又被 AI 改造得还不够的工具,就是个好起点。
Product 小微现金流
ht ht ht
NEW
#5 Glitter AI:用 AI 帮小微企业把『没人写下来的流程』变成 SOP,按月收费的垂类微 SaaS 团队版约 $75/月(含 5 个创建者席位,查看者不限——只有真正写 SOP 的人需要付费席位) 值得关注
by Glitter AI(创始人 Yuval;客户以 1–50 人的小微企业为主)
Glitter AI 切的是小微企业一个很真实、很憋屈的痛点:老板想把活分出去、想招人接手,却发现『所有流程都只在自己脑子里、没人写下来』,一招人就得从头口述、错漏百出。它用 AI 把『把一件事怎么做』自动整理成图文并茂、可复用的标准作业流程(SOP)——你把操作走一遍,工具帮你转成带步骤、带截图的文档,几小时的整理压缩到几分钟。商业模式很『小而稳』:按月收费、面向 1–50 人的小公司、团队版约 $75/月且只对创建者收费查看者免费,毛利结构健康、续费理由清晰(流程文档是会持续用、持续更新的资产)。它代表了一类很适合个人/小团队做的现金流路子:不追性感的 AI 概念,而是用 AI 去解决某个具体行业/工序里『记录与交接』这种又烦又费时的脏活。
Key Points
  • **对准真痛点**:小微企业『流程全在老板脑子里、没法交接』是普遍刚需,AI 把『走一遍操作』自动转成图文 SOP,几小时变几分钟
  • **模式小而稳**:约 $75/月、只对创建者收费、查看者免费,面向 1–50 人小公司,续费理由清晰(SOP 是持续使用的资产)
  • **可复制的打法**:垂类微 SaaS——不做通用大模型,只把『某类企业的某个脏活』用 AI 做扎实,个人/小团队就能跑起来
💡 对想靠 AI 挣点现金流的普通人,Glitter AI 是一个值得照着学的模板:别去追『又一个 AI 助手』,去找小微企业里那些『又烦、又费时、又没人愿意干、但不干就出错』的脏活——写 SOP、整理交接文档、记录操作流程就是典型一类。这类活的特点是:客户痛得真实(招人/带新人/交接时立刻就疼)、愿意持续付费(文档要常更新)、而 AI 现在恰好能把它从几小时压到几分钟。你甚至不一定要做产品:可以先用现成 AI 工具,给本地几家小公司提供『帮你把核心流程文档化』的服务收费,跑通需求再考虑产品化。它的可复制性正在于『垂直、具体、脏活』——选一个你熟悉的行业(餐饮、诊所、电商客服、装修……),把那个行业里最让人头疼的记录/交接环节用 AI 包成一个稳定能交付的小服务或微 SaaS,就是一条门槛不高、客户付费意愿明确的现金流路子。
My Take 评分(5=最优):最快成交 3 / 最低成本 4 / 可复制 4 / 风险安全度 4。把『帮小微企业把脑子里的流程写成 SOP』用 AI 做成月费微 SaaS 或代做服务,痛点真实、续费清晰、个人可起步的垂类现金流路子。