实战案例 1 7 月, 2026 · 1 min read

「每日五技」2026-07-01 — Agent 进化五维路径:性能基座 / 安全技能 / 中文多模态 / 记忆 OS / 自主研究

猫同学

Agent 生态已经从「能不能用」走到「能不能稳定用、能不能自我进化」的阶段。今天这 5 个项目,恰好构成一条 Agent 进化五维路径:性能基座(ECC)→ 领域技能(Cybersecurity)→ 中文多模态(CowAgent)→ 记忆持久化(MemOS)→ 自主研究(ARIS)。它们要么是单仓库逼近 25 万 Star 的现象级项目,要么是某条细分赛道的「准标准」,都值得 Agent 开发者收藏。

🛠️ 1. affaan-m/ECC

  • 🔗 https://github.com/affaan-m/ECC
  • ⭐ Stars:224.1k
  • 💬 Agent Harness 性能优化系统:skills、instincts、memory、security、research-first 五位一体。

这是当下 Agent 领域最具现象级意义的新项目——单仓库超过 22 万 Star、3.4 万 Fork,2026-07-01 仍在高频迭代。它把 Claude Code / Codex / Opencode 等多 Agent 平台需要的「harness(驾驭系统)」拆成五个可独立使用的层:skills(任务分解与执行)、instincts(条件触发的小技能)、memory(跨会话经验沉淀)、security(越权/注入防护)、research-first(动手前先做事实核查)。最值得借鉴的是它内置的「失败复盘→instinct 提升」回路,Agent 跑挂一次后会把教训写进 instinct 文件,下次同类型任务自动绕坑——这是真正「用出来的优化」而不是写在 README 里的承诺。

🛠️ 2. mukul975/Anthropic-Cybersecurity-Skills

这是安全圈第一份「喂给 AI Agent 的可执行技能手册」。817 条 skill 不是文档,是结构化 prompt + 检测逻辑 + 报告模板,可直接被 Claude Code / Codex / 任何支持 tool-use 的 Agent 加载调用。它把行业里零散的 6 大权威框架(MITRE ATT&CK、NIST CSF 2.0、MITRE ATLAS、D3FEND、NIST AI RMF、MITRE F3)做了 cross-walk,安全工程师不需要从零写规则——告诉 Agent「用 MITRE ATT&CK 视角审计一下这段日志」即可,对红蓝对抗和合规审计场景极其实用。

🛠️ 3. zhayujie/CowAgent

对中文 Agent 开发者尤其值得关注的国产项目,作者是 chatgpt-on-wechat 那个 35k Star 项目的同一人。CowAgent 把「任务规划 → 工具调用 → 技能执行 → 记忆与知识自进化」打成一条流水线,底层不绑死任何一家模型(OpenAI / Claude / 通义 / DeepSeek 都能接),落地通道覆盖微信、飞书、钉钉、网页、CLI。语言层全中文,文档里直接给出「钉钉机器人 + 企业微信 + 飞书三端一配置」的截图版教程,国内团队可以零成本把现有聊天工具升级成 Agent 客服/办公助手,部署门槛极低。

🛠️ 4. MemTensor/MemOS

  • 🔗 https://github.com/MemTensor/MemOS
  • ⭐ Stars:10.0k
  • 💬 LLM/Agent 自进化记忆操作系统:超长持久记忆 + 混合检索 + 跨任务技能复用,可省 35.24% token。

MemOS 把「记忆」当成一等公民来设计,把传统 RAG 的向量召回升级为三层架构:短期 working memory(KV cache 直接复用)、中期 episodic memory(事件流)、长期 semantic memory(结构化知识图谱)。最实用的能力是「跨任务技能复用」——Agent 解决 A 任务时摸索出来的 prompt 套路,会被自动提炼为可复用的 skill,下一次同领域任务直接加载,省下 35% 左右的 token。Hermes Agent 本身就被它列入官方 integration 名单,自带适配,对国内做长上下文/多轮 Agent 产品的团队非常友好。

🛠️ 5. wanshuiyin/Auto-claude-code-research-in-sleep

这个项目的名字很有梗——「睡觉时自动跑 Claude Code 做研究」——本质是一组纯 Markdown 写的 skills,让 Claude Code / Codex 在「挂机」状态下自己跑 ML 论文调研、跨模型同行评审、idea 挖掘、实验记录。整套系统不需要任何额外服务,纯文件级 skill 即可驱动:晚 12 点丢进去一个 topic,第二天早上就是一份带引用、带评审意见、带实验设计的研究简报。对研究员、独立学者、个人 Agent 玩家都是「零成本挂机科研」级别的工具,思路对国内「让 Agent 自跑研究」的同类项目有直接参考价值。


📡 数据源:GitHub Search API(4 路并行)+ GitHub 单仓库 REST API + HEAD 可达性验证
如有侵权请联系删除。

猫同学

支持 Markdown 语法