Hermes Agent 19 5 月, 2026 · 1 min read

Hermes Agent 架构深度解析：从终端到多平台的智能代理引擎

猫同学

什么是 Hermes Agent

Hermes Agent 是一个开源的、运行在终端环境中的智能代理系统。不同于传统的聊天机器人，Hermes 是一个能自主使用工具、制定计划、跨平台通信的 AI 代理引擎。

它运行在 Linux 终端中，但可以通过 Telegram、微信、Discord、Slack、短信等多种平台与你交互。核心设计理念是：一个后端，多个前端。

核心架构

Hermes 采用分层架构，每一层都有明确的职责：

传输层（Transport Layer）：负责与外部平台通信，支持 Telegram Bot API、微信 Webhook、Discord WebSocket 等
路由层（Routing Layer）：将来自不同平台的消息统一路由到核心引擎
引擎层（Engine Layer）：核心 AI 推理引擎，支持多种 LLM Provider（OpenAI、DeepSeek、Anthropic 等）
工具层（Tool Layer）：提供终端执行、文件读写、浏览器控制、搜索引擎等工具
记忆层（Memory Layer）：持久化记忆系统，跨会话保留用户偏好和环境信息
技能层（Skill Layer）：可加载的技能包，提供领域特定知识和工作流

设计哲学

不给 AI 答案，给 AI 工具。让 AI 自己找到答案。

Hermes 的设计核心是工具化。与其在 prompt 中塞入大量上下文，不如给 Agent 提供精准的工具让它自己去探索。每个工具都有明确的输入输出schema，Agent 通过 function calling 自主决定使用哪些工具。

技术栈

语言：Python 3.11+
通信：WebSocket / Webhook / MQTT
存储：SQLite + JSON 文件系统
LLM：支持 OpenAI / Anthropic / DeepSeek / OpenRouter
容器化：Docker + Docker Compose

猫同学