tmp-record


https://github.com/rlancemartin/claude-diary原文章https://rlancemartin.github.io/2025/12/01/claude_diary/

● ✅ Claude Diary 本机构建完成!

安装结果

已成功安装的组件:

  1. 命令文件:
    - ~/.claude/commands/dairy.md - 日记生成命令
    - ~/.claude/commands/reflect.md - 模式反思命令
  2. 钩子系统:
    - ~/.claude/hooks/pre-compact.sh - 自动日记生成钩子(已设置执行权限)

使用方法:

现在可以在 Claude Code 中使用以下命令:

手动创建当前会话的日记条目

/diary

分析日记条目并更新 CLAUDE.md

/reflect

带选项的反思命令

/reflect last 10 entries
/reflect from 2025-01-01 to 2025-01-31
/reflect for project /path/to/project
/reflect related to testing

自动化功能:

  • PreCompact 钩子:当会话达到 200+ 条消息准备压缩时,会自动触发 /diary 命令生成日记条目

存储位置:

  • 日记条目:~/.claude/memory/diary/YYYY-MM-DD-session-N.md
  • 反思文档:~/.claude/memory/reflections/YYYY-MM-reflection-N.md
  • 处理日志:~/.claude/memory/reflections/processed.log

系统现在已经准备好开始学习你的开发模式和偏好了!你可以通过运行 /diary 来开始记录当前会话。

下面我给你一套系统、可落地、可长期复用的Agent SDK 学习方法论,适用于 LangChain、Qwen Code TypeScript SDK、LlamaIndex、ModelScope-Agent 等所有智能体框架。内容偏“工程实战 + 架构理解”,能帮助你快速掌握 SDK、本质能力、设计理念和最佳实践。


一、学习 Agent SDK 的总体路线图(从外到内、从用到懂)

学习智能体 SDK 的正确顺序,不是 API 从头念到尾,而是:

阶段 1:掌握基本使用(能跑)

目标:能写出最小可用 Demo,并理解其核心结构。

核心任务:

  1. 会用模型(LLM/Embedding/Code LLM)
  2. 会用 Prompt、Memory、Tools(或 Functions)
  3. 能构建一个最小的 Agent(ReAct、Tool Calling、Code Interpreter)

你可以用 1 天时间完成这些,避免卡在概念上的停滞。


阶段 2:理解框架设计(能扩)

目标:理解为什么要这样设计,如何扩展自定义模块。

核心内容:

  1. LangChain:Runnable、LCEL、Tool、OutputParser、AgentExecutor
  2. Qwen Code TS SDK:Agent、Step、Tool、Message Stream、Code Interpreter Runtime
  3. 工具调用机制(OpenAI function calling / JSON Schema)
  4. 任务规划(ReAct / Plan-Execute)
  5. Agent 的结构化输入输出

这阶段的重点是理解“链式调用”和“工具执行生命周期”。


阶段 3:深入工程落地(能上生产)

目标:掌握 agent 在生产中的能力和限制。

重点技能:

  1. 并发与任务调度
  2. 状态管理(Memory / Checkpoint)
  3. 安全控制(工具权限、沙箱、代码执行限制)
  4. 观测能力(Tracing、Telemetry、调用链分析)
  5. 可测试性(模拟工具、Mock LLM)

这是把 SDK 变成“系统能力”的关键阶段。


阶段 4:掌握框架底层原理(能改)

目标:能理解并调整 SDK 内部机制,能写自定义工具链。

学习点:

  1. LLM 推理模式(ReAct、CoT、Plan-Execute、Self-Refine)
  2. Tool 调度和 Agent Loop 实现机制
  3. 流式输出(SSE / WebSocket)实现原理
  4. 沙箱和代码解释器实现原理(Qwen Code 强项)
  5. 上下文管理与 Token 预算控制策略

这个阶段让你能从“用框架”转到“创造框架”。


二、学习 Agent SDK 必备的能力(核心技能清单)

技能 1:Prompt Engineering(提示工程)

必须掌握:

  • 系统提示词 (System Prompt) 的结构化写法
  • 工具使用示例提示(非常关键)
  • 角色扮演式智能体构建
  • 多智能体协作的提示方式(planner/executor)

技能 2:Tool / Function Calling 设计

你需要理解:

  • 什么时候需要工具,而不是 LLM 直接回答
  • 工具应如何拆分(单一职责原则)
  • 工具输入输出的 JSON Schema 规范
  • 工具安全边界(避免文件系统/命令注入)

这是 Agent 的灵魂技能。


技能 3:代码解释器 / 沙箱执行的理解

特别在 Qwen Code 中非常重要:

要掌握:

  • 代码执行生命周期(准备、运行、输出捕获、资源清理)
  • Python/JS 沙箱模型
  • 文件系统隔离
  • 如何通过工具暴露文件、网络、数据库访问(安全前提下)

技能 4:状态管理 / Memory

你要理解:

  • 短期记忆 vs 长期记忆
  • LangChain Memory 与 Checkpointing 的区别
  • Qwen Code 的多轮数据传递机制
  • 如何构建可回溯的 Agent 过程

技能 5:可观测性(Observability)

生产级 Agent 必备:

  • LangSmith(LangChain 官方观测平台)
  • OpenTelemetry 集成
  • Token 成本分析
  • 工具执行日志链路

技能 6:程序化思维(Agent as Software)

SDK 的核心思想:Agent 不是 Prompt,而是软件系统

需要掌握:

  • 模块拆分
  • 接口/工具规范化
  • 可测试性(Mock LLM)
  • 多 Agent 架构(Planner / Worker / Critic)

三、适用于 LangChain 和 Qwen Code 的统一学习方法论

下面这套方法论,你可以反复用于任何 Agent SDK。


方法论 1:从“写一个功能”开始,不要从 API 学起

比如目标是:

写一个能爬网页、分析内容并生成总结的 Agent。

你会自动用上:

  • LLM
  • Tool
  • Memory
  • Streaming
  • Agent Loop

比看文档有效 10 倍。


方法论 2:从“任务流图(Chain Graph)”理解框架

所有 Agent SDK 本质上都是:

Input
-> Parse -> Tool Select -> Tool Execute -> Reasoning -> Output

如果你能画这个图,就能看懂任何 SDK。


方法论 3:阅读一个优秀的开源项目并复刻它

最佳示例:

LangChain

  • LangGraph
  • LCEL Pipelines
  • ReAct Agent 实现源码

Qwen Code TypeScript SDK

  • 官方 examples:具有完整 agent+tool+code interpreter 的范例
  • Code Interpreter 的 sandbox 实现

阅读这些比看文档有效多了。


方法论 4:把 SDK 压缩到一个最小可控模型(MiniAgent)

你可以自己动手写一个 200 行左右的 “迷你 Agent 框架”,理解其核心是:

  1. 让 LLM 解析意图
  2. 结构化输出 Tool 调用
  3. 调用 Tool 并返回结果
  4. 循环直到返回自然语言答案

理解了这个,你可以学会任何框架。


方法论 5:刻意训练工具开发能力

每天做 3 个小工具,包括:

  • 文件读写
  • 网页爬虫
  • 数据库读写
  • 代码执行
  • 报表生成

Agent 的强大,100% 来自工具库的丰富度。


四、至少需要掌握的技能清单(工程级)

总结如下,是你最低要掌握的清单:

基础能力

  • JavaScript/TypeScript
  • Python(如果要用 Code Interpreter)
  • 基本后端技能(API、DB、HTTP)

Agent 核心技能

  • Prompt 结构化设计
  • JSON Schema /工具设计
  • Tool-Calling 机制
  • 代码执行沙箱理解
  • 推理模式(ReAct、Plan&Execute)

框架相关能力

  • LangChain Runnable / LCEL
  • LangGraph(状态机 Agent)
  • Qwen Code Interpreter API
  • Streaming + SSE/WebSocket

工程化必备

  • 监控 & 调试 & Token 分析
  • 多 Agent 协作模式
  • 安全机制(工具权限、执行隔离)
  • 高并发代理调度

如果你愿意,我可以为你制定:

  1. LangChain + Qwen Code SDK 的 7 天速成计划
  2. 长期 Agent 架构训练路线图
  3. 你当前能力的差距评估与强化建议
  4. 打造你自己的 Agent SDK(MiniAgent)

你想从哪一项开始?


文章作者: huhuhuhr
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 huhuhuhr !
  目录