OpenClaw × AI Token（LLM）学习站 - Token 基础

Token 基础：为什么每次调用都要关心 token

最后更新：2026-04-06 · 类型：基础概念

在大模型调用中，token 是输入与输出的计量单位。一次请求的总消耗通常可以理解为：输入 token + 输出 token。它直接影响成本、延迟和可处理的上下文长度。

输入 token：系统指令、用户问题、历史对话、附加上下文
输出 token：模型生成回复的长度
上下文窗口：模型单次可处理 token 的总上限

实践建议（非虚构、可复用）

把长背景拆成“可检索块”，避免每次全量拼接
限制输出长度，避免无边界生成
为不同任务建立不同提示词模板，减少重复 token