Claude API价格怎么算?输入输出token 怎么看

很多新手第一次用 Claude API,最容易搞混的就是 Claude API价格怎么算?输入输出token 怎么看

因为 API 不是像 Claude Pro、Max 那样按月订阅,而是按 token 计费。你发给模型的内容要算钱,模型回复你的内容也要算钱,而且一般来说,输出 token 比输入 token 更贵

如果你只是偶尔聊天,可能感觉不到 token 成本;但如果你用 Claude API 做开发、接 Claude Code、跑 AI Agent、处理长文档、分析代码库,token 成本就会很明显。

国内用户如果直接用官方 API,还可能遇到账号、支付、KYC、风控等问题。如果只是想稳定调用 Claude 正版模型,可以考虑用稳定的正版 API 中转站,比如 FastApi。FastApi 提供 Claude 正版模型接口,不是共享号、薅羊毛、拼额度产品,更适合稳定体验满血 Claude。官方优惠邀请码是 666777

Claude API价格是怎么计算的?

Claude API 通常按照 输入 token + 输出 token 分开计费。

简单理解:

输入 token:你发给 Claude 的内容。
输出 token:Claude 回复你的内容。

比如你问 Claude:

“帮我分析这段代码有没有问题。”

你发过去的这句话,加上系统提示词、上下文、代码内容、历史对话,都会算输入 token。

Claude 回复你的分析、代码建议、修改方案,都会算输出 token。

所以 API 成本不是只看你问了几次,而是看每次请求里有多少输入、多少输出。

输入token包括哪些内容?

输入 token 不只是你最后打的那句话。

它通常包括:

系统提示词;
用户问题;
历史上下文;
代码文件内容;
文档内容;
工具调用信息;
Claude Code 读取的项目上下文;
你传入的长日志、长文章、长表格。

这也是为什么 Claude Code、AI Agent、知识库问答更容易消耗 token。

因为它们不是只发一句话,而是会把很多上下文一起发给模型。

比如你让 Claude Code 分析一个项目,它可能会读取目录结构、关键文件、报错日志、历史讨论内容,这些都会变成输入 token。

输出token包括哪些内容?

输出 token 就是 Claude 返回给你的内容。

比如:

文字回答;
代码片段;
修改建议;
完整文件内容;
测试用例;
文档说明;
Agent 执行计划;
长篇分析报告。

输出越长,费用越高。

很多 Claude API 模型的输出价格明显高于输入价格。比如 Anthropic 官方页面显示,Claude Opus 4.7 的价格从 输入 $5 / 100万 tokens,输出 $25 / 100万 tokens 起;也就是输出价格是输入的 5 倍。官方还提到 prompt caching 最高可节省 90%,batch processing 可节省 50%。

所以用 API 时,不要动不动让模型“完整重写全部代码”“输出完整项目方案”“生成一大篇文档”。

输出越长,成本越容易上来。

Claude API常见模型价格大概是多少?

不同模型价格不同。根据近期 Claude API 价格整理,当前常见 Claude 模型大致可以这样理解:

Claude Haiku 4.5:输入约 $1 / 100万 tokens,输出约 $5 / 100万 tokens。
Claude Sonnet 4.6:输入约 $3 / 100万 tokens,输出约 $15 / 100万 tokens。
Claude Opus 4.7:输入约 $5 / 100万 tokens,输出约 $25 / 100万 tokens。

这个价格结构很容易记:越强的模型越贵,输出通常比输入贵很多。

所以不同任务应该选不同模型。

简单分类、摘要、字段提取,用 Haiku。
日常写代码、解释报错、生成测试,用 Sonnet。
复杂架构分析、长代码理解、疑难 Bug、Agent 规划,用 Opus。

如果所有任务都用 Opus,成本会明显高很多。

举个例子:一次Claude API调用多少钱?

假设你调用 Claude Sonnet 4.6,价格按输入 $3 / 100万 tokens,输出 $15 / 100万 tokens 来算。

一次请求:

输入 10,000 tokens
输出 2,000 tokens

成本大概是:

输入成本:10,000 / 1,000,000 × 3 = $0.03
输出成本:2,000 / 1,000,000 × 15 = $0.03

总成本:$0.06

看起来不贵。

但如果你一天调用 500 次,就是 $30 左右。
一个月 30 天,就是 $900 左右。

这就是为什么 API 成本不能只看单次调用。高频开发、Agent、批量处理,成本会累计得很快。

再举个Claude Code的例子

你用 Claude Code 分析项目。

一次任务可能包括:

项目目录结构;
几个关键代码文件;
一段报错日志;
你的需求描述;
Claude 的修改方案;
生成的代码;
后续检查建议。

假设输入 80,000 tokens,输出 10,000 tokens。

如果用 Claude Sonnet 4.6:

输入:80,000 / 1,000,000 × 3 = $0.24
输出:10,000 / 1,000,000 × 15 = $0.15
总计:约 $0.39

如果用 Claude Opus 4.7:

输入:80,000 / 1,000,000 × 5 = $0.40
输出:10,000 / 1,000,000 × 25 = $0.25
总计:约 $0.65

单次看不夸张,但如果你每天跑几十次 Claude Code 任务,成本就不低了。

所以 Claude Code 不建议无脑用 Opus,日常开发用 Sonnet 会更合适。

token 怎么看?怎么估算?

token 可以简单理解成模型处理文本的基本单位。

它不完全等于中文字数,也不完全等于英文单词数。

粗略估算:

中文通常一个字可能接近 1 个 token 左右,但具体会变。
英文通常一个单词可能拆成 1 个或多个 token。
代码、JSON、标点、空格也会占 token。
长路径、变量名、Base64、日志内容可能更费 token。

新手可以用一个粗略方法估算:

短问题:几十到几百 tokens。
一篇普通文章:几千 tokens。
一个长代码文件:几千到几万 tokens。
一个项目上下文:可能几万到几十万 tokens。
Claude Code 多轮任务:可能累计更多。

如果平台提供 token 统计,就看平台后台。
如果是官方 API,可以通过使用记录、成本统计、Usage 页面或相关 API 查看。Anthropic 官方文档说明可以用 Usage and Cost API 查看 token 使用、成本、用量模式,并用于成本核对和优化。

如果使用 FastApi 这类中转站,也建议看平台后台是否提供调用记录、消耗统计和模型用量信息。

为什么输出token更贵?

简单理解,模型生成内容比读取内容更“耗资源”。

输入阶段主要是理解你给的内容。
输出阶段是模型一步步生成回复。

所以很多 Claude 模型的输出价格是输入价格的 5 倍左右。

这对使用方式影响很大。

你让模型:

“完整重写这个文件”
“生成 20 个方案”
“写一篇 5000 字文章”
“输出完整项目代码”
“把所有测试用例都写出来”

输出成本都会上升。

更省钱的问法是:

“先列出问题,不要修改代码。”
“只输出需要改的函数。”
“只给核心代码片段。”
“用表格总结,不要展开长篇解释。”
“先给方案,我确认后再生成代码。”

这样能明显减少输出 token。

Claude API怎么控制成本?

第一,不要所有任务都用最贵模型

这是最重要的。

Haiku 适合轻量任务。
Sonnet 适合日常开发。
Opus 适合复杂任务。

很多人 API 成本高,不是因为 Claude 贵,而是模型用错了。

第二,减少无效上下文

不要每次都把完整项目、完整文档、完整日志塞给模型。

更好的方式是:

先给目录结构;
再给关键文件;
让模型先判断需要哪些信息;
只补充必要上下文。

第三,控制输出长度

输出通常更贵。

可以在 prompt 里明确说:

“不要长篇解释。”
“只输出关键修改点。”
“最多 5 条建议。”
“不要生成完整文件。”
“先不要写代码,只分析原因。”

第四,利用缓存

如果你有固定系统提示词、固定项目背景、固定文档,可以使用 prompt caching。

Anthropic 官方 Opus 页面提到 prompt caching 最高可节省 90%。

缓存适合重复使用的大段上下文。

第五,用 Batch 处理非实时任务

如果任务不需要实时返回,可以用 batch processing。

官方页面提到 batch processing 可节省 50%。

比如批量摘要、批量分类、批量提取字段,就适合批处理。

第六,做好日志和限流

如果是团队或产品接入,一定要记录:

谁调用;
调用哪个模型;
输入多少;
输出多少;
任务类型;
是否失败;
耗时多少。

没有日志,就不知道钱花在哪里。

官方API和中转站价格怎么看?

官方 API 一般按官方模型价格计费,价格结构更透明,但国内用户可能会遇到账号、支付、KYC 和风控问题。

中转站一般会在自己的平台上显示价格、倍率或额度消耗方式。不同平台计算方式不同,有些按 tokens,有些按倍率,有些按余额扣费。

选择中转站时,不要只看便宜。

要看:

是不是 Claude 正版模型;
是否支持 Opus、Sonnet、Haiku;
是否有调用记录;
是否有消耗明细;
接口是否稳定;
是否适合 Claude Code 和 Agent;
是不是共享号或薅羊毛产品。

FastApi 提供 Claude 正版模型接口,不是共享号、薅羊毛产品,比较适合国内开发者稳定体验 Claude。官方优惠邀请码 666777

不同场景怎么选模型最划算?

普通聊天和轻量任务

选 Haiku。

适合摘要、分类、提取字段、格式转换、简单问答。

日常开发

选 Sonnet。

适合写代码、解释报错、生成测试用例、接口设计、文档整理。

复杂任务

选 Opus。

适合复杂架构分析、长代码库理解、疑难 Bug、多步骤 Agent 规划。

Claude Code

默认建议 Sonnet。
遇到特别复杂的问题再切 Opus。
简单总结或批量任务用 Haiku。

企业知识库

常规问答用 Sonnet。
简单检索后总结用 Haiku。
复杂跨文档分析用 Opus。

总结

Claude API价格怎么算?核心公式很简单:

总费用 = 输入 token 费用 + 输出 token 费用

输入 token 是你发给模型的内容,包括问题、上下文、代码、文档、历史对话。
输出 token 是模型回复你的内容,包括文字、代码、方案、分析结果。

不同模型价格不同,常见结构大致是:

Haiku 便宜,适合轻量任务。
Sonnet 均衡,适合日常开发。
Opus 最强,适合复杂任务。

输出 token 通常比输入 token 贵,所以使用 Claude API 时,一定要控制输出长度,不要让模型无意义生成大段内容。

如果你在国内使用 Claude API,经常遇到官方账号、支付、KYC、风控问题,可以考虑 FastApi 这类正版 API 中转站。它适合 Claude Code、本地脚本、后端服务、AI Agent 等开发场景。

真正会用 API 的人,不是只找最低价,而是会控制 token、选对模型、减少无效上下文,让每一次调用都花得值。

发表评论

了解 智元笔记 的更多信息

立即订阅以继续阅读并访问完整档案。

继续阅读