很多新手第一次用 Claude API,最容易搞混的就是 Claude API价格怎么算?输入输出token 怎么看。
因为 API 不是像 Claude Pro、Max 那样按月订阅,而是按 token 计费。你发给模型的内容要算钱,模型回复你的内容也要算钱,而且一般来说,输出 token 比输入 token 更贵。
如果你只是偶尔聊天,可能感觉不到 token 成本;但如果你用 Claude API 做开发、接 Claude Code、跑 AI Agent、处理长文档、分析代码库,token 成本就会很明显。
国内用户如果直接用官方 API,还可能遇到账号、支付、KYC、风控等问题。如果只是想稳定调用 Claude 正版模型,可以考虑用稳定的正版 API 中转站,比如 FastApi。FastApi 提供 Claude 正版模型接口,不是共享号、薅羊毛、拼额度产品,更适合稳定体验满血 Claude。官方优惠邀请码是 666777。
Claude API价格是怎么计算的?
Claude API 通常按照 输入 token + 输出 token 分开计费。
简单理解:
输入 token:你发给 Claude 的内容。
输出 token:Claude 回复你的内容。
比如你问 Claude:
“帮我分析这段代码有没有问题。”
你发过去的这句话,加上系统提示词、上下文、代码内容、历史对话,都会算输入 token。
Claude 回复你的分析、代码建议、修改方案,都会算输出 token。
所以 API 成本不是只看你问了几次,而是看每次请求里有多少输入、多少输出。
输入token包括哪些内容?
输入 token 不只是你最后打的那句话。
它通常包括:
系统提示词;
用户问题;
历史上下文;
代码文件内容;
文档内容;
工具调用信息;
Claude Code 读取的项目上下文;
你传入的长日志、长文章、长表格。
这也是为什么 Claude Code、AI Agent、知识库问答更容易消耗 token。
因为它们不是只发一句话,而是会把很多上下文一起发给模型。
比如你让 Claude Code 分析一个项目,它可能会读取目录结构、关键文件、报错日志、历史讨论内容,这些都会变成输入 token。
输出token包括哪些内容?
输出 token 就是 Claude 返回给你的内容。
比如:
文字回答;
代码片段;
修改建议;
完整文件内容;
测试用例;
文档说明;
Agent 执行计划;
长篇分析报告。
输出越长,费用越高。
很多 Claude API 模型的输出价格明显高于输入价格。比如 Anthropic 官方页面显示,Claude Opus 4.7 的价格从 输入 $5 / 100万 tokens,输出 $25 / 100万 tokens 起;也就是输出价格是输入的 5 倍。官方还提到 prompt caching 最高可节省 90%,batch processing 可节省 50%。
所以用 API 时,不要动不动让模型“完整重写全部代码”“输出完整项目方案”“生成一大篇文档”。
输出越长,成本越容易上来。
Claude API常见模型价格大概是多少?
不同模型价格不同。根据近期 Claude API 价格整理,当前常见 Claude 模型大致可以这样理解:
Claude Haiku 4.5:输入约 $1 / 100万 tokens,输出约 $5 / 100万 tokens。
Claude Sonnet 4.6:输入约 $3 / 100万 tokens,输出约 $15 / 100万 tokens。
Claude Opus 4.7:输入约 $5 / 100万 tokens,输出约 $25 / 100万 tokens。
这个价格结构很容易记:越强的模型越贵,输出通常比输入贵很多。
所以不同任务应该选不同模型。
简单分类、摘要、字段提取,用 Haiku。
日常写代码、解释报错、生成测试,用 Sonnet。
复杂架构分析、长代码理解、疑难 Bug、Agent 规划,用 Opus。
如果所有任务都用 Opus,成本会明显高很多。
举个例子:一次Claude API调用多少钱?
假设你调用 Claude Sonnet 4.6,价格按输入 $3 / 100万 tokens,输出 $15 / 100万 tokens 来算。
一次请求:
输入 10,000 tokens
输出 2,000 tokens
成本大概是:
输入成本:10,000 / 1,000,000 × 3 = $0.03
输出成本:2,000 / 1,000,000 × 15 = $0.03
总成本:$0.06
看起来不贵。
但如果你一天调用 500 次,就是 $30 左右。
一个月 30 天,就是 $900 左右。
这就是为什么 API 成本不能只看单次调用。高频开发、Agent、批量处理,成本会累计得很快。
再举个Claude Code的例子
你用 Claude Code 分析项目。
一次任务可能包括:
项目目录结构;
几个关键代码文件;
一段报错日志;
你的需求描述;
Claude 的修改方案;
生成的代码;
后续检查建议。
假设输入 80,000 tokens,输出 10,000 tokens。
如果用 Claude Sonnet 4.6:
输入:80,000 / 1,000,000 × 3 = $0.24
输出:10,000 / 1,000,000 × 15 = $0.15
总计:约 $0.39
如果用 Claude Opus 4.7:
输入:80,000 / 1,000,000 × 5 = $0.40
输出:10,000 / 1,000,000 × 25 = $0.25
总计:约 $0.65
单次看不夸张,但如果你每天跑几十次 Claude Code 任务,成本就不低了。
所以 Claude Code 不建议无脑用 Opus,日常开发用 Sonnet 会更合适。
token 怎么看?怎么估算?
token 可以简单理解成模型处理文本的基本单位。
它不完全等于中文字数,也不完全等于英文单词数。
粗略估算:
中文通常一个字可能接近 1 个 token 左右,但具体会变。
英文通常一个单词可能拆成 1 个或多个 token。
代码、JSON、标点、空格也会占 token。
长路径、变量名、Base64、日志内容可能更费 token。
新手可以用一个粗略方法估算:
短问题:几十到几百 tokens。
一篇普通文章:几千 tokens。
一个长代码文件:几千到几万 tokens。
一个项目上下文:可能几万到几十万 tokens。
Claude Code 多轮任务:可能累计更多。
如果平台提供 token 统计,就看平台后台。
如果是官方 API,可以通过使用记录、成本统计、Usage 页面或相关 API 查看。Anthropic 官方文档说明可以用 Usage and Cost API 查看 token 使用、成本、用量模式,并用于成本核对和优化。
如果使用 FastApi 这类中转站,也建议看平台后台是否提供调用记录、消耗统计和模型用量信息。
为什么输出token更贵?
简单理解,模型生成内容比读取内容更“耗资源”。
输入阶段主要是理解你给的内容。
输出阶段是模型一步步生成回复。
所以很多 Claude 模型的输出价格是输入价格的 5 倍左右。
这对使用方式影响很大。
你让模型:
“完整重写这个文件”
“生成 20 个方案”
“写一篇 5000 字文章”
“输出完整项目代码”
“把所有测试用例都写出来”
输出成本都会上升。
更省钱的问法是:
“先列出问题,不要修改代码。”
“只输出需要改的函数。”
“只给核心代码片段。”
“用表格总结,不要展开长篇解释。”
“先给方案,我确认后再生成代码。”
这样能明显减少输出 token。
Claude API怎么控制成本?
第一,不要所有任务都用最贵模型
这是最重要的。
Haiku 适合轻量任务。
Sonnet 适合日常开发。
Opus 适合复杂任务。
很多人 API 成本高,不是因为 Claude 贵,而是模型用错了。
第二,减少无效上下文
不要每次都把完整项目、完整文档、完整日志塞给模型。
更好的方式是:
先给目录结构;
再给关键文件;
让模型先判断需要哪些信息;
只补充必要上下文。
第三,控制输出长度
输出通常更贵。
可以在 prompt 里明确说:
“不要长篇解释。”
“只输出关键修改点。”
“最多 5 条建议。”
“不要生成完整文件。”
“先不要写代码,只分析原因。”
第四,利用缓存
如果你有固定系统提示词、固定项目背景、固定文档,可以使用 prompt caching。
Anthropic 官方 Opus 页面提到 prompt caching 最高可节省 90%。
缓存适合重复使用的大段上下文。
第五,用 Batch 处理非实时任务
如果任务不需要实时返回,可以用 batch processing。
官方页面提到 batch processing 可节省 50%。
比如批量摘要、批量分类、批量提取字段,就适合批处理。
第六,做好日志和限流
如果是团队或产品接入,一定要记录:
谁调用;
调用哪个模型;
输入多少;
输出多少;
任务类型;
是否失败;
耗时多少。
没有日志,就不知道钱花在哪里。
官方API和中转站价格怎么看?
官方 API 一般按官方模型价格计费,价格结构更透明,但国内用户可能会遇到账号、支付、KYC 和风控问题。
中转站一般会在自己的平台上显示价格、倍率或额度消耗方式。不同平台计算方式不同,有些按 tokens,有些按倍率,有些按余额扣费。
选择中转站时,不要只看便宜。
要看:
是不是 Claude 正版模型;
是否支持 Opus、Sonnet、Haiku;
是否有调用记录;
是否有消耗明细;
接口是否稳定;
是否适合 Claude Code 和 Agent;
是不是共享号或薅羊毛产品。
FastApi 提供 Claude 正版模型接口,不是共享号、薅羊毛产品,比较适合国内开发者稳定体验 Claude。官方优惠邀请码 666777。
不同场景怎么选模型最划算?
普通聊天和轻量任务
选 Haiku。
适合摘要、分类、提取字段、格式转换、简单问答。
日常开发
选 Sonnet。
适合写代码、解释报错、生成测试用例、接口设计、文档整理。
复杂任务
选 Opus。
适合复杂架构分析、长代码库理解、疑难 Bug、多步骤 Agent 规划。
Claude Code
默认建议 Sonnet。
遇到特别复杂的问题再切 Opus。
简单总结或批量任务用 Haiku。
企业知识库
常规问答用 Sonnet。
简单检索后总结用 Haiku。
复杂跨文档分析用 Opus。
总结
Claude API价格怎么算?核心公式很简单:
总费用 = 输入 token 费用 + 输出 token 费用
输入 token 是你发给模型的内容,包括问题、上下文、代码、文档、历史对话。
输出 token 是模型回复你的内容,包括文字、代码、方案、分析结果。
不同模型价格不同,常见结构大致是:
Haiku 便宜,适合轻量任务。
Sonnet 均衡,适合日常开发。
Opus 最强,适合复杂任务。
输出 token 通常比输入 token 贵,所以使用 Claude API 时,一定要控制输出长度,不要让模型无意义生成大段内容。
如果你在国内使用 Claude API,经常遇到官方账号、支付、KYC、风控问题,可以考虑 FastApi 这类正版 API 中转站。它适合 Claude Code、本地脚本、后端服务、AI Agent 等开发场景。
真正会用 API 的人,不是只找最低价,而是会控制 token、选对模型、减少无效上下文,让每一次调用都花得值。



发表评论