离谱!测个 Claude Code + 通义千问,几轮对话直接欠费 93 元,2000 万 Token 血的教训

离谱!测个 Claude Code + 通义千问,几轮对话直接欠费 93 元,2000 万 Token 血的教训

今天本来开开心心,想体验一把最近很火的 Claude Code 工具。选了阿里的 qwen-max 模型,配好环境,就开始愉快测试。

任务很简单:写一个表单,上半千问 Qwen 教程部分文件上传,下半部分属性配置。七八轮对话,代码出来了,就是上传区样式有点丑,让它改了改,剩下都是简单闲聊。

一切都很正常,直到中午。

一条短信直接给我干懵了:阿里云欠费 93(之前帐号还有 10 几块) 元,大模型服务已停用。

我当时第一反应:???我干啥了???

赶紧去后台一看数据,人直接傻了:消耗了两千多万 Tokens。

七八轮简单对话,怎么可能跑出这个数字?我当场怀疑人生。

先去 Claude Code 里翻聊天记录,结果啥也找不到。最后跑到本地 目录,才发现一个巨大无比的日志文件。打开一看,真相来了:

里面疯狂刷屏同一条错误:


因为参数类型不匹配,Claude Code 一直在自动重试。粗略一数,同一个请求,重复刷了快 200 次!

更坑的还在后面。早上配置模型时,一开始用公司内部 API 调不通,同事建议加个环境变量:

当时只想着先跑通,没细想。后来才反应过来:这是直接把 Prompt 缓存给关了!每次请求都全量算 Token,不命中缓存,费用直接爆炸。

一边是死循环重试 200 次,一边是关闭缓存,Token 全额计费。双重暴击,93 块钱就这么没了。

这件事真给我上了一课:大模型后付费,风险真的比想象高太多。一旦代码 / 工具出问题,陷入循环调用,Token 消耗是指数级暴涨,账单来得比 bug 还快。

给各位同行提个醒:

  • 用后付费大模型,务必加调用次数限制、速率限制
  • 环境变量别瞎加,搞清楚每个配置是干嘛的
  • 自动化工具(尤其是 AI Coding 工具)重试机制,一定要盯紧
  • 本地先跑日志,确认没问题再上正式 API

小小一次测试,93 元买个教训。分享出来,希望大家别再踩同一个坑。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/274409.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午7:09
下一篇 2026年3月12日 下午7:09


相关推荐

关注全栈程序员社区公众号