对账与常见误会
这页的目标是让你对账不靠猜:一次请求为什么会扣这些钱、到底发了几次、哪里多发了。
最常见的 4 个误会
Section titled “最常见的 4 个误会”1) “我只点了一次,怎么扣了好几次?”
Section titled “1) “我只点了一次,怎么扣了好几次?””最常见原因是 重试:
- 你的代码自动重试
- 你自己点了多次
- 你在脚本里循环跑了
2) “我没让它写这么多,它怎么回这么长?”
Section titled “2) “我没让它写这么多,它怎么回这么长?””通常是:
- 提示词太开放(比如“详细解释一下”)
- 没限制输出长度(有的 SDK/工具可以限制)
3) “开了 stream 会更贵吗?”
Section titled “3) “开了 stream 会更贵吗?””stream 本质上是“怎么把结果发给你”(边生成边发)。
它不一定更贵,但它更容易让输出变长(你看着一直在吐字,就更容易放任它继续写),所以总价可能上去。
4) “我都用小模型了,怎么还挺贵?”
Section titled “4) “我都用小模型了,怎么还挺贵?””常见原因是:
- 输入太长(贴了大段代码/日志)
- 重试太多(你那边发了很多次)
快速对账清单(照着做就行)
Section titled “快速对账清单(照着做就行)”- 去你后台找到“请求记录/用量记录/扣费记录”(名字可能不一样)。
- 随便挑一条“你印象最深的请求”,看清:
- 时间(注意时区)
- endpoint(是
/responses还是/chat/completions) - model
- 回到你自己的客户端/服务端日志,核对:
- 同一时间段是不是重试/循环了多次
- 有没有并发一下子打太多
- 如果还是对不上,把这些信息准备好再找我/找客服(排错会快很多):
- 时间点(精确到分钟)
- model
- endpoint
- 报错/返回内容(注意别把 key 贴出来)