跳转到内容

对账与常见误会

这页的目标是让你对账不靠猜:一次请求为什么会扣这些钱、到底发了几次、哪里多发了。

1) “我只点了一次,怎么扣了好几次?”

Section titled “1) “我只点了一次,怎么扣了好几次?””

最常见原因是 重试

  • 你的代码自动重试
  • 你自己点了多次
  • 你在脚本里循环跑了

2) “我没让它写这么多,它怎么回这么长?”

Section titled “2) “我没让它写这么多,它怎么回这么长?””

通常是:

  • 提示词太开放(比如“详细解释一下”)
  • 没限制输出长度(有的 SDK/工具可以限制)

stream 本质上是“怎么把结果发给你”(边生成边发)。
它不一定更贵,但它更容易让输出变长(你看着一直在吐字,就更容易放任它继续写),所以总价可能上去。

4) “我都用小模型了,怎么还挺贵?”

Section titled “4) “我都用小模型了,怎么还挺贵?””

常见原因是:

  • 输入太长(贴了大段代码/日志)
  • 重试太多(你那边发了很多次)
  1. 去你后台找到“请求记录/用量记录/扣费记录”(名字可能不一样)。
  2. 随便挑一条“你印象最深的请求”,看清:
    • 时间(注意时区)
    • endpoint(是 /responses 还是 /chat/completions
    • model
  3. 回到你自己的客户端/服务端日志,核对:
    • 同一时间段是不是重试/循环了多次
    • 有没有并发一下子打太多
  4. 如果还是对不上,把这些信息准备好再找我/找客服(排错会快很多):
    • 时间点(精确到分钟)
    • model
    • endpoint
    • 报错/返回内容(注意别把 key 贴出来)