先看关键事实
输入 token提示词、上下文、代码片段和历史消息占用
输出 token模型生成的回答、代码、解释和工具调用内容
缓存 token部分模型会区分缓存写入和读取,价格可能不同
账单字段模型、时间、token、费用、Key、资源和剩余额度
怎么接入
- 1
先看单次调用
打开一条调用明细,确认模型、输入 token、输出 token 和费用是否符合预期。
- 2
再看周期汇总
把一周或一个套餐周期的总消耗和工作强度对齐,判断当前套餐是否过高或过低。
- 3
用 Key 定位项目
不同项目使用不同 Key,可以快速知道是哪台设备或哪个仓库产生了主要费用。
常见问题
为什么同样一句话费用不同?
模型、上下文长度、是否包含代码文件、输出长度和缓存情况都会影响费用。
套餐额度应该怎么选?
先用基础额度跑一周真实任务,看平均每天 token 和费用,再决定是否升级。
如何减少不必要消耗?
缩小上下文、避免一次性塞入过多文件、按项目拆 Key,并定期检查异常大请求。