模型成本分析
-
claude code 与本地模型的对比:云端还是本地
Claude Code 与本地模型的对比:云端还是本地 上周三凌晨两点,我盯着终端里那个已经转了四十分钟的模型加载进度条,脑子里反复回响着白天同事那句话:“你花一万五买的4090,就是为了半夜在这等模型加载?” 那台机器上跑的是CodeLlama-34B的量化版本,为了让它能在24G显存里勉强运行,我已经压缩了三次精度。而隔壁工位的小王,用Claude Code十分钟写完了我折腾两天的支付接口。 …