
使用 14寸 MacBook Pro M5 Max 高配,64GB 内存的情况下,速度比云端大模型慢、实际成本也比云端大模型贵…
推荐:直接向大模型厂商付费充值使用。
这是来自 williamangel 的一组数据,文章主要在计算「本地跑 LLM 到底贵不贵」,使用了 Google Gemma 4 31B 模型,把电费、硬件折旧、tokens/s 这些数据摊开之后,结论是:
很多情况下,本地 Apple Silicon 跑模型,成本已经高于直接调用在线 API。
| 功耗 | 每小时电费 | 每日电费(24小时满载) |
|---|---|---|
| 50W | $0.009 | $0.216 |
| 100W | $0.018 | $0.432 |
| 文中取整后估算 | ~$0.02 | ~$0.48 |
| 设备 | 配置 | 官方价格 |
|---|---|---|
| Apple 14′ MacBook Pro | M5 Max + 64GB RAM | $4299 |
| 使用寿命 | 年成本 | 每小时硬件成本 |
|---|---|---|
| 3 年 | $1433 | $0.16358 |
| 5 年 | $860 | $0.09815 |
| 10 年 | $430 | $0.04908 |
| 使用寿命 | 每小时总成本(约) |
|---|---|
| 3 年 | ~$0.18/h |
| 5 年 | ~$0.11/h |
| 10 年 | ~$0.07/h |
| 方案 | 百万 tokens 成本 | 速度 |
|---|---|---|
| 本地 Apple Silicon 推理 | ~$1.50 / 百万 tokens | 数十 tokens/s |
| 在线 OpenRouter 同级模型 | 约为本地的 1/3 | 约 2 倍速度 |
原文: