推理(Thinking/Reasoning)比 直接給出答案(Zero-shot)需要10~100x 的算力和電力消耗。推理時間越長,算力消耗越大。
如果要想支持100M用戶同時使用,就需要巨大的算力。