🍥

KnightLi的博客

记录并分享日常

Tags

第 8 頁

量化

AI-Trader 是什麼？一個讓 AI Agent 發佈交易信號、做模擬交易的平臺

本地部署 Qwen3.6：27B 與 35B-A3B 各量化版本需要多少顯存

本地部署 DeepSeek V4：Pro、Flash 與 Base 版本顯存占用估算表

本地部署 Gemma 4：E2B、E4B、26B、31B 各量化版本需要多少顯存

16G 顯卡也能跑 35B 模型：LM Studio 下 MoE 模型的顯存壓縮思路

llama-quantize 怎麼用：GGUF 模型量化入門

Hugging Face 選擇 Llama 的 GGUF 模型時，量化怎麼選：從 Q8 到 Q2 的實用建議

大型模型量化詳解：FP16、Q8、Q5、Q4 到 Q2 怎麼選？