Antirez 開源了一個新專案:ds4。它不是通用 LLM 框架,而是一個面向 DeepSeek V4 Flash 的本地推理引擎,重點放在 Apple Silicon 和 Metal 後端上。
專案地址:https://github.com/antirez/ds4
ds4 是什麼
ds4 的目標很明確:在 Mac 上本地執行 DeepSeek V4 Flash。
它目前提供三種使用方式:
- 互動式 CLI。
- HTTP server。
- 一個實驗性的 Agent 模式。
從定位看,它更像是一個針對特定模型深度最佳化的推理專案,而不是要取代 llama.cpp、Ollama 或 vLLM 這類通用工具。
為什麼值得關注
這類專案值得看,主要有三個原因。
第一,作者是 Redis 作者 Antirez。他長期關注底層系統、效能和簡單工具,專案風格通常比較直接。
第二,DeepSeek V4 Flash 屬於面向高效推理的模型方向。如果本地執行體驗足夠好,對 Mac 使用者來說會很有吸引力。
第三,ds4 直接面向 Apple Metal。相比「先支援所有平台,再慢慢最佳化」的路線,它更像是先把一個明確場景做深。
適合誰用
ds4 更適合這幾類使用者:
- 使用 Apple Silicon Mac。
- 想在本地執行 DeepSeek V4 Flash。
- 關注 Metal 推理效能。
- 願意嘗試 alpha 階段專案。
- 想研究輕量推理引擎和模型執行細節。
如果你的目標是穩定部署、跨平台執行、OpenAI API 相容生態,現階段它未必是首選。它更適合作為實驗工具和技術觀察對象。
使用方式
專案 README 給出的基本流程是先建置,再執行。
|
|
互動式執行:
|
|
啟動 HTTP server:
|
|
Agent 模式:
|
|
具體參數和模型檔案準備方式,建議以倉庫 README 為準,因為專案仍在快速變化。
目前的風險
ds4 還處在早期階段,使用前要有預期:
- 功能可能不完整。
- 參數、模型格式和命令列行為可能變化。
- 相容性主要圍繞 Apple Silicon 和 Metal。
- Agent 模式更偏實驗,不適合直接用於生產流程。
- 遇到問題時,需要自己閱讀 README、issue 或原始碼排查。
也就是說,它現在更像「值得動手試的開源實驗」,還不是面向普通使用者的一鍵工具。
和通用推理工具的區別
通用推理工具通常追求模型格式、平台、後端和 API 的廣泛相容。ds4 的方向更窄:圍繞 DeepSeek V4 Flash 和 Metal 做本地執行。
這種選擇有利有弊。
好處是實作可以更集中,效能和體驗更容易圍繞單一目標最佳化。代價是適用範圍有限,不適合拿來執行各種不同模型,也不適合取代完整的部署平台。
如果你已經在用 llama.cpp 或 Ollama,ds4 可以作為補充測試工具,而不是馬上替換現有工作流。
小結
ds4 的看點不在「又一個本地大模型工具」,而在於它把範圍收得很窄:DeepSeek V4 Flash、Apple Silicon、Metal、本地推理。
如果你手上有合適的 Mac,並且願意折騰早期專案,可以關注它後續的效能表現、模型支援方式和 server/agent 能力演進。對於生產環境,建議繼續觀望,等介面和使用方式穩定後再評估。
參考
- GitHub 專案:https://github.com/antirez/ds4