Avatar 🍥

KnightLi的博客

记录并分享日常

  1. 主頁
  2. 關於
  3. 歸檔
  4. 搜索
  5. 連結
    1. 夜晚模式

紀錄

2026 500
2025 23
2024 5
2023 9
2022 33
2021 5
2020 8

分類

AI工具 技術文檔 硬體相關 開發工具 AI產業 維運 安全動態 商業觀察

標籤雲

AI Agent AI工具 Codex 開發工具 AI編程 Claude Code 本地大模型 OpenAI MCP Linux Claude Python Anthropic Ubuntu ChatGPT 開源專案 Ollama Llama.cpp NAS Gemini 提示詞 AI繪圖 Godot 遊戲開發 Windows 網路安全 AI模型 DeepSeek Docker Gemma 4
硬體相關

特斯拉 V100 現在還值得買嗎:ECC 檢查、散熱改造與 DIY 避坑

整理特斯拉 V100 的選購重點:年份與外觀怎麼看、ECC 數值怎麼判斷、哪些跡象代表卡可能被動過手腳,以及為什麼 DIY 散熱與供電最容易翻車。

2026-04-23
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

Claude Code 環境配置四件套:CLAUDE.md、Rules、Memory、Hooks 一次講清

為什麼 Claude Code 用久之後,環境配置會比提示詞更重要?這篇文章把 CLAUDE.md、Rules、Memory、Hooks 四個層面一次講清,也給出一套實用的上手順序。

2026-04-23
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

llama.cpp ollama 顯卡性能天梯:CUDA、ROCm、Vulkan

基於 GitHub Discussions 中的 scoreboard 頁面,整理 llama.cpp 在 CUDA、ROCm、Vulkan 下的完整 GPU 跑分表,並解釋 pp512、tg128、Q4_0、FA 等指標該怎麼看。

2026-04-23
閱讀時間: 27 分鐘
中文简体 English 日本語 Español
AI工具

顯卡推理速度測試的常用指標具體含義:FA、pp512、tg128、Q4_0 都是什麼意思

看顯卡推理速度測試時,經常會遇到 FA、pp512、tg128、Q4_0、t/s 這些指標。它們都和效能有關,但分別在測什麼、該怎麼理解,並不是每個人都清楚。這篇文章專門把這些常見指標拆開講明白。

2026-04-23
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
開發工具

2026 年嵌入式開發環境怎麼選:Keil、STM32CubeIDE、VS Code 與 AI 協作

在 AI 寫程式已經變得很普遍的 2026 年,嵌入式開發環境怎麼選?相比單押某個 IDE,更現實的答案往往是 Keil 負責編譯與調試,VS Code 負責編輯與 AI 協作。

2026-04-22
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

大模型常見張量類型入門:FP32、FP16、BF16、TF32 與 FP8

用一篇文章整理大模型裡最常見的張量類型:FP32、FP16、BF16、TF32 與 FP8,包括它們的位寬結構、優缺點,以及它們為什麼會影響訓練與部署體驗。

2026-04-22
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
開發工具

8 種常見設定檔格式怎麼選:INI、XML、JSON、YAML、TOML 到 Markdown

整理 8 種常見設定檔格式的特點與取捨,包括 INI、XML、JSON、YAML、TOML、Apache 設定、Protocol Buffers,以及 AI Agent 時代重新受到關注的 Markdown。

2026-04-22
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

16G 顯卡也能跑 35B 模型:LM Studio 下 MoE 模型的顯存壓縮思路

整理一套 16G 顯卡運行 35B 級 MoE 模型的實測思路:只要選對架構並調好 LM Studio 參數,16G 顯卡不一定只能停留在 12B 到 14B 模型。

2026-04-22
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

Claude Code 多 Agent 協作:Subagents 和 Agent Teams 怎麼選

整理 Claude Code 裡 Subagents 和 Agent Teams 的差異、適用場景與取捨方式,幫助你在多 Agent 協作時更快選對方案。

2026-04-22
閱讀時間: 3 分鐘
中文简体 English 日本語 Español
AI工具

GPT Image 2 正式發布:從能生成到能商用的跨越

整理 GPT Image 2 發布後最值得關注的能力變化,包括文字渲染、照片級真實感、世界知識、UI 截圖生成與局部編輯,並附上 ChatGPT 與 API 的使用方式,以及幾個高頻生圖場景的提示詞參考。

2026-04-22
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

nuwa-skill:把「蒸餾一個人」從靈感變成可執行流程

alchaincyf/nuwa-skill 不是單純模仿名人的語氣,而是把研究、提煉、驗證一個人思維方式的過程做成可重複使用的 Claude Code Skill。

2026-04-22
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

OpenAI 發布 ChatGPT Images 2.0:圖像生成開始走向可直接交付

基於 OpenAI 2026 年 4 月 21 日發布的 ChatGPT Images 2.0 頁面,整理這次更新最值得關注的方向:更強的文字與版式控制、多語言能力、更廣的風格覆蓋,以及圖像生成從「出圖」走向「可直接交付」。

2026-04-22
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
硬體相關

12V-2x6 與 12VHPWR:顯卡 16Pin 供電接口差異筆記

整理 12V-2x6 與 12VHPWR 這兩代顯卡 16Pin 供電接口的主要差異:線材相容性、針腳長度、SENSE 邏輯、H++ 標識和 600W 輸出能力。

2026-04-19
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

Karpathy 的 65 行 CLAUDE.md:讓 AI 編程少犯三類錯誤

整理 Karpathy 對 AI 編程的觀察,以及 Forrest Cheung 將這些問題沉澱成 CLAUDE.md 行為準則的思路:先想再寫、簡單優先、精準修改和目標驅動。

2026-04-19
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
硬體相關

Core Ultra 9 285T ES 折騰筆記:Q4A7、B860 工程板與 35W 功耗牆

整理 Core Ultra 9 285T ES 樣品 Q4A7 的平台、主機板、供電、記憶體、效能、遊戲表現和購買建議:規格很香,但 35W 功耗牆、DDR5 高延遲、ES 主機板稀缺和 BIOS 簡陋,讓它更適合低功耗折騰,而不是遊戲主機。

2026-04-19
閱讀時間: 3 分鐘
中文简体 English 日本語 Español
AI工具

Claude Code 額度省著用:模型選擇、上下文、快取與 /compact

整理 Claude Code 和 Claude Pro/Max 額度容易耗盡的原因:模型選擇、5 小時用量視窗、長對話、檔案和圖片、快取失效、CLAUDE.md、MCP 與 skills,並給出 /compact、/clear、/context、/status 等實用習慣。

2026-04-19
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

rembg 專案整理:本地圖片背景移除工具

整理 danielgatis/rembg 的定位、安裝方式、CLI 用法、Python 呼叫、HTTP 服務、Docker 執行、模型選擇和適用場景,方便判斷它是否適合本地圖片背景移除流程。

2026-04-19
閱讀時間: 3 分鐘
中文简体 English 日本語 Español
AI工具

Ollama 多顯卡使用筆記:顯存疊加、GPU 選擇和常見誤區

整理 Ollama 多顯卡使用中的關鍵資訊:什麼時候會跨 GPU 載入模型、如何用 CUDA_VISIBLE_DEVICES / ROCR_VISIBLE_DEVICES 限制顯卡、顯存是否能疊加、不同 GPU 能不能混用,以及 Docker、PCIe 頻寬和效能方面的常見誤區。

2026-04-19
閱讀時間: 3 分鐘
中文简体 English 日本語 Español
硬體相關

聯想 HR630x / HR650x 折騰筆記:LGA3647、8259CL、Optane 與避坑

參考 HR630x 裝機日誌和 HR650x 踩坑記錄,整理聯想 HR630x / HR650x 這類 LGA3647 伺服器準系統的選購思路、CPU 與 Optane 搭配、VRM 解鎖、風扇調速、riser、背板和 BMC/UEFI 注意事項。

2026-04-18
閱讀時間: 3 分鐘
中文简体 English 日本語 Español
硬體相關

MCP2221A-I/ST 選型筆記:USB 轉 I2C/UART 的小工具晶片

整理 Microchip MCP2221A-I/ST 的關鍵參數和使用注意點:USB 2.0 轉 I2C/UART、GPIO 複用、供電範圍、封裝、速率限制,以及適合放進硬體除錯工具箱的原因。

2026-04-18
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
硬體相關

LGA3647 高 TDC OEM CPU 點亮思路:修改 VRM 的 ICC_MAX

整理 ServeTheHome 論壇中關於 LGA3647 平台高 TDC OEM Xeon 處理器的 VRM ICC_MAX 修改思路:為什麼會不亮機、需要準備什麼、具體主機板接線、刷寫命令、BIOS 修改和風險注意事項。

2026-04-18
閱讀時間: 8 分鐘
中文简体 English 日本語 Español
AI工具

Google App 桌面版體驗:把 AI 搜尋放進 Windows

介紹 Google App 桌面版的核心功能、安裝條件、快捷鍵呼叫方式,以及如何使用 AI Mode、Google Lens、螢幕分享、檔案上傳和本機檔案搜尋來提升日常搜尋效率。

2026-04-18
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
維運

理解 nftables 框架:表、鏈、規則和集合

從概念層面梳理 nftables 框架:table、family、chain、rule、set、map 和 verdict map 分別解決什麼問題,以及它們如何組合成可維護的防火牆規則。

2026-04-18
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
維運

nftables 快速入門:表、鏈、規則和常用操作

整理 nftables 的入門思路:理解 table、chain、rule 的關係,並透過 IP、MAC、連接埠匹配、流量統計、限速和規則刪除等常用命令快速上手。

2026-04-18
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

Gemma 4 E4B 越獄版和官方普通版有什麼差別

對比非官方 Gemma-4-E4B-Uncensored-HauhauCS-Aggressive 與 Google 官方 Gemma 4 E4B-it,重點說明行為、拒答、安全、授權與部署層面的差異。

2026-04-18
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

Windows 用 WSL + Ollama 本地部署 Hermes Agent,並接入 Telegram

整理一套適合 Windows 使用者的 Hermes Agent 本地部署流程:先安裝 WSL 和 Ubuntu,再裝 Ollama、Gemma 4,並完成 Hermes Agent 與 Telegram 的基礎接入。

2026-04-18
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

llama-cli -hf 下載 Hugging Face 模型預設儲存在哪裡

整理 llama-cli -hf 從 Hugging Face 下載 GGUF 模型後的預設快取位置,以及如何用 LLAMA_CACHE 或 Hugging Face 快取變數修改快取目錄。

2026-04-17
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

Windows 下 llama-cli 直連 Hugging Face 出現 SSL 憑證驗證失敗怎麼辦

整理 llama-cli 在 Windows 下透過 -hf 下載 Hugging Face 模型時遇到 SSL 憑證驗證失敗的常見原因與處理方式。

2026-04-17
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
硬體相關

CRPS 通用冗餘伺服器電源標準、腳位功能與常見型號

整理 CRPS / M-CRPS 通用冗餘伺服器電源標準、2x25 金手指腳位定義、PSON/12VSB/PMBus 等訊號功能,以及常見 CRPS 電源型號。

2026-04-17
閱讀時間: 4 分鐘
中文简体 English 日本語 Español
硬體相關

CSPS 伺服器通用槽位電源介面與腳位定義

整理 CSPS / Common Slot 伺服器電源的介面特點、64 pin 金手指腳位定義、12V 輸出啟用方法、PMBus/SMBus 訊號和轉接板設計注意事項。

2026-04-16
閱讀時間: 5 分鐘
中文简体 English 日本語 Español
AI工具

codex-quota 實戰指南:保留命令列的本機、Web 與 Docker 用法

`codex-quota` 是一個輕量工具,可查詢 ChatGPT Codex 配額使用情況,整理本機 CLI、Web 服務與 Docker/Compose 用法。

2026-04-16
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

在 VS Code 裡接入 Claude:從 API 設定到網頁生成

整理一套在 VS Code 裡接入 Claude 類模型做 AI 編程的入門流程,包括外掛安裝、API 設定、實際生成頁面時的互動方式,以及使用這類工具時更值得關注的邊界。

2026-04-16
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
開發工具

Windows 上在 VS Code 建置 Docker 映像:從環境準備到一鍵建置

整理在 Windows 上使用 VS Code 建置 Docker 映像的核心流程,包含前置條件、Dockerfile 產生方式、建置方法與常見排查重點。

2026-04-16
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

Claude 身分驗證說明:為什麼要驗證、需要什麼材料、資料如何處理

整理 Anthropic 官方 Claude 身分驗證文件,說明驗證觸發場景、所需證件、Persona 的角色、資料保護方式,以及驗證失敗或帳號被停用時的處理方法。

2026-04-16
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

Codex 額度怎麼算:5 小時限額、週限額與 Credit 消耗

說明 Codex 的 5 小時限額、週限額、Credit 消耗、local task 與 cloud task 的差異,以及為什麼 5 小時額度沒用完時週額度也會下降。

2026-04-15
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
硬體相關

常見 U.2 企業級 SSD 系列整理

整理常見 U.2 企業級 SSD 系列,包括 Solidigm、Samsung、Western Digital、Micron 和 Kioxia 的代表型號,幫助快速理解各系列的大致定位與適用場景。

2026-04-15
閱讀時間: 3 分鐘
中文简体 English 日本語 Español
AI工具

RAGFlow 專案整理:開源 RAG 引擎的功能與使用方法

整理 infiniflow/ragflow 專案的核心定位、主要功能、部署方式和基本使用流程,幫助快速判斷 RAGFlow 是否適合用於企業知識庫和 AI 問答系統。

2026-04-15
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

Firecrawl 專案整理:給 AI Agent 用的網頁搜尋、抓取與互動 API

整理 Firecrawl GitHub 倉庫的核心定位、主要功能、適用場景、自託管與授權邊界,方便判斷它是否適合作為 AI Agent 的網頁資料入口。

2026-04-15
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

Playwright CLI 視訊錄製:錄屏、章節標記、Overlay 與除錯取捨

基於官方 video-recording 參考文件,整理 Playwright CLI 中視訊錄製、章節標記、Overlay API,以及與 tracing 的實際使用差異。

2026-04-15
閱讀時間: 4 分鐘
中文简体 English 日本語 Español
AI工具

Playwright CLI 會話管理:多瀏覽器會話、隔離、持久化與清理

基於官方 session-management 參考文件,整理 Playwright CLI 中命名瀏覽器會話、會話隔離、持久化 profile、並發使用與清理命令的常用方法。

2026-04-15
閱讀時間: 3 分鐘
中文简体 English 日本語 Español
硬體相關

M.2 E Key B Key M Key腳位說明整理

整理 M.2 腳位說明文件的重點內容,保留 Key E、Key B、Key M 三種 M.2 Socket 的 Pinout Description 表格,並補上繁中說明。

2026-04-15
閱讀時間: 4 分鐘
中文简体 English 日本語 Español
AI工具

Playwright CLI storage state 用法:保存登入狀態、讀取 Cookies 與本地儲存

基於官方 storage-state 參考文件,整理 Playwright CLI 中 storage state、Cookies、localStorage、sessionStorage 和 IndexedDB 的常用命令與精簡說明。

2026-04-14
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

OpenHarness 是什麼:這個開源 Agent Harness 能做什麼

根據 HKUDS/OpenHarness 官方倉庫與 README,整理 OpenHarness 的定位、核心功能、ohmo 個人助手能力,以及它適合哪些使用場景。

2026-04-12
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

Playwright CLI 使用入門:安裝、Skills、Session 管理與常用命令

基於 microsoft/playwright-cli 最新 README,快速了解 Playwright CLI 的定位、安裝方式、Skills 用法、Session 管理、監控面板與常用命令。

2026-04-12
閱讀時間: 3 分鐘
中文简体 English 日本語 Español
AI工具

Hermes Agent 是什麼:簡介、優點、快速上手與 OpenClaw 對比

一文看懂 Nous Research 的 Hermes Agent:它適合誰、強在哪裡、怎麼開始用,以及它和 OpenClaw 在定位與使用體驗上的差異。

2026-04-12
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

OpenClaw 類腦記憶演算法 Dreaming:機器開始做夢,人類卻在失眠

OpenClaw 推出 Dreaming 記憶整理機制,用淺睡、深睡與 REM 模擬人類睡眠中的記憶鞏固,讓智能體更會記重點,也更會忘掉噪音。

2026-04-12
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

llama-quantize 怎麼用:GGUF 模型量化入門

簡要說明 llama-quantize 的作用、基本命令、常見參數,以及不同量化等級在體積與速度上的取捨。

2026-04-12
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

llama.cpp 如何從 Hugging Face 取得 GGUF 模型

簡要說明 llama.cpp 如何直接從 Hugging Face 下載 GGUF 模型、切換相容端點,以及在非 GGUF 格式下的轉換方式。

2026-04-12
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

Codex 額度用量統計

用一段 Python 腳本讀取 `auth.json` 中的憑證,請求 ChatGPT 的 `/backend-api/wham/usage` 介面,查看 Codex 的額度剩餘與重置時間。

2026-04-12
閱讀時間: 9 分鐘
中文简体 English 日本語 Español
AI工具

Gemma-4-31B-it 裡的 it 是什麼意思

簡要說明 Gemma-4-31B-it 中 it 與 31B 的含義,以及為什麼聊天場景通常更適合選擇 it 版本。

2026-04-11
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
1 5 6 7 8 9 10 11 12
© 2022 - 2026 KnightLi的博客
记录并分享
使用 Hugo 建立
主題 Stack 由 Jimmy 設計