Avatar 🍥

KnightLi的博客

记录并分享日常

  1. 主頁
  2. 關於
  3. 歸檔
  4. 搜索
  5. 連結
    1. 夜晚模式

紀錄

2026 500
2025 23
2024 5
2023 9
2022 33
2021 5
2020 8

分類

AI工具 技術文檔 硬體相關 開發工具 AI產業 維運 安全動態 商業觀察

標籤雲

AI Agent AI工具 Codex 開發工具 AI編程 Claude Code 本地大模型 OpenAI MCP Linux Claude Python Anthropic Ubuntu ChatGPT 開源專案 Ollama Llama.cpp NAS Gemini 提示詞 AI繪圖 Godot 遊戲開發 Windows 網路安全 AI模型 DeepSeek Docker Gemma 4
AI工具

Gemma 4 MTP 實測調參:用 assistant 草稿模型衝 120 tokens/s

整理 Gemma 4 使用 assistant-MTP 草稿模型進行投機解碼的命令列範例:如何用 llama-cli 掛載 draft 模型、理解 -md、--draft-max、-ngl 等參數,以及為什麼 120 tokens/s 只能作為特定硬體下的調參目標。

2026-06-12
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

Gemma 4 assistant-MTP 是什麼:多 Token 預測草稿模型怎麼加速推理

解釋 Gemma 4 assistant-MTP 的作用:它不是獨立聊天模型,而是配合主模型做 Multi-Token Prediction 和 speculative decoding 的草稿模型,用來在不改變最終輸出的前提下提升生成速度。

2026-06-12
閱讀時間: 3 分鐘
中文简体 English 日本語 Español
AI工具

8GB 顯存跑 Gemma 4 12B:llama-cli 混合卸載參數怎麼配

整理 8GB 顯存機器上執行 Gemma 4 12B GGUF 的 llama-cli 參數:透過 GPU 層數卸載、Flash Attention、8K 上下文、mlock 和 CPU 執行緒控制,在顯存吃緊時盡量穩定執行。

2026-06-12
閱讀時間: 3 分鐘
中文简体 English 日本語 Español
AI工具

DiffusionGemma 本地部署:用 vLLM 跑起 Google 文字擴散模型

整理 DiffusionGemma 的本地部署和命令列使用方法:用 vLLM 啟動 OpenAI-compatible 服務、用 curl 測試、理解 diffusion 參數、硬體要求和常見部署邊界。

2026-06-12
閱讀時間: 4 分鐘
中文简体 English 日本語 Español
AI工具

DiffusionGemma:Google 把擴散模型帶進文字生成

整理 Google DeepMind DiffusionGemma 的核心資訊:它用文字擴散替代逐 token 自回歸生成,面向低延遲、本地互動、程式碼補全和非線性文字生成場景,但仍是實驗模型,品質取捨與部署邊界需要分清。

2026-06-12
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

AI 記憶系統怎麼選:Mem0、Letta、Zep、Cognee、Memobase 對比

對比 Mem0、Letta、Zep/Graphiti、Cognee、Memobase、AgentMemory、Text2Mem、ReMe 和 memU 等 AI 記憶系統:它們分別適合外置記憶、自帶記憶 Agent、時序記憶、知識圖譜、使用者畫像和程式設計助手場景。

2026-06-11
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
硬體相關

AI 能看懂主機板嗎?WD PR2100 HDMI、UART 與背板接口判斷過程

以 WD PR2100 主機板接口識別為例,復盤一次 AI 輔助硬體功能分析:如何從照片中拆問題、找特徵、建立證據鏈,並把 J12、J7、J50 等接口判斷轉成可實測的驗證清單。

2026-06-11
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
開發工具

別只會用 Codex:Hook 才是進階玩法

整理 Codex Hook 的核心用法:它能在 Codex 的關鍵生命週期事件中執行自訂腳本,適合做隱私檢查、命令審查、會話記錄、結果校驗和團隊規範約束。

2026-06-11
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI產業

Leiden Declaration:數學界如何回應 AI 進入研究現場

整理 Leiden Declaration on Artificial Intelligence and Mathematics 的核心內容:數學界為什麼要回應 AI,聲明擔心哪些風險,又分別給個人研究者、學術組織、政策制定者和 AI 公司提出了哪些建議。

2026-06-11
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
安全動態

HTTP/2 Bomb 漏洞怎麼處理?CVE-2026-49975 的影響範圍與緩解思路

整理 HTTP/2 Bomb(CVE-2026-49975)的風險、影響範圍和防守建議:它透過 HPACK 壓縮放大與 HTTP/2 流控停滯造成記憶體耗盡,影響多類 HTTP/2 服務端實作。

2026-06-11
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

OpenTalking 和 LongCat-Video 怎麼選?一個做即時對話,一個做高品質數字人影片

對比 OpenTalking 與 LongCat-Video-Avatar 的定位差異:OpenTalking 更像即時數字人對話鏈路的編排框架,LongCat-Video 更像長影片生成和高品質數字人動畫的底層多模態模型。

2026-06-11
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

OpenTalking 是什麼?一個把 AI 數字人對話跑起來的開源框架

整理 datascale-ai/opentalking 的定位、架構和部署路線:它不是單一數字人模型,而是把前端互動、LLM、TTS、STT、WebRTC、角色資產和可插拔推理後端串起來的即時數字人對話框架。

2026-06-11
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

MeTube:給 yt-dlp 加一個瀏覽器下載面板

整理 MeTube 的核心用法:它把 yt-dlp 封裝成自託管 Web 面板,支援影片、音訊、字幕、播放清單、頻道訂閱和多層下載參數配置,適合 NAS 或家用伺服器使用者搭建統一下載入口。

2026-06-10
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI產業

用 Claude Fable 5 做投資分析:資料整理、反方推演與風險清單

整理 Claude Fable 5 與 Mythos 5 發布後的關鍵資訊,並討論它在投資研究中的正確位置:適合做資料整理、交叉驗證、情境推演和研究自動化,不適合直接替你判斷買賣點。

2026-06-10
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

Open-LLM-VTuber 怎麼用?把本地 LLM 變成會說話的 Live2D 角色

整理 GitHub Weekly Trending 上的 Open-LLM-VTuber:它如何把 LLM、語音識別、語音合成、視覺感知和 Live2D 角色組合成本地可執行的 AI 伴侶。

2026-06-10
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

turbovec 是什麼?一個為本地 RAG 省記憶體的 Rust 向量索引

整理 GitHub Trending 上的 RyanCodrai/turbovec 專案:它用 TurboQuant 壓縮向量索引,提供 Rust 核心和 Python 綁定,適合關注本地 RAG、記憶體占用、隱私和低延遲檢索的開發者。

2026-06-10
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI產業

Probabilistic TRM:給小模型加一點隨機性,推理成績反而大漲

整理 arXiv 論文 Probabilistic Tiny Recursive Model:研究者在 TRM 推理階段注入高斯噪聲,並用模型已有的 Q head 選擇最可信答案,在不重新訓練的情況下顯著提升數獨和紙筆謎題表現。

2026-06-10
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI產業

SpaceX AI1 衛星曝光:把 AI 資料中心搬到軌道上,聽起來很猛但難點也不少

整理 SpaceX AI1 軌道 AI 計算衛星的公開規格:150 kW 峰值計算負載、70 米翼展、液冷散熱器、可更換計算模組,以及太空資料中心仍要面對的散熱、成本和規模化挑戰。

2026-06-10
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
維運

Antimalware Service Executable CPU 占用過高怎麼辦?先別急著關 Defender

整理 Antimalware Service Executable 高 CPU 占用的排查思路:確認觸發原因、調整掃描計畫、謹慎新增排除項,以及關閉 Windows Defender 的風險。

2026-06-10
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI產業

蘋果終於認真做 AI 了?WWDC26 Siri AI 和 Apple Intelligence 重點解讀

梳理 WWDC26 上 Apple Intelligence、Siri AI、Gemini 合作和系統級 App 整合的重點,以及 Apple AI 落地仍要面對的限制。

2026-06-10
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

Loops 取代 Prompts:循環工程正在改變 AI Agent 的用法

從提示詞工程到循環工程,梳理 AI Agent 的工作模式變化、典型 Loop 流程,以及 Token 成本、狀態複雜度和失控風險。

2026-06-10
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

用 Codex 會花多少錢?新版費率表、Token 消耗和省錢方法

整理 OpenAI Codex 費率表的新版 Token 計費規則、適用方案、舊版費率差異,以及查看和管理額度的注意事項。

2026-06-10
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

Claude 額度機制怎麼計算:5 小時視窗、每週限額與 Token 消耗

整理 Claude 的使用額度機制,包括 5 小時滾動視窗、每週總量限制、Token 與附件消耗,以及減少額度觸頂的實用方法。

2026-06-10
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
技術文檔

Claude Fable 5 提示詞指南:長任務、Agent 和高 effort 的遷移要點

整理 Anthropic 官方 Claude Fable 5 提示工程指南:effort 設定、長任務執行、進度校驗、邊界約束、子 Agent、記憶系統和遷移注意事項。

2026-06-10
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

Claude Fable 5 產品頁解讀:適合長任務、Agent 和高難度編碼

從 Anthropic 的 Claude Fable 5 產品頁整理它的適用場景、API 接入、價格、安全回退、30 天資料留存和企業使用注意事項。

2026-06-10
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI產業

Claude Fable 5 和 Mythos 5 發佈:Anthropic 把 Mythos 級能力推向普通使用者

整理 Anthropic 發佈 Claude Fable 5 和 Claude Mythos 5 的關鍵資訊:能力定位、安全分流、受限存取、資料留存、價格和訂閱可用性。

2026-06-10
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

Hermes Agent 桌面版發布:Windows、macOS、Linux 都能圖形化上手

整理 Hermes Agent 官方桌面版的安裝體驗、雲端與本地模型接入方式,以及它相比命令列部署更適合哪些使用者。

2026-06-10
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI產業

Vision Banana 論文解讀:圖像生成器正在變成通用視覺模型

解讀 arXiv 論文 Image Generators are Generalist Vision Learners:Vision Banana 如何把圖像生成器改造成通用視覺理解模型,以及它對計算機視覺範式的意義。

2026-06-09
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI產業

SpaceX IPO 解讀:1.7 萬億美元估值、Starlink 現金流與 AI 基礎設施敘事

基於 SpaceX 官方 IPO 公告和 SEC S-1/A 文件,整理發行規模、估值、Starlink 現金流、AI 基礎設施敘事、雙重股權結構和投資者需要關注的風險。

2026-06-08
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI產業

Anthropic Mythos / Oceanus 傳聞解讀:紅隊測試、定價猜測與開發者該看什麼

整理 Anthropic Mythos / Oceanus 相關社群傳聞、官方 Project Glasswing 背景、紅隊測試含義、傳聞定價和開發者需要關注的驗證點,區分已確認資訊與未確認傳聞。

2026-06-08
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
AI工具

MinerU 使用指南:把 PDF、Office 和圖片解析成適合 RAG 的 Markdown/JSON

整理 opendatalab/MinerU 的能力、安裝方式、命令列用法、部署選擇和適用邊界,幫助你把 PDF、Office 文件和圖片解析成可用於 RAG 與 Agent 工作流的 Markdown/JSON。

2026-06-07
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
開發工具

Understand Anything 詳細使用指南:安裝、命令、Dashboard 與知識圖譜工作流

整理 Understand Anything 的安裝方式、常用命令、Dashboard 使用方法和典型工作流,幫助開發者用知識圖譜快速理解陌生程式碼庫。

2026-06-07
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
維運

群暉 DSM 7.3 部署 Syncthing:用 Container Manager 穩定運行

整理在群暉 DSM 7.3 中透過 Container Manager 部署 Syncthing 的關鍵步驟,包括 PUID/PGID、連接埠、目錄映射和首次安全設定。

2026-06-07
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

academic-research-skills 怎麼用? Claude Code 學術研究 Skill 套件

整理 Imbad0202/academic-research-skills 計畫:它如何把文獻研究、論文寫作、同儕審查、修改和最終格式化做成 Claude Code Skill 工作流程,並強調 human-in-the-loop 和引用校驗。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
開發工具

Agent-Reach 怎麼用?給 AI Agent 存取多平台搜尋和讀取能力

整理 Panniantong/Agent-Reach 專案:它如何讓 AI Agent 透過一個 CLI 讀取和搜尋 Twitter、Reddit、YouTube、GitHub、Bilibili、小紅書等平台信息,並儘量避免 API 費用。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

career-ops 怎麼用?用 Claude Code 管理求職流程

整理 santifer/career-ops 專案:它如何用 Claude Code、14 個 skill mode、Go dashboard、PDF 產生和批次,把求職變成可自動化管理的系統。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
開發工具

CopilotKit 怎麼用?給前端應用程式接入 AI Copilot 和 Generative UI

整理 CopilotKit/CopilotKit 專案:它如何為 React、Angular、行動端、Slack 等場景提供 Agent 前端堆疊,並圍繞 Generative UI 和 AG-UI Protocol 建立 AI Copilot 體驗。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
開發工具

DeepSeek-Reasonix 怎麼用?DeepSeek 原生終端編程代理

整理 esengine/DeepSeek-Reasonix 專案:它如何圍繞 DeepSeek prefix cache 設計終端編程代理,並透過 reasonix.toml、插件、MCP 兼容工具和多模型配置降低長會話成本。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
開發工具

EverOS 怎麼用?給 AI Agent 做長期記憶的本地框架

整理 EverMind-AI/EverOS 專案:它如何把對話、Agent 軌跡和文件變成可檢索、可演化的長期記憶,並用 Markdown、SQLite 和 LanceDB 組成輕量本地儲存。

2026-06-06
閱讀時間: 2 分鐘
中文简体 English 日本語 Español
開發工具

Go 語言官方倉庫怎麼看?從源碼理解 Go 的演進

整理 golang/go 官方倉庫:它承載 Go 程式語言原始碼、標準函式庫、編譯器、runtime、issue 討論和語言演進,是理解 Go 生態的核心入口。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
開發工具

HyperFrames 怎麼用?用 HTML 寫影片的 Agent 友好工具

整理 heygen-com/hyperframes 專案:它如何讓開發者和 AI Agent 用 HTML 描述影片畫面,再渲染成影片,適合做產品展示、動態圖文和程式化影片生成。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

last30days-skill 怎麼用?讓 AI Agent 做最近 30 天趨勢研究

整理 mvanhorn/last30days-skill 專案:它如何讓 AI Agent 跨 Reddit、X、YouTube、Hacker News、Polymarket 和 Web 搜尋最近 30 天資訊,並產生帶依據的趨勢總結。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
開發工具

MemPalace 怎麼用?開源 AI 記憶系統適合哪些 Agent 場景

整理 MemPalace/mempalace 專案:它作為開源 AI 記憶系統,如何服務 LLM、Agent 和 MCP 場景,以及使用長期記憶時需要注意的邊界。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
開發工具

Microsoft MXC 是什麼?策略驅動的隔離和容器化實驗

整理 microsoft/mxc 專案:它關注 policy-driven、layered isolation and containment,用 Rust 建構策略驅動的隔離和約束能力。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
維運

NGINX 開源倉庫怎麼看? Web 伺服器、反向代理和負載平衡基礎設施

整理 nginx/nginx 官方開源倉庫:NGINX 在 Web Server、反向代理、負載平衡、快取、HTTP/2、HTTP/3、TLS 和 TCP/UDP 代理程式中的定位。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

open-notebook 怎麼用?開源版 NotebookLM 更適合自建知識學習

整理 lfnovo/open-notebook 專案:它作為開源 NotebookLM 實現,如何服務學習、筆記、知識整理和私有資料問答,並提供更靈活的自建空間。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
技術文檔

OpenAI Plugins 倉庫還值得看嗎?從外掛時代理解工具呼叫演進

整理 openai/plugins 倉庫:它作為早期 OpenAI Plugins 範例,如何幫助理解 AI 工具呼叫、插件 manifest、API 暴露和後續 Agent 工俱生態的演進。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

OpenAI Whisper 怎麼用?開源語音辨識模型的定位與邊界

整理 openai/whisper 專案:這個基於大規模弱監督訓練的開源語音辨識模型,適合做轉寫、字幕、翻譯和多語言語音處理,但生產部署仍需關注速度和資源。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

PaddleOCR 怎麼用?把 PDF 和圖片變成 AI 可用結構化數據

整理 PaddlePaddle/PaddleOCR 專案:它如何將 PDF 和圖片文件轉成結構化數據,支援 100+ 語言,並服務 OCR、文件解析、RAG 和 AI 文件理解場景。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
AI工具

Personal AI Infrastructure:個人 AI 基礎架構該怎麼搭

整理 danielmiessler/Personal_AI_Infrastructure 專案:它如何將 AI、自動化、Agent 和個人生產力組合成一套個人能力放大的基礎設施。

2026-06-06
閱讀時間: 1 分鐘
中文简体 English 日本語 Español
1 2 3 4 5 6 12
© 2022 - 2026 KnightLi的博客
记录并分享
使用 Hugo 建立
主題 Stack 由 Jimmy 設計