<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>Live2D on KnightLi的博客</title>
        <link>https://knightli.com/tags/live2d/</link>
        <description>Recent content in Live2D on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Wed, 10 Jun 2026 15:00:15 +0800</lastBuildDate><atom:link href="https://knightli.com/tags/live2d/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Open-LLM-VTuber 怎么用？把本地 LLM 变成会说话的 Live2D 角色</title>
        <link>https://knightli.com/2026/06/10/open-llm-vtuber-local-ai-companion-live2d/</link>
        <pubDate>Wed, 10 Jun 2026 15:00:15 +0800</pubDate>
        
        <guid>https://knightli.com/2026/06/10/open-llm-vtuber-local-ai-companion-live2d/</guid>
        <description>&lt;p&gt;&lt;code&gt;Open-LLM-VTuber/Open-LLM-VTuber&lt;/code&gt; 是 GitHub Weekly Trending 上一个很有辨识度的项目。它不是普通聊天机器人，也不是单纯的 Live2D 桌宠，而是把 LLM、语音识别、语音合成、视觉感知和 Live2D 角色整合到一起，做成一个可以本地运行的 AI 伴侣。&lt;/p&gt;
&lt;p&gt;项目 README 的描述很直白：你可以用免手动输入的语音交互和任意 LLM 对话，支持语音打断、Live2D 表情、桌面宠物模式，并且可以跨 Windows、macOS、Linux 运行。它最初的目标，是用开源方案复刻类似 &lt;code&gt;neuro-sama&lt;/code&gt; 的 AI VTuber 体验。&lt;/p&gt;
&lt;h2 id=&#34;它解决什么问题&#34;&gt;它解决什么问题
&lt;/h2&gt;&lt;p&gt;普通 LLM 聊天更多停留在文本框里。你打字，它回复；最多再接一个 TTS，把文字读出来。&lt;/p&gt;
&lt;p&gt;Open-LLM-VTuber 想做的是更完整的“角色交互层”：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;你可以直接说话，不必一直打字；&lt;/li&gt;
&lt;li&gt;AI 可以用语音回应；&lt;/li&gt;
&lt;li&gt;角色可以通过 Live2D 做表情和动作反馈；&lt;/li&gt;
&lt;li&gt;前端可以读取摄像头、屏幕录制或截图，让角色“看到”环境；&lt;/li&gt;
&lt;li&gt;桌面客户端可以用透明背景和置顶模式变成桌宠；&lt;/li&gt;
&lt;li&gt;后端可以切换不同 LLM、ASR 和 TTS 模块。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这类项目的价值不在于让模型更聪明，而是把模型从“问答窗口”变成“持续陪伴和交互界面”。对直播、桌面助手、二次元角色、虚拟陪伴和本地语音控制来说，这个方向很自然。&lt;/p&gt;
&lt;h2 id=&#34;核心能力一览&#34;&gt;核心能力一览
&lt;/h2&gt;&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;模块&lt;/th&gt;
          &lt;th&gt;能力&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;LLM&lt;/td&gt;
          &lt;td&gt;支持 Ollama、OpenAI 兼容 API、Gemini、Claude、Mistral、DeepSeek、智谱、GGUF、LM Studio、vLLM 等&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;ASR&lt;/td&gt;
          &lt;td&gt;支持 sherpa-onnx、FunASR、Faster-Whisper、Whisper.cpp、Whisper、Groq Whisper、Azure ASR 等&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;TTS&lt;/td&gt;
          &lt;td&gt;支持 sherpa-onnx、pyttsx3、MeloTTS、Coqui-TTS、GPT-SoVITS、Bark、CosyVoice、Edge TTS、Fish Audio、Azure TTS 等&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;角色表现&lt;/td&gt;
          &lt;td&gt;Live2D 表情、触摸反馈、桌宠模式、透明背景、全局置顶&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;视觉感知&lt;/td&gt;
          &lt;td&gt;支持摄像头、屏幕录制和截图输入&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;对话体验&lt;/td&gt;
          &lt;td&gt;语音打断、聊天记录持久化、主动说话、内部想法显示&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;部署方式&lt;/td&gt;
          &lt;td&gt;Web 版本和桌面客户端，支持 Windows、macOS、Linux&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;从这个表可以看出，Open-LLM-VTuber 更像一个可组合的 AI 角色框架，而不是绑定某个单一模型的应用。&lt;/p&gt;
&lt;h2 id=&#34;本地离线是它的重点&#34;&gt;本地离线是它的重点
&lt;/h2&gt;&lt;p&gt;项目强调可以完全离线运行。也就是说，你可以用本地 LLM、本地 ASR、本地 TTS，把聊天内容留在自己的电脑上。&lt;/p&gt;
&lt;p&gt;这对 AI 伴侣类应用很重要。因为语音对话、摄像头、屏幕截图和长期聊天记录都比较敏感。如果全部依赖云端 API，隐私和成本都会变成问题。&lt;/p&gt;
&lt;p&gt;当然，离线不等于零成本。你需要准备：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;能跑 LLM 的本地硬件，或者接受较小模型的效果；&lt;/li&gt;
&lt;li&gt;ASR 和 TTS 所需的模型文件；&lt;/li&gt;
&lt;li&gt;&lt;code&gt;ffmpeg&lt;/code&gt;、&lt;code&gt;uv&lt;/code&gt; 等安装依赖；&lt;/li&gt;
&lt;li&gt;对 Live2D 模型、语音模型和配置文件有基本理解；&lt;/li&gt;
&lt;li&gt;足够耐心处理不同平台的音频、麦克风和显卡兼容问题。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果你只想“打开就用”，这类项目可能会比托管聊天产品麻烦。但如果你想要可控、可改、可本地化，它的空间就大很多。&lt;/p&gt;
&lt;h2 id=&#34;语音打断很关键&#34;&gt;语音打断很关键
&lt;/h2&gt;&lt;p&gt;README 里特别提到 voice interruption，也就是用户可以在 AI 说话时打断它。&lt;/p&gt;
&lt;p&gt;这个功能看似小，实际非常影响体验。没有打断能力的语音助手，经常会变成“你必须等它把一整段话说完”。一旦模型开始啰嗦，交互就会很别扭。&lt;/p&gt;
&lt;p&gt;Open-LLM-VTuber 还强调在不戴耳机的情况下避免 AI 听到自己的声音。这背后涉及回声、麦克风拾音和前端音频处理。对实时语音交互来说，这些工程细节比单纯调用一个 LLM API 更难。&lt;/p&gt;
&lt;h2 id=&#34;live2d-不只是装饰&#34;&gt;Live2D 不只是装饰
&lt;/h2&gt;&lt;p&gt;很多人会把 Live2D 看成皮肤，但在 AI 角色项目里，它更像交互反馈层。&lt;/p&gt;
&lt;p&gt;角色表情、动作、触摸反馈、桌面宠物模式，能让用户更容易感知系统状态。比如 AI 正在听、正在思考、正在说话、情绪发生变化，这些都可以通过视觉表现传达出来。&lt;/p&gt;
&lt;p&gt;Open-LLM-VTuber 支持后端情绪映射到 Live2D 表情，也支持导入自定义 Live2D 模型。你可以修改 Prompt 塑造人设，也可以通过声音克隆让角色拥有更匹配的音色。&lt;/p&gt;
&lt;p&gt;不过这里也有版权和授权问题。项目仓库里说明，包含的 Live2D 示例模型遵循 Live2D Inc. 的单独许可，不属于项目 MIT 许可证覆盖范围。商业使用时要特别注意模型素材授权。&lt;/p&gt;
&lt;h2 id=&#34;适合什么人&#34;&gt;适合什么人
&lt;/h2&gt;&lt;p&gt;Open-LLM-VTuber 适合这些用户：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;想自建 AI VTuber 或 AI 桌宠；&lt;/li&gt;
&lt;li&gt;想把本地 LLM 做成语音交互应用；&lt;/li&gt;
&lt;li&gt;喜欢 Live2D 角色和人设定制；&lt;/li&gt;
&lt;li&gt;想研究 ASR、TTS、LLM 和前端角色联动；&lt;/li&gt;
&lt;li&gt;希望语音、视觉和聊天记录尽量留在本地；&lt;/li&gt;
&lt;li&gt;想做直播互动、陪伴机器人或个人桌面助手原型。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它不太适合只想要一个普通聊天工具的人。因为它牵涉的模块很多：LLM、ASR、TTS、前端、Live2D、音频设备、配置文件、模型下载，每一层都可能需要调试。&lt;/p&gt;
&lt;h2 id=&#34;使用前的注意点&#34;&gt;使用前的注意点
&lt;/h2&gt;&lt;p&gt;第一，项目仍处于活跃开发阶段。README 提到团队正在规划 v2.0，并且 v2.0 会是一次完整重写。也就是说，现有 v1 的配置和接口未来可能变化。&lt;/p&gt;
&lt;p&gt;第二，远程访问需要 HTTPS。README 明确提醒，如果服务器跑在一台电脑上、前端从另一台设备访问，浏览器麦克风通常需要 secure context，也就是 HTTPS 或 localhost。&lt;/p&gt;
&lt;p&gt;第三，本地全离线模式对硬件要求不低。如果 LLM、ASR、TTS 都本地跑，CPU/GPU、内存和显存都会参与。低配机器可以用云 API 或轻量模型折中。&lt;/p&gt;
&lt;p&gt;第四，角色类应用容易让用户高估模型“人格”。本质上它仍然是 LLM 加上语音和视觉交互层，不应该把它当成真正具备稳定人格、承诺能力或专业判断的对象。&lt;/p&gt;
&lt;h2 id=&#34;结论&#34;&gt;结论
&lt;/h2&gt;&lt;p&gt;Open-LLM-VTuber 的看点，是它把很多原本分散的能力组合成一个具体体验：你不只是和模型聊天，而是在和一个有声音、有表情、能看屏幕、能被打断、能待在桌面上的角色互动。&lt;/p&gt;
&lt;p&gt;这类项目会越来越多。LLM 的入口不一定永远是文本框，也可能是语音助手、桌面宠物、虚拟主播、学习陪伴和游戏 NPC。Open-LLM-VTuber 还不算“开箱即完美”，但它已经很适合拿来研究本地 AI 角色系统该怎么拼起来。&lt;/p&gt;
&lt;p&gt;参考来源：&lt;a class=&#34;link&#34; href=&#34;https://github.com/trending?since=weekly&amp;amp;spoken_language_code=&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;GitHub Weekly Trending&lt;/a&gt;、&lt;a class=&#34;link&#34; href=&#34;https://github.com/Open-LLM-VTuber/Open-LLM-VTuber&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Open-LLM-VTuber/Open-LLM-VTuber&lt;/a&gt;&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
