Categories
227 ページ目
AIツール
AIツールに関する記事と実践メモをまとめています。
Open-LLM-VTuber の使い方:ローカル LLM を話せる Live2D キャラクターにする
turbovec とは?ローカル RAG のメモリを節約する Rust 製ベクトルインデックス
Loops が Prompts に取って代わる:ループエンジニアリングが AI Agent の使い方を変える
Codex はいくらかかる?新しい料金表、Token 消費、節約の考え方
Claudeの利用上限の仕組み:5時間枠、週間上限、Token消費
Claude Fable 5 製品ページ解説:長時間タスク、Agent、高難度コーディング向け
Hermes Agent デスクトップ版が公開:Windows、macOS、Linux でGUIから使い始められる
MinerU 使用ガイド:PDF、Office、画像を RAG 向け Markdown/JSON に解析する
How to use academic-research-skills?クロード・コード学術研究スキルキット
last30daysスキルの使い方は? AI エージェントに過去 30 日間の傾向調査を行わせる
OpenAI Whisperの使い方は?オープンソース音声認識モデルの位置付けと境界
PaddleOCRの使い方は? PDF と画像を AI で使用できる構造化データに変換する
VibeVoice とは?Microsoft のオープンソース音声 AI プロジェクトは注目に値するのか
パーソナル AI インフラストラクチャ: パーソナル AI インフラストラクチャを構築する方法
オープンノートブックの使い方は? NotebookLM のオープンソース バージョンは、自己構築した知識の学習により適しています
キャリアオプスの使い方は? Claude Code で求職プロセスを管理する
Gemma 4 12B の使い方:Hugging Face モデルカードとローカル読み込みガイド
NVIDIA Nemotron 3 Ultra 発表:長時間実行 Agent 向けのオープン推論モデル
ChatGPT のメモリ機能アップグレード:Dreaming とは何か、ユーザーはどう制御できるのか
Gemma 4 12B はローカルで動く?16GB PC で試すときの考え方
MiniMax M3 発表:コード Agent、1M コンテキスト、ネイティブマルチモーダル
subagent はどれくらい token を余計に使うのか?multi-agent のコストと使い分け
AIでスマホを自動操作するならどれが強い?MobiAgent、Mobile-Agent、Mobilerun、mobile-useを比較
mobile-useの見どころ:AIが実アプリを操作し、データも抽出できる
AIにスマホを自動タップさせたい?MobilerunはAndroidとiOSに対応
AIは自分でスマホをタップし、PCを使えるのか?Mobile-Agentプロジェクトを読む
MobiAgentとは?スマホ App を操作できるオープンソース AI エージェント
RTK:AIコーディングエージェントのtokenを節約するCLIプロキシ
Codex 公式記事を読み解く:Codex を最大限に使いこなす方法
Codex Goal で目標設定に失敗する: Failed to set goal の対処方法
Codex Goal 徹底解説:AI Agent を数時間動かし続ける目標駆動ワークフロー
Ollama が Codex App に接続:ローカル LLM はどう AI コーディング Agent になるのか
RTX 3060 でも 35B は動く?llama.cpp の --n-cpu-moe で古い PC をローカル LLM に活かす
WavFlow:Meta の raw waveform space におけるオープンな音声生成プロジェクト
LongCat-Video-Avatar-1.5:美団のオープンな音声駆動デジタルヒューマン動画モデル
oh-my-codex:Codex CLI にワークフロー、スキル、実行時ガードレールを追加する
CLI-Anything:ソフトウェアを Agent が使えるコマンドラインに変える
GitHub Spec Kit とは?仕様駆動開発で AI コーディングを制御する
OpenAI Symphonyとは?Codexオーケストレーション、Issue駆動、AI Agent開発ワークフロー
Qwen3.6-35B-A3B脱獄版のローカルデプロイ:無検閲GGUF、llama.cpp、安全境界
browser-harnessのdomain skills機構:AI Agentが同じブラウザ自動化の罠を繰り返さないために
browser-harness、Playwright、Puppeteerの選び方:ブラウザ自動化ツール比較
browser-harnessとは?AI Agentが実際のChromeを操作するブラウザ自動化ツール
Gemini 3.5 Flash の位置づけと強み:高頻度、マルチモーダル、低遅延の用途に向く理由
Claude Code にもプラグインマーケットが登場:何を入れられるのか、どう入れるのか、何に注意するのか
RTX 3070 8GBでQwen3.6-35Bをローカル実行:llama.cppの導入要点と最適化パラメータ
GitHub AIオープンソースプロジェクト分類:Coding AgentからRAG、ローカル音声キャラクター、自動化ツールまで
PageIndexとは?ベクトルDBを使わない推論型RAG文書インデックスを解説
Gemini 3.5 FlashとGemini Omniを無料で使う方法:一般ユーザーと開発者向け入口まとめ
Gemini Omniとは?GoogleのAI動画マルチターン編集モデルを解説
1
2
3
4
5