Categories
219 ページ目
AIツール
AIツールに関する記事と実践メモをまとめています。
How to use academic-research-skills?クロード・コード学術研究スキルキット
last30daysスキルの使い方は? AI エージェントに過去 30 日間の傾向調査を行わせる
OpenAI Whisperの使い方は?オープンソース音声認識モデルの位置付けと境界
PaddleOCRの使い方は? PDF と画像を AI で使用できる構造化データに変換する
VibeVoice とは?Microsoft のオープンソース音声 AI プロジェクトは注目に値するのか
パーソナル AI インフラストラクチャ: パーソナル AI インフラストラクチャを構築する方法
オープンノートブックの使い方は? NotebookLM のオープンソース バージョンは、自己構築した知識の学習により適しています
キャリアオプスの使い方は? Claude Code で求職プロセスを管理する
Gemma 4 12B の使い方:Hugging Face モデルカードとローカル読み込みガイド
NVIDIA Nemotron 3 Ultra 発表:長時間実行 Agent 向けのオープン推論モデル
ChatGPT のメモリ機能アップグレード:Dreaming とは何か、ユーザーはどう制御できるのか
Gemma 4 12B はローカルで動く?16GB PC で試すときの考え方
MiniMax M3 発表:コード Agent、1M コンテキスト、ネイティブマルチモーダル
subagent はどれくらい token を余計に使うのか?multi-agent のコストと使い分け
AIでスマホを自動操作するならどれが強い?MobiAgent、Mobile-Agent、Mobilerun、mobile-useを比較
mobile-useの見どころ:AIが実アプリを操作し、データも抽出できる
AIにスマホを自動タップさせたい?MobilerunはAndroidとiOSに対応
AIは自分でスマホをタップし、PCを使えるのか?Mobile-Agentプロジェクトを読む
MobiAgentとは?スマホ App を操作できるオープンソース AI エージェント
RTK:AIコーディングエージェントのtokenを節約するCLIプロキシ
Codex 公式記事を読み解く:Codex を最大限に使いこなす方法
Codex Goal で目標設定に失敗する: Failed to set goal の対処方法
Codex Goal 徹底解説:AI Agent を数時間動かし続ける目標駆動ワークフロー
Ollama が Codex App に接続:ローカル LLM はどう AI コーディング Agent になるのか
RTX 3060 でも 35B は動く?llama.cpp の --n-cpu-moe で古い PC をローカル LLM に活かす
WavFlow:Meta の raw waveform space におけるオープンな音声生成プロジェクト
LongCat-Video-Avatar-1.5:美団のオープンな音声駆動デジタルヒューマン動画モデル
oh-my-codex:Codex CLI にワークフロー、スキル、実行時ガードレールを追加する
CLI-Anything:ソフトウェアを Agent が使えるコマンドラインに変える
GitHub Spec Kit とは?仕様駆動開発で AI コーディングを制御する
OpenAI Symphonyとは?Codexオーケストレーション、Issue駆動、AI Agent開発ワークフロー
Qwen3.6-35B-A3B脱獄版のローカルデプロイ:無検閲GGUF、llama.cpp、安全境界
browser-harnessのdomain skills機構:AI Agentが同じブラウザ自動化の罠を繰り返さないために
browser-harness、Playwright、Puppeteerの選び方:ブラウザ自動化ツール比較
browser-harnessとは?AI Agentが実際のChromeを操作するブラウザ自動化ツール
Gemini 3.5 Flash の位置づけと強み:高頻度、マルチモーダル、低遅延の用途に向く理由
Claude Code にもプラグインマーケットが登場:何を入れられるのか、どう入れるのか、何に注意するのか
RTX 3070 8GBでQwen3.6-35Bをローカル実行:llama.cppの導入要点と最適化パラメータ
GitHub AIオープンソースプロジェクト分類:Coding AgentからRAGナレッジベースまで
PageIndexとは?ベクトルDBを使わない推論型RAG文書インデックスを解説
Gemini 3.5 FlashとGemini Omniを無料で使う方法:一般ユーザーと開発者向け入口まとめ
Gemini Omniとは?GoogleのAI動画マルチターン編集モデルを解説
agentmemory:Claude Code、Codex、Cursorに永続メモリを持たせる
AI-Traderとは?AI Agentが売買シグナルを出し、ペーパートレードできるプラットフォーム
AIにPCを操作させる?UI-TARS-desktopはデスクトップ、ブラウザ、ツールをつなぐ
CloakBrowserとは?PlaywrightとPuppeteerに、より実ユーザーに近いブラウザを使わせる
投稿先が多すぎて大変?AiToEarnはAI Agentでクリエイターの作業を減らそうとしている
llama.cpp b9196アップデート:Windowsプリビルド版がCUDA 13.1、Vulkan、HIP、SYCLに対応
主流AI PPTツール総まとめ:自動生成、Webスライド、PPTX、画像ルートをどう選ぶか
wx-cli 解説:コマンドラインでローカルの WeChat チャット履歴を検索する
1
2
3
4
5