CLI-Anything：ソフトウェアを Agent が使えるコマンドラインに変える

CLI-Anything は HKUDS がオープンソースで公開している Agent 向けツール化プロジェクトです。目的は、人間が GUI で操作することを前提に作られたソフトウェアを、AI Agent がより呼び出しやすいコマンドラインインターフェースへ変換することです。これは簡易版ソフトウェアを作り直すものではありません。既存のコードベースと実際のバックエンドを中心に CLI harness を生成し、Agent が安定したコマンド、状態を持つセッション、構造化出力を通じてタスクを完了できるようにします。

この方向性が解決しようとしているのは、Agent がソフトウェアを使うときによく起きる断絶です。GUI 自動化はスクリーンショット、クリック、座標に依存するため、画面変更の影響を受けやすくなります。一方で単一の API はカバー範囲が不完全なことも多く、Agent が大量のコンテキストを自力でつなぎ合わせる必要があります。CLI-Anything はソフトウェア機能をコマンドラインに集約します。コマンドはモデルが読み取り、組み合わせ、検証しやすく、スクリプトや自動化フローにも接続しやすいからです。

どのように動くか

公式リポジトリでは、CLI-Anything は CLI を自動生成するパイプラインとして説明されています。ローカルのソフトウェアソースパスまたは GitHub リポジトリ URL を渡すと、プロセスはコード構造を分析し、バックエンドとデータモデルを識別し、コマンドグループを設計したうえで、CLI、テスト、ドキュメントを実装します。

生成された CLI には通常、2 つの利用方法があります。1 つは継続的な作業向けの REPL で、プロジェクト状態を保持します。もう 1 つはサブコマンドモードで、スクリプトやパイプラインに適しています。コマンドは JSON 出力も提供するため、Agent は結果を直接解析できます。同時に、デバッグ用に人間が読める形式も残されます。

公式例では、Claude Code プラグインを次のように使えます。

1
2
3


/plugin marketplace add HKUDS/CLI-Anything
/plugin install cli-anything
/cli-anything <software-path-or-repo>

あるソフトウェアの harness がすでに生成されている場合、その後の使い方は通常の Python CLI に近くなります。

1
2
3
4
5


cd <software>/agent-harness
pip install -e .
cli-anything-<software> --help
cli-anything-<software>
cli-anything-<software> --json <command>

どんな場面に向いているか

CLI-Anything は、「機能は実際のソフトウェア内にあるが、Agent が安定して操作しにくい」場面に特に向いています。たとえば画像、動画、音声、オフィス文書、3D モデリング、データ分析、AI/ML ツールチェーンなどです。プロジェクトに分析可能なコードベース、呼び出し可能なバックエンド、または明確なデータモデルがあれば、Agent が使えるコマンドセットとして包装できる可能性があります。

その価値は、コマンドラインにラッパーを 1 層追加することだけではありません。ソフトウェアの重要な操作を、発見可能で、組み合わせ可能で、テスト可能なインターフェースに変えることにあります。Agent はまず --help で機能を理解し、JSON 出力で結果を受け取り、複数のコマンドをワークフローとしてつなげられます。バッチ処理、自動検証、継続的な反復が必要なタスクでは、その場しのぎで Agent に画面をクリックさせるより制御しやすくなります。

注意すべき境界

CLI-Anything は、どんなソフトウェアでもすぐに無コストで接続できるという意味ではありません。対象ソフトウェアのソースコード、バックエンド機能、ファイル形式、テスト可能性に依存します。ソフトウェアが高度に閉じており、重要なロジックが GUI 層にしか存在しない場合、高品質な CLI を生成する難度は明らかに上がります。

公式の方法論でも、実際のバックエンドとテストによる検証が強調されています。つまり harness の生成は、いくつかのコマンドラッパースクリプトを書けば終わり、というものではありません。実務で使うには、コマンドのカバー範囲、出力形式、依存関係のインストール、実ソフトウェアの呼び出し、エンドツーエンドテストの信頼性を確認する必要があります。より現実的な使い方は、まず明確なワークフロー向けに CLI を生成し、その後 refine、test、validate などのコマンドを通じて段階的に機能を補うことです。

まとめ

CLI-Anything の考え方はとても直接的です。Agent に壊れやすい人間向けインターフェースへ適応させるのではなく、既存ソフトウェアに安定し、構造化され、テスト可能なコマンドライン入口を追加します。専門ソフトウェアを Agent ワークフローに取り込みたい人にも、「Agent ネイティブなソフトウェア」の形を研究する開発者にも向いています。実際に導入するときの焦点は、1 つのコマンドでどれだけのコードが生成されたかではなく、生成された CLI が実際の機能を呼び出し、状態を保ち、構造化結果を出力し、テストに耐えられるかどうかです。