Droid Controlは、Droidsがソフトウェアを操作できるようにします:アプリの起動、コマンドの入力、ボタンのクリック、動作の記録、そして洗練された動画証拠の生成を行います。Droidsによって、Droidsのために作られました。Documentation Index
Fetch the complete documentation index at: https://docs.factory.ai/llms.txt
Use this file to discover all available pages before exploring further.
提供される機能
主張の検証
動作に関する主張が真実かどうかをテストし、いずれの場合も証拠を生成します。演出も偏見もなく、ただ調査のみを行います。
QAフローの実行
ターミナルCLI、Webアプリ、またはElectronアプリをエンドツーエンドフローで操作します。注釈付きスクリーンショットで合格/不合格を報告します。
デモの記録
タイトルカード、キーストロークオーバーレイ、ウィンドウクロームを含む、PRの洗練されたビフォーアフター比較動画を生成します。
始め方
- UI
- CLI
Droidセッションで
/pluginsを実行し、Browseタブに移動してdroid-controlを見つけ、インストールしてください。使用ケースに応じてランタイムツール(tuistory、agent-browser、ffmpeg など)も必要です。使用ケース別のインストールコマンドについては前提条件を参照してください。
コマンド
Droid Controlは3つのスラッシュコマンドを追加します。それぞれが計画、実行、記録、報告という全ワークフローをエンドツーエンドで処理します。- /demo
- /verify
- /qa-test
機能やPRのデモ動画を記録します。PRの番号、GitHub URL、またはフリーテキストの説明を受け付けます。比較PRはデフォルトでサイドバイサイドレイアウトになり、新機能は単一ブランチになります。追加の調整用フラグを追加します:
| Flag | Effect |
|---|---|
showcase | 暖かい背景とフィルムグレインを使用したシネマティックプリセット |
keys | ユーザーアクションを表示するキーストロークオーバーレイピル |
仕組み
インタラクションを計画する
機能が動作することを可視的に証明するアクションシーケンスをスクリプト化します。両方のブランチで同じインタラクションを実行するため、動作のみが異なります。計画を提示し、録画前にあなたの承認を待ちます。
動画を合成する
Remotionを使用してタイトルカード、ウィンドウクローム、エフェクトを含む洗練された動画をレンダリングします。シネマティック(
factory)から実用的(minimal)まで6つのビジュアルプリセットがあります。出力例
以下のビデオはすべてDroidによって計画、録画、レンダリングされました。- CLI: シングルブランチ
- CLI: 変更前/後
- ウェブ: シングルブランチ
- ウェブ: 変更前/後
自動化ドライバー
Droid Controlは3つの自動化バックエンドをサポートしています。対象に基づいて適切なものが自動的に選択されます。tuistory
仮想PTY自動化。 ターミナル作業のデフォルト。asciinema録画と強制トゥルーカラー出力を備えたPlaywright風CLI。
true-input
リアルターミナルエミュレーター。 ヘッドレスWaylandコンポジター(Linux)、KVM/QEMU(Windows)、またはQEMUモニター(macOS)。実際のレンダリング証拠が必要な場合に使用。
agent-browser
ウェブとElectronアプリ。 Chrome DevTools Protocolサポートを備えたPlaywrightベースのCLI。ページをナビゲートし、フォームを記入し、ボタンをクリックし、スクリーンショットを取得。
ビデオレンダリング
デモとショーケースビデオは、ReactベースのビデオエンジンであるRemotionでレンダリングされます。プラグインには23の視覚コンポーネントと6つのプリセットが含まれています。視覚プリセット
視覚プリセット
| プリセット | 外観 | 最適な用途 |
|---|---|---|
factory | 暖かい黒、信号機、アンバーグロー | 公式Factoryコンテンツ |
factory-hero | 同上 + グラデーション背景 | ランディングページ、ソーシャル |
hero | クールなグラデーション、余裕のあるマージン | Factory以外のマーケティング |
macos | ダーク、クリーンなフレーム | 汎用デモ |
presentation | 黒、余裕のあるマージン | スライドデッキ、発表 |
minimal | ウィンドウバーなし、タイトなマージン | ドキュメント埋め込み、インラインクリップ |
自動レイヤー(常に存在)
自動レイヤー(常に存在)
- 暖かい放射状背景、浮遊パーティクル、フィルムグレインオーバーレイ、カラーグレーディング
- 設定可能なタイトル-コンテンツ遷移(
motion-blur,flash,whip-pan,light-leak,glitch-lite) - 信号機とガラスモーフィックボーダー付きアニメーションウィンドウクローム
- 自動スケールタイトル/サブタイトルテキスト
エフェクトレイヤー(合成時に選択)
エフェクトレイヤー(合成時に選択)
- 特定の領域をハイライトするスポットライトオーバーレイ
- 小さなテキストや詳細のための指向性ズーム
- ユーザーアクションを表示するキーストロークピル
- セクションヘッダーと遷移スイープ
- ソース変更オーバーレイのシンタックスハイライトされたコード注釈
アーキテクチャ
プラグインは3つのレイヤーからなる構成アーキテクチャを使用しています:- オーケストレーター — 各リクエストを3つの独立したルックアップ(対象、ステージ、アーティファクト)を通じてルーティングし、読み込むスキルを決定します。
- 10のアトムスキル — オンデマンドで読み込まれる自己完結型の背景知識で、ドライバー、対象、ステージ、ポリッシュに分割されています。
- 3つのコマンド — 引数をコミットメントに解析し、ハイブリッドハンドオフを介してアトムに委任します。
アーキテクチャの詳細
設計の根拠:droidのためのUX、ウォーターフォールルーティング、タスク委任、ハイブリッドハンドオフ。
前提条件
使用ケースに必要なもののみをインストールしてください。ターミナルデモ(tuistory)
ターミナルデモ(tuistory)
Web/Electronの自動化 (agent-browser)
Web/Electronの自動化 (agent-browser)
実際のターミナルエミュレータ(true-input)
実際のターミナルエミュレータ(true-input)
| プラットフォーム | 必要なツール |
|---|---|
| Linux/Wayland | cage、wtype、Wayland対応ターミナル |
| Windows (KVM) | libvirt、qemu、SSH対応KVM VM |
| macOS (QEMU) | qemu、socat、SSH対応macOS VM |
ビデオ合成(showcase)
ビデオ合成(showcase)
Node.js >= 18、Chrome/Chromium、
ffmpeg、ffprobe、aggが必要です。関連項目
ソースコード
完全なプラグインソース:スキル、コマンド、スクリプト、Remotionコンポーネント。
プラグイン
プラグインの仕組み、インストール方法、独自プラグインの構築方法を学ぶ。
自動QAスキル
CI統合、障害学習、構造化レポートによる高度なQA自動化。
README
クイックスタート、コマンドリファレンス、前提条件。
