メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.factory.ai/llms.txt

Use this file to discover all available pages before exploring further.

Droid Controlは、Droidsがソフトウェアを操作できるようにします:アプリの起動、コマンドの入力、ボタンのクリック、動作の記録、そして洗練された動画証拠の生成を行います。Droidsによって、Droidsのために作られました。

提供される機能

主張の検証

動作に関する主張が真実かどうかをテストし、いずれの場合も証拠を生成します。演出も偏見もなく、ただ調査のみを行います。

QAフローの実行

ターミナルCLI、Webアプリ、またはElectronアプリをエンドツーエンドフローで操作します。注釈付きスクリーンショットで合格/不合格を報告します。

デモの記録

タイトルカード、キーストロークオーバーレイ、ウィンドウクロームを含む、PRの洗練されたビフォーアフター比較動画を生成します。

始め方

Droidセッションで/pluginsを実行し、Browseタブに移動してdroid-controlを見つけ、インストールしてください。
動画レンダリングの場合、プラグイン追加後にRemotionの依存関係を一度インストールする必要があります:
droid plugin list --scope user
cd <plugin-path>/remotion && npm install
使用ケースに応じてランタイムツール(tuistory、agent-browser、ffmpeg など)も必要です。使用ケース別のインストールコマンドについては前提条件を参照してください。

コマンド

Droid Controlは3つのスラッシュコマンドを追加します。それぞれが計画、実行、記録、報告という全ワークフローをエンドツーエンドで処理します。
機能やPRのデモ動画を記録します。
    /demo pr-1847
PRの番号、GitHub URL、またはフリーテキストの説明を受け付けます。比較PRはデフォルトでサイドバイサイドレイアウトになり、新機能は単一ブランチになります。追加の調整用フラグを追加します:
    /demo pr-1847 -- showcase, keys
FlagEffect
showcase暖かい背景とフィルムグレインを使用したシネマティックプリセット
keysユーザーアクションを表示するキーストロークオーバーレイピル

仕組み

1

変更を理解する

PRの説明、差分、リンクされたチケットを取得します。各変更について、証明すべき内容と閲覧者が混乱する可能性のある要素を特定します。
2

インタラクションを計画する

機能が動作することを可視的に証明するアクションシーケンスをスクリプト化します。両方のブランチで同じインタラクションを実行するため、動作のみが異なります。計画を提示し、録画前にあなたの承認を待ちます。
3

両方のブランチをキャプチャする

ワーカーサブエージェントを使用して、ベースラインブランチと候補ブランチで並行して録画セッションを開始します。
4

動画を合成する

Remotionを使用してタイトルカード、ウィンドウクローム、エフェクトを含む洗練された動画をレンダリングします。シネマティック(factory)から実用的(minimal)まで6つのビジュアルプリセットがあります。
5

出力を検証する

配信前に最終動画が元のコミットメントに対して適合しているかチェックします。

出力例

以下のビデオはすべてDroidによって計画、録画、レンダリングされました。

自動化ドライバー

Droid Controlは3つの自動化バックエンドをサポートしています。対象に基づいて適切なものが自動的に選択されます。

tuistory

仮想PTY自動化。 ターミナル作業のデフォルト。asciinema録画と強制トゥルーカラー出力を備えたPlaywright風CLI。

true-input

リアルターミナルエミュレーター。 ヘッドレスWaylandコンポジター(Linux)、KVM/QEMU(Windows)、またはQEMUモニター(macOS)。実際のレンダリング証拠が必要な場合に使用。

agent-browser

ウェブとElectronアプリ。 Chrome DevTools Protocolサポートを備えたPlaywrightベースのCLI。ページをナビゲートし、フォームを記入し、ボタンをクリックし、スクリーンショットを取得。

ビデオレンダリング

デモとショーケースビデオは、ReactベースのビデオエンジンであるRemotionでレンダリングされます。プラグインには23の視覚コンポーネントと6つのプリセットが含まれています。
プリセット外観最適な用途
factory暖かい黒、信号機、アンバーグロー公式Factoryコンテンツ
factory-hero同上 + グラデーション背景ランディングページ、ソーシャル
heroクールなグラデーション、余裕のあるマージンFactory以外のマーケティング
macosダーク、クリーンなフレーム汎用デモ
presentation黒、余裕のあるマージンスライドデッキ、発表
minimalウィンドウバーなし、タイトなマージンドキュメント埋め込み、インラインクリップ
  • 暖かい放射状背景、浮遊パーティクル、フィルムグレインオーバーレイ、カラーグレーディング
  • 設定可能なタイトル-コンテンツ遷移(motion-blur, flash, whip-pan, light-leak, glitch-lite
  • 信号機とガラスモーフィックボーダー付きアニメーションウィンドウクローム
  • 自動スケールタイトル/サブタイトルテキスト
  • 特定の領域をハイライトするスポットライトオーバーレイ
  • 小さなテキストや詳細のための指向性ズーム
  • ユーザーアクションを表示するキーストロークピル
  • セクションヘッダーと遷移スイープ
  • ソース変更オーバーレイのシンタックスハイライトされたコード注釈

アーキテクチャ

プラグインは3つのレイヤーからなる構成アーキテクチャを使用しています:
  • オーケストレーター — 各リクエストを3つの独立したルックアップ(対象、ステージ、アーティファクト)を通じてルーティングし、読み込むスキルを決定します。
  • 10のアトムスキル — オンデマンドで読み込まれる自己完結型の背景知識で、ドライバー、対象、ステージ、ポリッシュに分割されています。
  • 3つのコマンド — 引数をコミットメントに解析し、ハイブリッドハンドオフを介してアトムに委任します。
すべてのワークフローはキャプチャ → 合成 → 検証を通じて流れます。コマンドは何を生成するかを宣言し、アトムがどのように行うかを所有します。スキルはハードコードされたパイプラインではなく明示的なハンドオフを通じてチェーンするため、droidは自然にフローに従います。

アーキテクチャの詳細

設計の根拠:droidのためのUX、ウォーターフォールルーティング、タスク委任、ハイブリッドハンドオフ。

前提条件

使用ケースに必要なもののみをインストールしてください。
npm install -g tuistory                                # virtual PTY driver
pip install asciinema                                   # terminal recording
cargo install --git https://github.com/asciinema/agg   # .cast → .gif converter
sudo apt-get install -y ffmpeg                          # video processing
agent-browser install   # downloads Chromium
プラットフォーム必要なツール
Linux/Waylandcagewtype、Wayland対応ターミナル
Windows (KVM)libvirtqemu、SSH対応KVM VM
macOS (QEMU)qemusocat、SSH対応macOS VM
Node.js >= 18、Chrome/Chromium、ffmpegffprobeaggが必要です。

関連項目

ソースコード

完全なプラグインソース:スキル、コマンド、スクリプト、Remotionコンポーネント。

プラグイン

プラグインの仕組み、インストール方法、独自プラグインの構築方法を学ぶ。

自動QAスキル

CI統合、障害学習、構造化レポートによる高度なQA自動化。

README

クイックスタート、コマンドリファレンス、前提条件。