OTEL‑ネイティブなメトリクスとトレース
Droidは、組織全体でどのように使用されているかを把握するOTELシグナルを出力します。主要なメトリクスファミリー
メトリクスカテゴリの例には以下が含まれます:-
セッションメトリクス
- インタラクティブセッションとヘッドレスセッションの数
- セッション時間とアクティブなエンゲージメント時間
-
LLM使用メトリクス
- モデルおよびプロバイダー別のトークン入力/出力
- リクエスト数とレイテンシ
- エラー率とリトライ動作
-
ツール使用メトリクス
- ツール呼び出しと実行時間
- 成功/失敗率
- 提案および実行されたコマンドリスクレベル
-
コード変更メトリクス
- 変更、作成、削除されたファイルと行数
- リポジトリおよびチーム間の分布
トレースとスパン
トレースは、セッションまたは自動化実行のライフサイクルを示すことができます:- セッション開始 → プロンプト構築 → LLM呼び出し → ツール実行 → コード編集 → 検証
- スパンは、モデル選択、呼び出されたツール、エラー条件など、各ステップのタイミングとメタデータを記録します
Factoryクラウド分析(オプション)
クラウド管理されたデプロイメントでは、Factoryはプラットフォームチームとリーダーシップチーム向けのホスト分析ビューを提供できます。 典型的なビューには以下が含まれます:- 組織、チーム、リポジトリ別の導入メトリクス
- モデル使用とパフォーマンストレンド
- LLM使用の概略コスト推定
- 頻度別のトップワークフローとドロイド
コスト管理戦略
LLMコスト制御は、モデルポリシー、使用パターン、オブザーバビリティの組み合わせです。 推奨される実践方法:Constrain the model catalog
Constrain the model catalog
Use org‑level policies to limit which models are available.
- Prefer smaller models for everyday tasks; reserve large models for complicated refactors or design work.
- Disable experimental or high‑cost models by default.
- Enforce model choices per environment (for example, cheaper models in CI).
Tune autonomy and context usage
Tune autonomy and context usage
Higher autonomy and larger context windows consume more tokens.
- Set reasonable defaults for autonomy level and reasoning effort.
- Use hooks to cap context size or block unnecessary large prompts.
- Encourage teams to iterate with tighter scopes (for example, specific directories instead of entire monorepos).
Use OTEL for cost monitoring
Use OTEL for cost monitoring
Feed token and request metrics into your observability stack.
- Build per‑team and per‑model dashboards.
- Alert on unusual spikes in usage.
- Compare cost curves before and after policy changes.
生産性への影響の測定
コストは結果の文脈でのみ意味を持ちます。OTELを使用することで、Droidの使用を既に追跡しているソフトウェア配信と品質メトリクスと関連付けることができます。 一般的なアプローチ:- DroidセッションのOTELトレースをCIビルド、テスト実行、デプロイメントパイプラインと関連付ける
- インシデントの削減、アラートの解決、テストカバレッジの改善につながる変更にDroidがどの程度関与しているかを測定する
- コード変更メトリクスを使用して自動化の影響を推定する(例:リファクタリングまたは移行されたコード行数)
