メインコンテンツへスキップ
DeepInfraの最適化されたインフラストラクチャで、幅広いオープンソースモデルに対するコスト効率的な推論にアクセスできます。

設定

~/.factory/settings.jsonに追加してください:
{
  "customModels": [
    {
      "model": "zai-org/GLM-4.7",
      "displayName": "GLM-4.7 [DeepInfra]",
      "baseUrl": "https://api.deepinfra.com/v1/openai",
      "apiKey": "YOUR_DEEPINFRA_TOKEN",
      "provider": "generic-chat-completion-api",
      "maxOutputTokens": 16384
    },
    {
      "model": "deepseek-ai/DeepSeek-V3.1-Terminus",
      "displayName": "DeepSeek V3.1 Terminus [DeepInfra]",
      "baseUrl": "https://api.deepinfra.com/v1/openai",
      "apiKey": "YOUR_DEEPINFRA_TOKEN",
      "provider": "generic-chat-completion-api",
      "maxOutputTokens": 16384
    },
    {
      "model": "moonshotai/Kimi-K2-Instruct-0905",
      "displayName": "Kimi K2 Instruct [DeepInfra]",
      "baseUrl": "https://api.deepinfra.com/v1/openai",
      "apiKey": "YOUR_DEEPINFRA_TOKEN",
      "provider": "generic-chat-completion-api",
      "maxOutputTokens": 32768
    },
    {
      "model": "Qwen/Qwen3-Coder-480B-A35B-Instruct-Turbo",
      "displayName": "Qwen3 Coder 480B [DeepInfra]",
      "baseUrl": "https://api.deepinfra.com/v1/openai",
      "apiKey": "YOUR_DEEPINFRA_TOKEN",
      "provider": "generic-chat-completion-api",
      "maxOutputTokens": 32768
    }
  ]
}

はじめに

  1. deepinfra.comでサインアップしてください
  2. ダッシュボードからAPI tokenを取得してください
  3. model listで利用可能なモデルを確認してください
  4. 希望するモデルを設定に追加してください

注意事項

  • Base URLの形式:https://api.deepinfra.com/v1/openai
  • モデル名はHugging Faceのリポジトリ形式に一致します
  • OpenAI互換のAPIをサポートしています
  • 新しいバージョンがリリースされた際の自動モデル更新