Skip to content

ryukez/factorio-learning-environment

 
 

Repository files navigation

Factorio Learning Environment

オリジナル版 を独自にカスタマイズして扱いやすくしたリポジトリ

Usage

  1. Factorio サーバーの立ち上げ
cd extension && docker compose up

公開しているイメージを使ってすぐにサーバーを起動できます。 cluster/docker 以下で手元でイメージをビルドすることもできます。詳細はオリジナル版を参照してください。

※ Factorio サーバーは、エージェントやゲームクライアントとは別のマシンで実行することもできます。その場合はサーバーのアドレスで指定している localhost をマシンの IP アドレスに変更してください。

  1. ゲームクライアントからサーバーにログイン

ライセンスの認証のため、一度ゲームクライアントからのログインが必要です。 マルチプレイで localhost:34197 を指定して接続します。 ログインできたら、ゲームの中の様子を観察できるようそのままにしておきます。

  1. SQLite のセットアップ

エージェントの実行を記録するためのデータベースのセットアップが必要です。 sqlite3 をインストールし、extension/ で以下を実行します。

sqlite3 mydatabase.db < create_table.sql
  1. 環境変数の設定 extension/.example.env をコピーして.env ファイルを作成し、以下を設定します。
  • 利用するプロバイダーの API キー。OpenRouter が便利です
  • SQLITE_DB_FILE: 先ほど設定した DB ファイルのパス
  1. 実行設定

最後に extension/freeplay/configs/run_config.json で実行の設定を行います。

[
  {
    "task": "open_play.json", // そのままでOK
    "version": "20240330006", // 実行するエージェントのバージョンを自由に指定
    "model": "open-router-google/gemini-2.0-flash-001", // 利用するモデルのバージョン。OpenRouterの場合 `open-router-{model_name}`。それ以外はagents/utils/llm_factoryの実装を参照してください
    "runtime_version": "f923451" // 実行環境のバージョンとしてこのリポジトリのコミットハッシュを入れておく
  }
]
  1. 実行
# ライブラリのインストール
uv venv && source .venv/bin/activate && uv sync

python extension/freeplay/run.py --run_config extension/freeplay/configs/run_config.json

ゲームクライアントでログインしているのに Player hasn't been initialised into the game. Please log in once to make this node operational. というエラーが出た場合は、もう一度実行すると直ります。

イテレーションの開始ごとに指示を入力してください(例:発電所を建設する、鉄板の生産を自動化する、太陽光発電の研究を完了させる)。 入力するとイテレーションの実行が開始され、既定ステップを繰り返すとまた指示の待機待ちになります。

オリジナル実装からの差分

  • agent や 実行ログの保存について取り回しやすく実装し直した (extension/core)
  • 全ての実行履歴をエージェントに渡す代わりに、イテレーションという単位を導入し、数十回の実行ごとに履歴がリセットされるようにした。(オリジナル版では recursive_formatter で実行履歴を圧縮している)
  • 完全にフリーでプレイさせる代わりに、イテレーションごとに指示を与えられるようにした
  • 毎回の実行ごとに最新のエンティティとインベントリ、研究の情報を与え、エージェントが最低限必要な情報を常に把握できるようにした。(オリジナル版ではエラー発生のたびに entities や inventory を返すようにしていたが、コンテキストが肥大化する原因になっていた)
  • map を固定 (map.zip) し Docker イメージとして公開
  • その他細かいバグやツールの挙動を修正(move_to でスタックを防ぐためにランダム性を入れる、lab が get_entities で取得できなくなるバグの修正、エラーメッセージの追加等)

コード解説

GameState

Factorio 内の設置されたエンティティ、プレイヤーのインベントリ、研究の進捗状況、エージェントがこれまでに書いたコードの名前空間など、現在のゲームの状態を表すほとんどの状態がこのクラスに集約され、シリアライズされて DB に保存されています。 この GameState を DB から読み込むことで、任意の状態からプレイを再開させることができます。 これを利用してエンティティやインベントリ・研究の情報をエージェントに与えています(core/definitions の ParsedGameState)

agent / evaulator / trajectory_runner

trajector_runner がゲームのループを管理するクラスで、agent と evaluator を実行します。 基本的な流れは以下の通りです。

  1. ゲームの初期化 (GameState の読み込み)
  2. イテレーションごとに人間の指示を待ち受ける
  3. 指示と GameState を与えて agent を実行
  4. agent の出力したコードを evaluator が実行し、結果を評価。結果を DB に保存
  5. 3 と 4 を数 step 繰り返す。
  6. イテレーションを完了し、agent にイテレーションのサマリを出力させる。
  7. 2 に戻り、次のイテレーションを開始する。

evaluator は agent の出力コードを実際に実行する他、一定時間スリープしてその間の各アイテムの生産量の評価も行います。 報酬設計の詳細は 元論文 を参照してください。

フォルダ構成

extension の実行に必要な処理の大半は extension の中にまとまっています。 その他 GameState や FactorioInstance、Entity といったコアなクラスのみをオリジナル実装から参照しています。 offline_benchmark はオフラインのリプレイをもとにモデルの評価を行うためのパッケージです(開発中)。

マップ

ryunosukez/factorio-learning-environment:v0.1.0 のマップは以下の設定で作成されています。

  • water 多め (1->2)
  • enemy-base 以外の資源について richness を 10 倍
  • ウラニウム鉱石と石油の発生頻度を 50 倍
  • 崖なし
{
  "_terrain_segmentation_comment": "The inverse of 'water scale' in the map generator GUI.",
  "terrain_segmentation": 1,

  "_water_comment":
  [
    "The equivalent to 'water coverage' in the map generator GUI. Higher coverage means more water in larger oceans.",
    "Water level = 10 * log2(this value)"
  ],
  "water": 2,

  "_comment_width+height": "Width and height of map, in tiles; 0 means infinite",
  "width": 0,
  "height": 0,

  "_starting_area_comment": "Multiplier for 'biter free zone radius'",
  "starting_area": 1,

  "peaceful_mode": false,
  "autoplace_controls":
  {
    "coal": {"frequency": 1, "size": 1, "richness": 10},
    "stone": {"frequency": 1, "size": 1, "richness": 10},
    "copper-ore": {"frequency": 1, "size": 1,"richness": 10},
    "iron-ore": {"frequency": 1, "size": 1, "richness": 10},
    "uranium-ore": {"frequency": 50, "size": 1, "richness": 10},
    "crude-oil": {"frequency": 50, "size": 1, "richness": 10},
    "trees": {"frequency": 1, "size": 1, "richness": 10},
    "enemy-base": {"frequency": 1, "size": 1, "richness": 1}
  },

  "cliff_settings":
  {
    "_name_comment": "Name of the cliff prototype",
    "name": "cliff",

    "_cliff_elevation_0_comment": "Elevation of first row of cliffs",
    "cliff_elevation_0": 10,

    "_cliff_elevation_interval_comment":
    [
      "Elevation difference between successive rows of cliffs.",
      "This is inversely proportional to 'frequency' in the map generation GUI. Specifically, when set from the GUI the value is 40 / frequency."
    ],
    "cliff_elevation_interval": 40,

    "_richness_comment": "Called 'cliff continuity' in the map generator GUI. 0 will result in no cliffs, 10 will make all cliff rows completely solid",
    "richness": 0
  },

  "_property_expression_names_comment":
  [
    "Overrides for property value generators (map type)",
    "Leave 'elevation' blank to get 'normal' terrain.",
    "Use 'elevation': '0_16-elevation' to reproduce terrain from 0.16.",
    "Use 'elevation': '0_17-island' to get an island.",
    "Moisture and terrain type are also controlled via this.",
    "'control-setting:moisture:frequency:multiplier' is the inverse of the 'moisture scale' in the map generator GUI.",
    "'control-setting:moisture:bias' is the 'moisture bias' in the map generator GUI.",
    "'control-setting:aux:frequency:multiplier' is the inverse of the 'terrain type scale' in the map generator GUI.",
    "'control-setting:aux:bias' is the 'terrain type bias' in the map generator GUI."
  ],
  "property_expression_names":
  {
    "control-setting:moisture:frequency:multiplier": "1",
    "control-setting:moisture:bias": "0",
    "control-setting:aux:frequency:multiplier": "1",
    "control-setting:aux:bias": "0"
  },

  "starting_points":
  [
    { "x": 0, "y": 0}
  ],

  "_seed_comment": "Use null for a random seed, number for a specific seed.",
  "seed": null
}

About

A non-saturating, open-ended environment for evaluating LLMs in Factorio

Resources

License

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • HTML 51.2%
  • Python 31.9%
  • Lua 15.8%
  • JavaScript 0.4%
  • Shell 0.4%
  • CSS 0.3%