TycoonLE: Ekonomik Planlama İçin Bir Ortam

TycoonLE: Ekonomik Planlama İçin Bir Ortam

TycoonLE, uzun vadeli planlama için ekonomik zeminli bir güçlendirme öğrenme ortamıdır. Lojistik ekonomisinde ajanslar faaliyet gösterir.

Paylas

TycoonLE Nedir?

Tycoon Learning Environment (TycoonLE), ekonomik temelli uzun vadeli planlama için tasarlanmış bir güçlendirme öğrenme (reinforcement learning) ortamıdır. Bu ortamda, ajanslar simüle edilmiş bir lojistik ekonomisinde sermaye tahsis eder, ulaşım yolları inşa eder, kargo taşır, borç yönetimi yapar ve gecikmeli getirileri optimize eder.

Neden Önemli?

TycoonLE, eylem yasallığı, aday-sınır karar arayüzleri, finansman zamanlaması, gecikmeli ödüller, prosedürel varyasyonlar ve tekrar edilebilir denetim izleri gibi unsurları incelemek için tasarlanmıştır. Bu, özellikle karmaşık ekonomik karar verme süreçlerinin anlaşılması açısından kritik bir araçtır.

Nasıl Çalışır?

TycoonLE, sabit bir arayüze sahiptir. Ajanslar, geçerli rota, finansman ve bekleme adayları arasında seçim yapar. Bu yapı, JAX dönüşümleri (jit, vmap ve scan) ile uyumlu hale getirir.

Ayrıca, replay UI, ajansların rota seçimleri, kargo akışı, finansman davranışı, ödül, puan ve zaman içindeki kâr gibi unsurları incelemesine olanak tanır.

TycoonBench, TycoonLE planlama görevlerinde ajans ve model performansını karşılaştırmak için bir yan rapor sunar. Bu rapor, performansı ölçmek ve geliştirmek isteyen araştırmacılar için faydalıdır: TycoonBench.

Kullanım Talimatları

TycoonLE ile çalışmak için Python 3.11 veya 3.12 sürümünü kullanmalısınız. İşte hızlı bir başlangıç için gerekli adımlar:

py -3.12 -m venv .venv
.\.venv\Scripts\python.exe -m pip install -e ".[test]"
npm install

Ardından, TycoonLE ortamını içe aktararak bir örnek çalıştırabilirsiniz:

import jax
from tycoonle_jax import TycoonLE

env = TycoonLE(split="dev", family="chain")
state, timestep = env.reset(jax.random.PRNGKey(0))
action = timestep.observation.action_mask.argmax()
state, timestep = env.step(state, action)

Bir replay dışa aktarmak için:

.\.venv\Scripts\python.exe examples\quickstart.py
npm run dev

Tarayıcı arayüzünü açarak runs/quickstart/replay.json dosyasını yükleyebilirsiniz.

Test etmek için:

.\.venv\Scripts\python.exe -m pytest
npm run build

Küçük bir PPO duman testi çalıştırmak için:

.\.venv\Scripts\python.exe examples\train_ppo_jax.py --updates 1 --num-envs 4 --rollout-length 4 --update-epochs 1 --hidden-sizes 32

Sonuç

Eğer bu çalışmayı faydalı bulursanız, aşağıdaki şekilde alıntı yapmayı düşünebilirsiniz:

@software{tycoonle,
 title = {TycoonLE},
 author = {TycoonLE contributors},
 year = {2026},
 url = {
}

Sanat Kredileri

TycoonLE, OpenTTD için açık kaynak grafik seti olan OpenGFX'ten sprite sanat eserleri kullanır.

Şevval Yüce

Yazar

Şevval Yüce

TechPusula yazarı. Teknoloji ve dijital dönüşüm üzerine içerikler üretmektedir.

Tüm yazıları gör

Yorumlar

Henüz yorum yapılmamış. İlk yorumu siz yapın!

Yorum Yaz

0/2000

İlginizi Çekebilir

Tüm yazılar