Skip to content

Demonstration of training a reinforcement learning agent to land on the lunar surface using the Lunar Lander environment. The project showcases the improvement in agent performance from an untrained state to a fully trained model.

Notifications You must be signed in to change notification settings

WilliamCallao/Lunar-Lander

Repository files navigation

Proyecto Lunar Lander

Este proyecto demuestra la evolución del entrenamiento de un modelo de aprendizaje por refuerzo en el entorno Lunar Lander. El objetivo es mostrar el progreso desde un estado no entrenado hasta un agente entrenado capaz de aterrizar con éxito.

Estructura del Proyecto

  • assets/
    • Contiene recursos visuales como GIFs.
  • env2/
    • Configuración del entorno virtual para la gestión de dependencias.
  • Scripts: Archivos Python para entrenar y visualizar el modelo de Lunar Lander utilizando diferentes enfoques (TensorFlow, Stable-Baselines3, etc.).

GIFs del Lunar Lander

No Entrenado Entrenado

Los GIFs ilustran el rendimiento del agente antes y después del entrenamiento, destacando la mejora en las habilidades de aterrizaje.

Configuración del Entorno Virtual

Para configurar el proyecto, sigue estos pasos:

  1. Crear un Entorno Virtual:

    python -m venv env
    Set-ExecutionPolicy -Scope Process -ExecutionPolicy Bypass
    .\env2\Scripts\Activate
  2. Instalar Dependencias:

    pip install swig
    pip install gymnasium[box2d]
    pip install stable_baselines3==2.3.2
    pip install tensorflow==2.17.0

Ejecución de los Scripts

Los scripts proporcionados permiten entrenar y evaluar diferentes modelos de aprendizaje por refuerzo. Puedes visualizar el progreso durante y después del entrenamiento.

  1. Entrenar un Modelo (Stable Baselines3 - PPO):

    • Usa train_visual_sb3.py para entrenar el modelo utilizando la librería Stable-Baselines3.
  2. Entrenar un Modelo (TensorFlow - DQN):

    • Usa train_visual_tf.py para entrenar un modelo de Red Neuronal Profunda (DQN) utilizando TensorFlow.
  3. Visualizar un Modelo Pre-entrenado:

    • Usa load_and_visualize_model.py para cargar un modelo pre-entrenado y observar su desempeño en el entorno Lunar Lander.

Dependencias

Este proyecto requiere las siguientes bibliotecas de Python:

  • gymnasium
  • stable_baselines3
  • tensorflow

About

Demonstration of training a reinforcement learning agent to land on the lunar surface using the Lunar Lander environment. The project showcases the improvement in agent performance from an untrained state to a fully trained model.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages