Skip to content

Latest commit

 

History

History
164 lines (109 loc) · 11.5 KB

README.md

File metadata and controls

164 lines (109 loc) · 11.5 KB

Voice-Assistant-GPT

Voice-Assistant-GPT es un asistente de voz inteligente que utiliza GPT-4o mini de OpenAI para generar respuestas y realizar diversas tareas, como contar chistes, buscar en Google, obtener el clima y mostrar las últimas noticias según la ubicación del usuario. El asistente puede cambiar entre modos de entrada de audio y escritos y alternar entre voces sintéticas y naturales.

Requisitos

  • Python 3.6 o superior
  • Bibliotecas: consulta la siguiente tabla para obtener información sobre las bibliotecas utilizadas.
Biblioteca Descripción
openai Interactuar con la API de OpenAI y utilizar el modelo GPT-4o mini en el asistente.
typer Construir aplicaciones de línea de comandos con una interfaz fácil de usar y moderna.
rich Renderizar texto enriquecido, tablas, barras de progreso y más en la terminal.
speech_recognition Realizar reconocimiento de voz y convertir audio en texto.
webbrowser Abrir páginas web en el navegador predeterminado del sistema.
pyjokes Generar chistes aleatorios en diferentes idiomas.
requests Realizar solicitudes HTTP y manejar la comunicación con las APIs.
json Trabajar con datos en formato JSON.
pyowm Interactuar con la API de OpenWeatherMap y obtener información meteorológica.
bs4 Analizar y extraer información de documentos HTML y XML, utilizada en web scraping.
pyttsx3 Convertir texto en voz utilizando motores TTS (Text-to-Speech) del sistema.
gtts Convertir texto en voz utilizando el servicio Google Text-to-Speech.
pydub Manipular archivos de audio y realizar operaciones básicas, como reproducir y exportar.
geopy Realizar geocodificación inversa y obtener la ubicación del usuario a partir de sus coordenadas.
sounddevice Grabar y reproducir audio utilizando la biblioteca PortAudio.
pyaudio Grabar y reproducir audio en diferentes plataformas utilizando la biblioteca PortAudio.
locale Manejar información de localización y regionalización, como idiomas y formatos de fecha y hora.
zipfile Trabajar con archivos ZIP, permitiendo comprimir y descomprimir archivos y directorios.
prettytable Generar tablas ASCII con datos tabulares y una apariencia agradable.

Instalación

  1. Clona este repositorio en tu máquina local.

  2. Instala las bibliotecas requeridas usando pip: pip install -r requirements.txt

  3. Configura tus claves API para OpenAI, Climacell y Google News como variables de entorno. Sigue las instrucciones detalladas a continuación:

    Configuración de la API Key de OpenAI

    1. Registrate o ingresa y obtén una API Key en https://beta.openai.com/signup.

    2. Obtenga su clave API de OpenAI en: https://platform.openai.com/account/api-keys.

      Para usar la clave API de OpenAI para Voice-Assistant-GPT, NECESITA tener configurada la facturación (también conocida como cuenta paga).

      Puede configurar una cuenta paga en https://platform.openai.com/account/billing/overview.

      Cuenta paga

      POR FAVOR, ASEGÚRESE DE HABER REALIZADO ESTE PASO ANTES DE CONTINUAR, DE LO CONTRARIO, ¡NADA FUNCIONARÁ!

    3. Para agregar la clave como variable de entorno en Windows, sigue estos pasos:

      a. Haz clic derecho en 'Mi PC' o 'Este equipo' y selecciona 'Propiedades'.
      b. Haz clic en 'Configuración avanzada del sistema' en el panel izquierdo.
      c. Haz clic en 'Variables de entorno'.
      d. En 'Variables del sistema', haz clic en 'Nuevo...'.
      e. Establece el nombre de la variable como 'API_KEY' y su valor como la clave obtenida.
      f. Haz clic en 'Aceptar' y reinicia cualquier consola o IDE en uso.

    4. En macOS y Linux, sigue estas guías para configurar variables de entorno:

    Configuración de la API Key de Climacell

    1. Obtén una API Key en https://www.tomorrow.io/signup
    2. Para agregar la clave como variable de entorno en Windows, sigue los pasos mencionados en la API Key de OpenAI.
      a. Establece el nombre de la variable como 'CLIMACELL_API_KEY' y su valor como la clave obtenida.
      b. Sigue los pasos del 2b al 2f de la sección de OpenAI para agregar la variable.
    3. En macOS y Linux, sigue las guías mencionadas en la sección de OpenAI.

    Configuración de la API Key de Google News

    1. Obtén una API Key en https://newsapi.org/s/google-news-api
    2. Para agregar la clave como variable de entorno en Windows, sigue los pasos mencionados en la API Key de OpenAI.
      a. Establece el nombre de la variable como 'GOOGLE_NEWS_API_KEY' y su valor como la clave obtenida.
      b. Sigue los pasos del 2b al 2f de la sección de OpenAI para agregar la variable.
    3. En macOS y Linux, sigue las guías mencionadas en la sección de OpenAI.

Video de Configuración del Asistente de Voz Inteligente GPT: Creación de APIs y Variables de Entorno

Para ver un video tutorial sobre cómo crear y configurar las API Keys y las variables de entorno, mira el siguiente video en YouTube:

Configuración del Asistente de Voz Inteligente GPT

Puedes seguir estas guías para configurar variables de entorno en diferentes sistemas operativos:

Configurar 'ffmpeg.exe' para la voz natural del asistente de voz inteligente:

Si deseas utilizar la voz natural del asistente de voz inteligente, necesitas tener 'ffmpeg.exe' instalado en tu sistema y configurado correctamente. Sigue estos pasos para configurarlo en Windows:

  1. Descarga 'ffmpeg.exe' desde la página oficial de FFmpeg (https://ffmpeg.org/download.html) y descomprímelo. Alternativamente, si tienes el archivo 'ffmpeg.zip' en la raíz del proyecto junto a 'voice_assistant_gpt.py' o 'voice_assistant_gpt.exe', el programa intentará descomprimirlo automáticamente en "C:".
  2. Mueve la carpeta descomprimida a "C:" y asegúrate de que la ruta sea "C:\ffmpeg\bin\ffmpeg.exe".
  3. Agrega "C:\ffmpeg\bin" a la variable de entorno Path en Windows:
    a. Abre el menú de inicio y busca 'Sistema' en la barra de búsqueda. Haz clic en 'Editar la variable de entorno del sistema'.
    b. En la ventana Propiedades del sistema, haz clic en el botón 'Variables de entorno'.
    c. Busca la variable 'Path' en la sección 'Variables del sistema' y haz clic en 'Editar'.
    d. Haz clic en 'Nuevo' y escribe 'C:\ffmpeg\bin' (sin comillas).
    e. Haz clic en 'Aceptar' para guardar los cambios y cierra todas las ventanas.

Ahora deberías poder utilizar la voz natural del asistente de voz inteligente. Para cambiar el tipo de voz a "natural", escribe "voz natural" en el programa y sigue las instrucciones en pantalla.

Nota: Este tutorial es para Windows. Si estás utilizando macOS o Linux, sigue las instrucciones adecuadas para instalar y configurar 'ffmpeg' en tu sistema.

Uso

Ejecuta el archivo voice_assistant_gpt.py y sigue las instrucciones en pantalla para interactuar con el asistente.

Demostración

Para ver una demostración del proyecto en acción, mira el siguiente video en YouTube:

Voice-Assistant-GPT Demo

Consideraciones importantes

  • Es posible que deba modificar el código para que funcione en un entorno específico.
  • Asegúrese de manejar errores y excepciones de manera adecuada en caso de que ocurran durante la ejecución del código.
  • Este código es solo un ejemplo y debe adaptarse a sus necesidades y requisitos específicos.

Licencia

Este código se encuentra bajo la licencia MIT. Puede utilizar, modificar y distribuir este código de acuerdo a los términos de la licencia.

Autor

Este código fue creado por Alexander Oviedo Fadul como ejemplo de una Inteligencia Artificial entrenable. Si tiene alguna pregunta o sugerencia, no dude en contactar al autor a través de GitHub o enviando un correo electrónico a alexander.oviedo.fadul@gmail.com.

Contribuciones

Este código es un ejemplo y está disponible para que cualquiera pueda utilizarlo y modificarlo. Si desea contribuir con mejoras o correcciones, puede enviar una solicitud de pull a través de GitHub. Todas las contribuciones serán revisadas y, si se aprueban, serán incorporadas al repositorio.

Agradecimientos

Agradezco a Dios, a mi familia y amigos. Sin su ayuda, esta aplicación no habría sido posible.

Donaciones

Somos un equipo de desarrolladores y entusiastas de la inteligencia artificial que hemos creado un asistente de voz inteligente para ayudar a las personas a entender el funcionamiento de una inteligencia artificial y facilitar sus tareas diarias.

Hemos visto la gran utilidad y eficiencia que nuestro asistente de voz inteligente ha brindado a nuestros usuarios, y queremos seguir ofreciéndoles este valioso servicio. Sin embargo, para seguir manteniendo y mejorando nuestro proyecto, necesitamos sostenerlo económicamente. Es por eso que te pedimos tu apoyo como donante.

Con tu contribución, podremos seguir brindando nuestra interfaz de usuario y asistente de voz inteligente a todos aquellos que lo necesiten. Además, tu apoyo nos permitirá seguir mejorando y ampliando nuestras funcionalidades, para que nuestro asistente de voz pueda brindar aún más valor a nuestros usuarios.

Tu donación, por más pequeña que sea, será muy valiosa para nosotros y nos ayudará a seguir brindando este servicio que tantas personas están encontrando útil. Agradecemos de antemano tu apoyo y esperamos que nuestro asistente de voz inteligente pueda ayudarte a ti también en tu día a día.

Gracias por tu tiempo y consideración.

Métodos:

Recuerda que tu imaginación es tu única frontera.