whisper-model

Here are 8 public repositories matching this topic...

shhossain / BanglaSpeech2Text

BanglaSpeech2Text: An open-source offline speech-to-text package for Bangla language. Fine-tuned on the latest whisper speech to text model for optimal performance.

machine-learning deep-learning speech pytorch transformer voice-recognition speech-recognition bangla speech-to-text hacktoberfest whisper bangla-asr bangla-speech-recognition bangla-speech-to-text bangla-automatic-speech-recognition whisper-model bangla-voice-recognition

Updated Nov 8, 2024
Python

jim-schwoebel / nala_assistant

Star

🔊😊 A fastapi voice-assistant framework to quickly prototype LLM-powered voice assistants in <5 minutes.

Updated Jan 15, 2024
JavaScript

hemangjoshi37a / French_audio_transcription_using_gradio

Star

French audio transcription using gradio

machine-learning speech-recognition gradio audio-processing french-language audio-transcription audio-to-text transcription-tool whisper-model french-audio-transcription

Updated Sep 22, 2024
Jupyter Notebook

krithicswaroopan / AI-Voice-Assistance-Pipeline

Star

A real-time voice-to-text and text-to-speech AI pipeline using Whisper, an LLM, and Edge-TTS with tunable parameters for low-latency audio processing and response generation.

python natural-language-processing text-to-speech speech-recognition speech-to-text real-time-processing conversational-ai voice-activity-detection ai-ml hugging-face-transformers large-language-models whisper-model edge-tts

Updated Sep 24, 2024
Python

Xza85hrf / Whisper-Subtitle-Generator

Star

The Whisper Subtitle Generator leverages OpenAI's Whisper model to generate subtitles from audio and video files. This Python-based tool supports multiple languages and employs advanced audio processing techniques to ensure high accuracy in transcription.