Audio Transcription & Analysis System

A powerful system for transcribing audio files, analyzing transcripts, and generating creative interpretations of the content. Combines OpenAI's Whisper for transcription with GPT models for analysis, featuring customizable templates and musical transformations.

Quick Start

# Install
pip install -r requirements.txt

# Set up environment
cp .env.example .env
# Edit .env with your OpenAI API key

# Basic usage
python main.py your_audio.mp3

# Generate musical summary
python main.py your_audio.mp3 --musical-style hiphop

Installation

Clone the repository:

git clone [repository-url]
cd audio-analysis-system

Install dependencies:

pip install -r requirements.txt

Set up your environment:

cp .env.example .env
# Edit .env and add:
OPENAI_API_KEY=your-api-key-here
OPENAI_MODEL=gpt-4  # Optional, defaults to gpt-4o

Basic Usage

Simple Transcription

python main.py path/to/your/audio.mp3

With Analysis Template

python main.py path/to/your/audio.mp3 --template summary

Adding Context

python main.py path/to/your/audio.mp3 --template summary \
    --context "Quarterly planning meeting" \
    --focus objectives deadlines

Templates

Built-in Templates

summary: Concise summary of key points
technical_specs: Technical analysis and specifications

Musical Templates

hiphop_summary: Hip-hop style interpretation
country_summary: Country music style interpretation
ballad_summary: 80s power ballad style interpretation

Listing Templates

python main.py --list-templates

Advanced Features

Custom Instructions

python main.py meeting.mp3 --template summary \
    --instruction "Focus on action items and deadlines" \
    --focus decisions deadlines \
    --exclude small-talk

Template Creation

python main.py --create-template my_template \
    --template-category custom \
    --system-prompt "You are analyzing..." \
    --instruction "Analyze the following..." \
    --temperature 0.7 \
    --description "My custom analysis template"

Template Directory Structure

templates/
├── README.md
├── base/
│   └── musical_summary_base.json
├── analysis/
│   ├── summary.json
│   └── technical_specs.json
├── musical/
│   ├── hiphop_summary.json
│   ├── country_summary.json
│   └── ballad_summary.json
└── custom/
    └── your_custom_templates.json

Musical Summaries

Transform your transcripts into various musical styles while maintaining information integrity.

Basic Musical Summary

python main.py meeting.mp3 --musical-style hiphop

With Original Summary

python main.py meeting.mp3 --musical-style country --include-original

Available Styles

Hip-hop: Complex rhyme schemes and wordplay
Country: Narrative-driven storytelling
Power Ballad: 80s-style emotional interpretation

Customization

Adding Focus Topics

python main.py meeting.mp3 --template summary \
    --focus architecture implementation timeline

Modifying Temperature

python main.py meeting.mp3 --template summary --temperature 0.8

Combining Features

python main.py meeting.mp3 \
    --template technical_specs \
    --instruction "Focus on architecture decisions" \
    --focus design patterns scalability \
    --context "System design review" \
    --temperature 0.4

Use Cases

Executive Summary

python main.py board_meeting.mp3 --template summary \
    --instruction "Create an executive summary" \
    --focus strategy finance metrics

Technical Documentation

python main.py tech_review.mp3 --template technical_specs \
    --focus architecture security performance

Creative Presentation

python main.py project_update.mp3 --musical-style hiphop \
    --focus achievements milestones \
    --context "Successful project completion"

Troubleshooting

Common Issues

API Key Error
```
Error: OPENAI_API_KEY environment variable is required
```
Solution: Check your .env file configuration
Template Not Found
```
Template 'xyz' not found. Using default template.
```
Solution: Check template name with --list-templates
Transcription Failed
```
Error during transcription
```
Solution: Verify audio file format and accessibility

Best Practices

Audio Quality
- Use clear audio recordings
- Minimize background noise
- Support common formats (mp3, wav, m4a)
Template Selection
- Use appropriate templates for content type
- Consider audience when choosing musical styles
- Match temperature to desired creativity level
System Resources
- Monitor API usage
- Consider file size limitations
- Check available disk space for templates

Contributing

Fork the repository
Create your feature branch
Add your templates to appropriate directories
Submit a pull request

License

[Your License Here]

Acknowledgments

OpenAI for Whisper and GPT APIs
Contributors and template creators
[Other acknowledgments]

Would you like me to expand any section or add more specific examples for certain use cases?

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
templates		templates
.gitignore		.gitignore
App Structure.md		App Structure.md
README.md		README.md
__init__.py		__init__.py
audiofile.mp3		audiofile.mp3
config.py		config.py
gpt_analyzer.py		gpt_analyzer.py
main.py		main.py
musical_templates.py		musical_templates.py
requirements.txt		requirements.txt
template_manager.py		template_manager.py
whisper_transcriber.py		whisper_transcriber.py

pbohannon/transcribe_to_gpt

Folders and files

Latest commit

History

Repository files navigation