Recording to Tasks

Un tool Python da linea di comando che trasforma le registrazioni audio/video di meeting in trascrizioni e to-do list strutturate utilizzando le API di OpenAI (Whisper per la trascrizione e GPT per l'analisi).

🚀 Funzionalità

Trascrizione automatica di file audio e video usando Whisper
Estrazione intelligente di task, decisioni e action item dal contenuto
Gestione file grandi con chunking automatico
Supporto multi-formato (MP4, MOV, WAV, MP3, M4A, etc.)
Elaborazione parallela per velocizzare la trascrizione
Retry automatico in caso di errori API
Timestamp precisi per ogni sezione
Output strutturato in formato Markdown

🛠️ Setup e Installazione

Prerequisiti

Python 3.8+ installato sul sistema

ffmpeg installato:

# macOS
brew install ffmpeg

# Ubuntu/Debian
sudo apt update && sudo apt install ffmpeg

# Windows
# Scarica da https://ffmpeg.org/download.html

Account OpenAI con API key

Installazione

Opzione 1: Setup Automatico (Consigliato)

Clona il repository:

git clone <repository-url>
cd RecordingToTasks

Esegui lo script di setup:
```
./setup.sh
```
Lo script installerà automaticamente:
- ffmpeg (se non presente)
- L'ambiente virtuale Python
- Tutte le dipendenze necessarie
- Creerà il file .env dal template
Configura la tua API key:

Modifica il file .env inserendo la tua API key di OpenAI:
```
OPENAI_API_KEY=sk-your-actual-api-key-here
```

Opzione 2: Setup Manuale

Clona il repository:

git clone <repository-url>
cd RecordingToTasks

Crea e attiva l'ambiente virtuale:

python3 -m venv venv
source venv/bin/activate  # Su Windows: venv\Scripts\activate

Installa le dipendenze:
```
pip install -r requirements.txt
```
Configura le variabili d'ambiente:
```
cp env.example .env
```
Modifica il file .env inserendo la tua API key di OpenAI:
```
OPENAI_API_KEY=sk-your-actual-api-key-here
```

Verifica dell'installazione

python main.py --help

Oppure esegui il test di setup:

python test_setup.py

📖 Utilizzo

Comando base

python main.py /path/to/your/recording.mp4

Esempi

# Trascrivi un file video
python main.py meeting_2024_01_15.mp4

# Trascrivi un file audio
python main.py call_with_client.wav

# Elabora più file in sequenza
python main.py file1.mp4 file2.wav file3.m4a

# Mostra aiuto
python main.py --help

Formati supportati

Audio: .wav, .mp3, .m4a, .flac, .aac, .ogg, .wma Video: .mp4, .mov, .avi, .mkv, .wmv, .flv, .webm, .m4v

Output

Il tool genererà due file nella cartella output/:

filename_transcription.txt - Trascrizione completa con timestamp
filename_tasks.md - Analisi strutturata con:
- Riassunto esecutivo
- Partecipanti (se identificabili)
- Punti chiave discussi
- Decisioni prese
- Action items / To-do list con responsabili e scadenze
- Prossimi passi
- Note aggiuntive

⚙️ Configurazione

Variabili d'ambiente (file `.env`)

# API Configuration
OPENAI_API_KEY=your_api_key_here
OPENAI_ORG_ID=your_org_id_here  # Opzionale

# Model Selection
WHISPER_MODEL=whisper-1          # Modello per trascrizione
CHAT_MODEL=gpt-4o-mini          # Modello per analisi

# Processing Configuration
MAX_RETRIES=3                    # Retry in caso di errore
MAX_PARALLEL_TASKS=3            # Task paralleli per trascrizione
SIZE_LIMIT_MB=20                # Limite dimensione file (MB)

Modelli disponibili

Per la trascrizione:

whisper-1 - Modello standard, ottimo rapporto qualità/prezzo

Per l'analisi:

gpt-4o-mini - Veloce ed economico, qualità alta
gpt-3.5-turbo - Alternativa economica
gpt-4o - Massima precisione ma più costoso

💰 Costi Stimati

I costi dipendono dalla lunghezza delle registrazioni:

Whisper (trascrizione):

$0.006 per minuto di audio

GPT-4o-mini (analisi):

~$0.001-0.003 per meeting di 1 ora

Esempio: Meeting di 1 ora = $0.36 + $0.002 = **$0.37 totale**

🔧 Gestione File Grandi

Il tool gestisce automaticamente file di grandi dimensioni:

Chunking automatico: File > 20MB vengono divisi in chunk
Elaborazione parallela: Più chunk processati contemporaneamente
Ricostruzione timeline: I timestamp vengono preservati nell'output finale

🛠️ Sviluppo

Struttura del progetto

RecordingToTasks/
├── main.py              # Script principale
├── requirements.txt     # Dipendenze Python
├── setup.sh            # Script di installazione automatica
├── test_setup.py       # Test di verifica setup
├── .env                # Configurazione (non committato)
├── env.example         # Template configurazione
├── README.md           # Documentazione
├── .gitignore          # File da ignorare
├── venv/               # Ambiente virtuale
├── temp/               # File temporanei
└── output/             # File di output

Dipendenze

openai: Client per le API di OpenAI
python-dotenv: Gestione variabili d'ambiente
ffmpeg: Elaborazione audio/video (dipendenza esterna)

Contribuire

Fork del repository
Crea un branch per la feature: git checkout -b feature/nome-feature
Commit delle modifiche: git commit -am 'Aggiunge nuova feature'
Push del branch: git push origin feature/nome-feature
Apri una Pull Request

🐛 Risoluzione problemi

Errori comuni

"ffmpeg not found"

# Verifica installazione
ffmpeg -version

# Se non installato, segui i prerequisiti

"OpenAI API key not found"

# Verifica file .env
cat .env

# Assicurati che la chiave sia corretta

"File troppo grande"

Il tool gestisce automaticamente file grandi
Aumenta SIZE_LIMIT_MB in .env se necessario

Errori di trascrizione

Il tool riprova automaticamente con backoff esponenziale
Controlla la connessione internet
Verifica i limiti di rate dell'API OpenAI

Debug

Per debug più dettagliato, modifica temporaneamente il file main.py aggiungendo:

import logging
logging.basicConfig(level=logging.DEBUG)

📄 Licenza

MIT License - vedi file LICENSE per dettagli

🤝 Supporto

Per bug report o feature request, apri una issue su GitHub.

Nota: Questo tool è ottimizzato per meeting in italiano e inglese. Per altre lingue, potrebbe essere necessario modificare i prompt di analisi nel file main.py.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Recording to Tasks

🚀 Funzionalità

🛠️ Setup e Installazione

Prerequisiti

Installazione

Opzione 1: Setup Automatico (Consigliato)

Opzione 2: Setup Manuale

Verifica dell'installazione

📖 Utilizzo

Comando base

Esempi

Formati supportati

Output

⚙️ Configurazione

Variabili d'ambiente (file `.env`)

Modelli disponibili

💰 Costi Stimati

🔧 Gestione File Grandi

🛠️ Sviluppo

Struttura del progetto

Dipendenze

Contribuire

🐛 Risoluzione problemi

Errori comuni

Debug

📄 Licenza

🤝 Supporto

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.gitignore		.gitignore
README.md		README.md
env.example		env.example
main.py		main.py
requirements.txt		requirements.txt
setup.sh		setup.sh
test_setup.py		test_setup.py

lorenzomorelli-webdev/RecordingToTasks

Folders and files

Latest commit

History

Repository files navigation

Recording to Tasks

🚀 Funzionalità

🛠️ Setup e Installazione

Prerequisiti

Installazione

Opzione 1: Setup Automatico (Consigliato)

Opzione 2: Setup Manuale

Verifica dell'installazione

📖 Utilizzo

Comando base

Esempi

Formati supportati

Output

⚙️ Configurazione

Variabili d'ambiente (file .env)

Modelli disponibili

💰 Costi Stimati

🔧 Gestione File Grandi

🛠️ Sviluppo

Struttura del progetto

Dipendenze

Contribuire

🐛 Risoluzione problemi

Errori comuni

Debug

📄 Licenza

🤝 Supporto

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Variabili d'ambiente (file `.env`)

Packages