mirror of https://github.com/Memo-2023/mana-monorepo.git synced 2026-05-14 22:21:10 +02:00

History

Wuesteon 9c47119535 Fix wrong type import, make auth and chat work		2025-12-04 23:25:25 +01:00
..
apps	Fix wrong type	2025-12-04 23:25:25 +01:00
legacy	chore: archive inactive projects to apps-archived/	2025-11-29 07:03:59 +01:00
packages/shared-types	chore: archive inactive projects to apps-archived/	2025-11-29 07:03:59 +01:00
.gitignore	chore: archive inactive projects to apps-archived/	2025-11-29 07:03:59 +01:00
CLAUDE.md	chore: archive inactive projects to apps-archived/	2025-11-29 07:03:59 +01:00
package.json	chore: archive inactive projects to apps-archived/	2025-11-29 07:03:59 +01:00
README.md	chore: archive inactive projects to apps-archived/	2025-11-29 07:03:59 +01:00
tsconfig.json	chore: archive inactive projects to apps-archived/	2025-11-29 07:03:59 +01:00

README.md

🎥 YouTube Transcriber System

Ein vollständiges System zur automatischen Transkription, Aufbereitung und Präsentation von YouTube-Videos mit OpenAI's Whisper, FastAPI Backend und Astro.js Frontend.

✨ System-Komponenten

🔧 Backend (Python)

OpenAI Whisper - Lokale Speech-to-Text Transkription
FastAPI Server - REST API für Web-Interface
Parallel Processing - Bis zu 3.3x schnellere Verarbeitung
Playlist Management - Automatische Batch-Verarbeitung

🌐 Frontend (Astro.js)

Public Website - Aufbereitete Vorträge als Wisdom Library
Admin Panel - Transkriptions-Management (localhost only)
Content Collections - Strukturierte Inhalte mit Markdown
Responsive Design - Optimiert für alle Geräte

🏗️ Architektur

YoutubeDL/
├── 🐍 Python Backend
│   ├── transcriber_v4_parallel.py  # Parallel-Verarbeitung
│   ├── api_server.py               # FastAPI REST API
│   └── playlists/                  # YouTube URL-Listen
├── 🌐 Website
│   ├── src/pages/                  # Public & Admin Pages
│   ├── src/content/talks/          # Aufbereitete Vorträge
│   └── src/components/admin/       # Admin-Komponenten
└── 📂 Output
    └── transcripts/                 # Transkribierte Texte

🛠 Installation

Voraussetzungen

Python 3.10+
FFmpeg
macOS (optimiert für Apple Silicon M1/M2)

Setup

Repository klonen:

git clone https://github.com/yourusername/youtube-transcriber.git
cd youtube-transcriber

Virtual Environment erstellen:

python3 -m venv venv
source venv/bin/activate

Dependencies installieren:

pip install -r requirements.txt

🚀 Schnellstart

Kompletter Workflow: Von YouTube zu Website

1. Speaker Content sammeln

Erstelle eine Playlist für einen Speaker (z.B. Simon Sinek):

# playlists/people/simon-sinek.txt erstellen
# Simon Sinek Videos
# Popular talks and interviews from YouTube
# Created: 2025-09-09

# TED Talks
# How great leaders inspire action (Start with Why) - 60M+ views
https://www.youtube.com/watch?v=u4ZoJKF_VuA

# Why good leaders make you feel safe - 18M+ views
https://www.youtube.com/watch?v=lmyZMtPVodo

2. Videos transkribieren

# Virtual Environment aktivieren
source venv/bin/activate

# Parallel-Verarbeitung starten (3-4x schneller)
python3 transcriber_v4_parallel.py --playlist playlists/people/simon-sinek.txt --model base --language en

3. Website Content erstellen

a) Content Schema erweitern (wenn neue Kategorie):

// website/src/content/config.ts
category: z.enum([
  'behavioral-economics',
  'psychology',
  'leadership', // Neue Kategorie hinzufügen
  // ...
]),

b) Speaker Profil erstellen:

# website/src/pages/speakers/simon-sinek.astro

c) Talk-Seiten erstellen:

# Für jedes erfolgreich transkribierte Video:
# website/src/content/talks/simon-sinek-[talk-slug].md

d) SearchableContentList aktualisieren:

// website/src/components/SearchableContentList.tsx
// Neue Talks zur Inhaltsliste hinzufügen

4. Website starten

cd website
npm run dev

Einzelnes Video transkribieren

# Mit Large-Modell (beste Qualität)
python3 transcriber_v3.py process "https://www.youtube.com/watch?v=VIDEO_ID" --model large

# Mit Tiny-Modell (schneller Test)  
python3 transcriber_v3.py process "https://www.youtube.com/watch?v=VIDEO_ID" --model tiny

Playlists verwalten

Playlist erstellen:
- Erstelle eine .txt Datei im playlists/ Ordner
- Füge YouTube-URLs ein (eine pro Zeile)

# playlists/tech/python_tutorials.txt
https://www.youtube.com/watch?v=VIDEO_ID1
https://www.youtube.com/watch?v=VIDEO_ID2

Alle Playlists scannen:

python3 transcriber_v3.py scan --model large

Spezifische Playlist verarbeiten:

python3 transcriber_v3.py scan --playlist tech/python_tutorials

Quick-Script verwenden

./quick_transcribe.sh

Bietet ein interaktives Menü zur Modell-Auswahl.

📂 Projektstruktur

YoutubeDL/
├── playlists/              # YouTube URL-Listen nach Themen
│   ├── tech/
│   │   └── python_tutorials.txt
│   ├── people/
│   │   └── rory-sutherland.txt
│   └── musik/
│       └── klassik.txt
├── transcripts/            # Transkribierte Texte (automatisch organisiert)
│   ├── tech_python_tutorials/
│   │   └── [Kanal]/
│   │       └── [Video]_[Timestamp].txt
│   └── people_rory-sutherland/
│       └── TED/
├── .cache/                 # Cache für bereits verarbeitete Videos
├── temp_audio/             # Temporäre Audio-Dateien
├── venv/                   # Python Virtual Environment
├── transcriber.py          # v1: Basis-Funktionalität
├── transcriber_v2.py       # v2: Mit Rich UI
├── transcriber_v3.py       # v3: Mit Playlist-Management
└── quick_transcribe.sh     # Schnellzugriff-Script

🎯 Whisper-Modelle

Modell	Größe	Geschwindigkeit	Genauigkeit	Verwendung
tiny	39 MB	~10x Echtzeit	75%	Schnelle Tests
base	74 MB	~7x Echtzeit	85%	Guter Kompromiss
small	244 MB	~4x Echtzeit	91%	Solide Qualität
medium	769 MB	~2x Echtzeit	94%	Hohe Qualität
large	1.5 GB	~1x Echtzeit	96-98%	Beste Qualität

📋 Befehle

Hauptbefehle

# Zeige alle Playlists
python3 transcriber_v3.py list

# Verarbeite alle neuen Videos in allen Playlists
python3 transcriber_v3.py scan

# Verarbeite einzelnes Video
python3 transcriber_v3.py process "URL"

# Mit spezifischem Modell
python3 transcriber_v3.py scan --model large

# Andere Sprache
python3 transcriber_v3.py scan --language en

Optionen

--model {tiny,base,small,medium,large} - Whisper-Modell auswählen
--language LANG - Sprache setzen (default: de)
--playlist NAME - Spezifische Playlist verarbeiten
--output DIR - Ausgabe-Verzeichnis (default: transcripts)
--force - Cache ignorieren und neu transkribieren

🔄 Automatisierung

Cron-Job einrichten

Für tägliche automatische Verarbeitung:

# Crontab öffnen
crontab -e

# Täglich um 3 Uhr nachts alle Playlists scannen
0 3 * * * cd /path/to/YoutubeDL && source venv/bin/activate && python3 transcriber_v3.py scan --model large

💡 Tipps

Organisiere nach Themen: Erstelle Unterordner in playlists/ für verschiedene Themen
Cache nutzen: Das System merkt sich bereits transkribierte Videos automatisch
Modell-Auswahl:
- Nutze tiny für schnelle Tests
- Nutze large für wichtige Transkriptionen
Batch-Verarbeitung: Füge alle URLs zur Playlist hinzu und lasse über Nacht laufen

🎨 Features im Detail

Rich Terminal UI (v2+)

Farbige Ausgabe mit Emojis
Progress Bars für Download und Transkription
Zeitschätzungen basierend auf Video-Länge
Video-Metadaten vor Download

Playlist-Management (v3)

Automatisches Scannen von URL-Listen
Themen-basierte Organisation
Nur neue Videos werden verarbeitet
Batch-Verarbeitung mehrerer Playlists

Cache-System

Verhindert doppelte Verarbeitung
Speichert Metadaten zu transkribierten Videos
.cache/transcribed_videos.json enthält Historie

🐛 Troubleshooting

FFmpeg nicht gefunden:

# macOS
brew install ffmpeg

Whisper-Modell lädt sehr lange:

Beim ersten Mal wird das Modell heruntergeladen
Large: ~1.5GB, kann 10-30 Minuten dauern

"Video bereits transkribiert":

Nutze --force Flag zum Überschreiben
Oder lösche .cache/ Ordner für kompletten Reset

📈 Performance (Apple Silicon M1)

Tiny: ~10x Echtzeit (6 Min Video → 36 Sek)
Base: ~7x Echtzeit (6 Min Video → 50 Sek)
Small: ~4x Echtzeit (6 Min Video → 1.5 Min)
Large: ~1x Echtzeit (6 Min Video → 6 Min)

🔒 Datenschutz

Alle Verarbeitung erfolgt lokal auf deinem Computer
Keine Daten werden an externe Server gesendet
Whisper läuft komplett offline

📝 Lizenz

MIT License - Siehe LICENSE Datei

🙏 Credits

OpenAI Whisper - Speech-to-Text Engine
yt-dlp - YouTube Download Tool
Rich - Terminal UI Library
FFmpeg - Audio/Video Verarbeitung

🌐 Website Integration

Das System generiert nicht nur Transkripte, sondern auch eine vollständige Website mit den aufbereiteten Inhalten.

Website-Features

📚 Content Collections: Strukturierte Talk-Seiten mit Markdown
🔍 Suchfunktion: Volltextsuche über alle Talks
👤 Speaker Profile: Übersichtsseiten für jeden Speaker
🏷️ Tag-System: Kategorisierung nach Themen
📱 Responsive: Optimiert für alle Geräte
🎨 Theming: Verschiedene Farbschemata

Content-Struktur

website/src/
├── content/
│   ├── config.ts              # Content Schema
│   └── talks/                 # Aufbereitete Talk-Seiten
│       ├── simon-sinek-why-good-leaders-make-you-feel-safe.md
│       ├── simon-sinek-millennials-in-the-workplace.md
│       └── simon-sinek-love-your-work.md
├── pages/
│   ├── speakers/
│   │   ├── index.astro        # Speaker-Übersicht
│   │   └── simon-sinek.astro  # Speaker-Profile
│   └── talks/
│       └── [slug].astro       # Dynamische Talk-Seiten
└── components/
    ├── SearchableContentList.tsx  # Hauptsuche
    ├── ContentCard.tsx            # Talk-Vorschau
    └── speakers/
        ├── SpeakerHero.astro      # Speaker-Header
        ├── TalkGrid.astro         # Talk-Grid
        └── QuoteCollection.astro  # Zitate-Sammlung

Website entwickeln

# Website Dependencies installieren
cd website
npm install

# Entwicklungsserver starten
npm run dev

# Website bauen für Produktion
npm run build

Content-Erstellung Workflow

Transkription: Videos mit Python-Backend transkribieren
Content-Aufbereitung: Markdown-Dateien mit Metadaten erstellen
Speaker-Profile: Übersichtsseiten für neue Speaker
Integration: Neue Inhalte in Suchfunktion einbinden
Deployment: Website bauen und deployen

🚧 Roadmap

Parallel Processing - 3-4x schnellere Transkription
Website Integration - Vollständige Content-Website
Speaker Profiles - Detaillierte Speaker-Übersichten
Content Collections - Strukturierte Talk-Aufbereitung
Admin Interface - Web-UI für Transkriptions-Management
Speaker Diarization - Wer spricht wann
Automatische Zusammenfassungen - LLM-basierte Summaries
Export Formate - SRT, VTT, JSON Export
YouTube Playlist Auto-Import - Direkte Playlist-Integration

Entwickelt mit ❤️ für automatische Transkription