- Move from apps-archived/ to apps/ - Add root package.json - Register in shared-branding (app icon, mana-apps, URL map) - Add to root CLAUDE.md project table - Expo/React Native TTS app preserved as-is (no rewrite needed) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
6.2 KiB
Reader - Projektübersicht
Was ist Reader?
Reader ist eine moderne Text-to-Speech App, die Texte mit hochqualitativen KI-Stimmen vorliest und für die Offline-Nutzung speichert. Die App kombiniert die neuesten Google Chirp Stimmen mit einer eleganten Benutzeroberfläche und intelligenter Audio-Verwaltung.
Kernfunktionen
📚 Text-Management
- Import: Texte manuell eingeben oder aus Dateien importieren
- Organisation: Einfache Tag-basierte Verwaltung
- Synchronisation: Automatischer Sync zwischen Geräten via Supabase
- Lesefortschritt: Merkt sich wo du aufgehört hast
🎧 Premium Audio-Wiedergabe
- Google Chirp Stimmen: Natürlich klingende KI-Stimmen in Studio-Qualität
- Offline-Verfügbarkeit: Einmal generiert, immer verfügbar
- Anpassbar: Geschwindigkeit und Tonhöhe individuell einstellbar
- Nahtlose Wiedergabe: Intelligentes Chunk-System für unterbrechungsfreies Hören
💾 Smart Caching
- Automatische Segmentierung: Lange Texte werden intelligent aufgeteilt
- Progressives Laden: Chunks werden bei Bedarf geladen
- Speicherverwaltung: Übersicht über genutzten Speicherplatz
- Selective Sync: Wähle welche Texte offline verfügbar sein sollen
👤 Benutzerfreundlichkeit
- Ein-Klick-Generierung: Audio für komplette Texte erstellen
- Hintergrund-Wiedergabe: Weiterhören während andere Apps genutzt werden
- Sleep Timer: Automatisches Stoppen nach eingestellter Zeit
- Lesezeichen: Wichtige Stellen markieren
Technische Architektur
Frontend: React Native mit Expo
- Plattformen: iOS und Android aus einer Codebasis
- UI Framework: Native Komponenten für beste Performance
- Offline-First: Funktioniert auch ohne Internetverbindung
- State Management: React Context für einfache Datenverwaltung
Backend: Supabase
- Datenbank: PostgreSQL mit einer minimalistischen Tabelle
- Authentifizierung: Sichere Benutzerkonten out-of-the-box
- Realtime Sync: Änderungen werden sofort synchronisiert
- Edge Functions: Serverless Audio-Generierung
Audio-Pipeline: Google Cloud TTS
- Chirp Voices: Neueste Generation von Google's Text-to-Speech
- Studio-Qualität: Broadcast-taugliche Sprachausgabe
- Mehrsprachig: Unterstützung für 40+ Sprachen
- Neural Synthesis: KI-basierte Sprachgenerierung
Projektkonzept für Google Chirp Integration
Phase 1: Infrastruktur-Setup
Ziel: Grundlegende Verbindungen zwischen allen Systemen herstellen
Google Cloud Konfiguration:
- Google Cloud Projekt erstellen und Text-to-Speech API aktivieren
- Service Account für sichere API-Zugriffe einrichten
- Zugriffsschlüssel generieren und sicher speichern
- Kostenkontrolle durch Quotas und Budgets einrichten
Supabase Edge Functions Setup:
- Zwei Hauptfunktionen: Audio-Generierung und Batch-Processing
- Sichere Speicherung der Google Cloud Credentials
- CORS-Konfiguration für App-Zugriffe
- Error Handling und Logging-Strategie
Phase 2: Audio-Generierungs-Pipeline
Ziel: Robuste und skalierbare Audio-Erstellung
Text-Segmentierung:
- Intelligente Aufteilung an Satzgrenzen
- Optimale Chunk-Größe für Balance zwischen Qualität und Performance
- Metadaten für nahtlose Wiedergabe speichern
Batch-Processing:
- Parallele Verarbeitung mit Rate Limiting
- Fortschrittsanzeige für Benutzer
- Fehlerbehandlung für einzelne Chunks
- Automatische Wiederholung bei Fehlern
Storage-Strategie:
- Supabase Storage für zentrale Audio-Dateien
- Signierte URLs mit Ablaufzeit
- Lokaler Cache auf Geräten
- Intelligente Garbage Collection
Phase 3: App-Integration
Ziel: Nahtlose Benutzererfahrung
Audio-Service Layer:
- Abstraktion der Komplexität
- Queue-Management für Wiedergabe
- Prefetching für unterbrechungsfreies Hören
- Fallback-Mechanismen
UI/UX Konzepte:
- Ein-Tap Audio-Generierung
- Visuelles Feedback während Processing
- Download-Progress für Offline-Sync
- Intuitive Playback-Controls
Phase 4: Optimierung & Skalierung
Ziel: Production-ready System
Performance:
- CDN-Integration für schnelle Downloads
- Chunk-Größen-Optimierung
- Parallele Downloads
- Background Processing
Kosten-Optimierung:
- Caching bereits generierter Audios
- Deduplizierung gleicher Textpassagen
- Nutzungsbasierte Limits
- Premium-Tier für Heavy Users
Monitoring:
- Verwendungsstatistiken
- Error Tracking
- Performance Metriken
- Kosten-Überwachung
Alleinstellungsmerkmale
🎯 Was Reader besonders macht:
- Höchste Audioqualität: Google Chirp Stimmen klingen natürlicher als Standard TTS
- True Offline: Einmal generiert, für immer verfügbar - kein Streaming nötig
- Minimalistisches Design: Fokus auf das Wesentliche ohne überflüssige Features
- Privacy-First: Deine Texte bleiben deine Texte
- Fair Pricing: Einmalige Generierung statt ständige Streaming-Kosten
Monetarisierung
Freemium Modell:
- Free Tier: 10.000 Zeichen/Monat
- Pro: 500.000 Zeichen/Monat + Premium Stimmen
- Team: Unbegrenzt + Collaboration Features
Kostenstruktur:
- Google TTS: ~$16 per 1 Million Zeichen (Chirp Voices)
- Supabase: $25/Monat für Pro Features
- Storage: $0.021 per GB/Monat
Zeitplan
Woche 1-2: Setup & Basis-Integration
- Google Cloud und Supabase konfigurieren
- Edge Functions entwickeln
- Basis-App mit Authentifizierung
Woche 3-4: Audio-Pipeline
- Chunk-System implementieren
- Storage-Integration
- Playback-Funktionalität
Woche 5-6: Polish & Launch
- UI/UX Verfeinerung
- Testing & Bugfixing
- App Store Vorbereitung
Erfolgsmetriken
- Nutzer-Aktivierung: 80% generieren ersten Audio innerhalb 5 Minuten
- Retention: 40% Daily Active Users
- Audio-Qualität: <2% Neu-Generierungen wegen Qualität
- Performance: <3 Sekunden für Start der Wiedergabe
- Conversion: 5% Free-to-Pro nach 30 Tagen
Risiken & Mitigationen
API-Kosten:
- Monitoring und Alerts
- Caching-Strategien
- User Limits
Technische Komplexität:
- Schrittweise Integration
- Ausführliches Testing
- Fallback-Optionen
Skalierung:
- Edge Function Limits beachten
- CDN frühzeitig einplanen
- Horizontale Skalierung vorbereiten