managarten/apps/reader/apps/mobile/ReadMe/ProjectOverview.md
Till JS 3590641fad feat(reader): restore from archive, register in monorepo
- Move from apps-archived/ to apps/
- Add root package.json
- Register in shared-branding (app icon, mana-apps, URL map)
- Add to root CLAUDE.md project table
- Expo/React Native TTS app preserved as-is (no rewrite needed)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-30 00:56:57 +02:00

6.2 KiB

Reader - Projektübersicht

Was ist Reader?

Reader ist eine moderne Text-to-Speech App, die Texte mit hochqualitativen KI-Stimmen vorliest und für die Offline-Nutzung speichert. Die App kombiniert die neuesten Google Chirp Stimmen mit einer eleganten Benutzeroberfläche und intelligenter Audio-Verwaltung.

Kernfunktionen

📚 Text-Management

  • Import: Texte manuell eingeben oder aus Dateien importieren
  • Organisation: Einfache Tag-basierte Verwaltung
  • Synchronisation: Automatischer Sync zwischen Geräten via Supabase
  • Lesefortschritt: Merkt sich wo du aufgehört hast

🎧 Premium Audio-Wiedergabe

  • Google Chirp Stimmen: Natürlich klingende KI-Stimmen in Studio-Qualität
  • Offline-Verfügbarkeit: Einmal generiert, immer verfügbar
  • Anpassbar: Geschwindigkeit und Tonhöhe individuell einstellbar
  • Nahtlose Wiedergabe: Intelligentes Chunk-System für unterbrechungsfreies Hören

💾 Smart Caching

  • Automatische Segmentierung: Lange Texte werden intelligent aufgeteilt
  • Progressives Laden: Chunks werden bei Bedarf geladen
  • Speicherverwaltung: Übersicht über genutzten Speicherplatz
  • Selective Sync: Wähle welche Texte offline verfügbar sein sollen

👤 Benutzerfreundlichkeit

  • Ein-Klick-Generierung: Audio für komplette Texte erstellen
  • Hintergrund-Wiedergabe: Weiterhören während andere Apps genutzt werden
  • Sleep Timer: Automatisches Stoppen nach eingestellter Zeit
  • Lesezeichen: Wichtige Stellen markieren

Technische Architektur

Frontend: React Native mit Expo

  • Plattformen: iOS und Android aus einer Codebasis
  • UI Framework: Native Komponenten für beste Performance
  • Offline-First: Funktioniert auch ohne Internetverbindung
  • State Management: React Context für einfache Datenverwaltung

Backend: Supabase

  • Datenbank: PostgreSQL mit einer minimalistischen Tabelle
  • Authentifizierung: Sichere Benutzerkonten out-of-the-box
  • Realtime Sync: Änderungen werden sofort synchronisiert
  • Edge Functions: Serverless Audio-Generierung

Audio-Pipeline: Google Cloud TTS

  • Chirp Voices: Neueste Generation von Google's Text-to-Speech
  • Studio-Qualität: Broadcast-taugliche Sprachausgabe
  • Mehrsprachig: Unterstützung für 40+ Sprachen
  • Neural Synthesis: KI-basierte Sprachgenerierung

Projektkonzept für Google Chirp Integration

Phase 1: Infrastruktur-Setup

Ziel: Grundlegende Verbindungen zwischen allen Systemen herstellen

Google Cloud Konfiguration:

  • Google Cloud Projekt erstellen und Text-to-Speech API aktivieren
  • Service Account für sichere API-Zugriffe einrichten
  • Zugriffsschlüssel generieren und sicher speichern
  • Kostenkontrolle durch Quotas und Budgets einrichten

Supabase Edge Functions Setup:

  • Zwei Hauptfunktionen: Audio-Generierung und Batch-Processing
  • Sichere Speicherung der Google Cloud Credentials
  • CORS-Konfiguration für App-Zugriffe
  • Error Handling und Logging-Strategie

Phase 2: Audio-Generierungs-Pipeline

Ziel: Robuste und skalierbare Audio-Erstellung

Text-Segmentierung:

  • Intelligente Aufteilung an Satzgrenzen
  • Optimale Chunk-Größe für Balance zwischen Qualität und Performance
  • Metadaten für nahtlose Wiedergabe speichern

Batch-Processing:

  • Parallele Verarbeitung mit Rate Limiting
  • Fortschrittsanzeige für Benutzer
  • Fehlerbehandlung für einzelne Chunks
  • Automatische Wiederholung bei Fehlern

Storage-Strategie:

  • Supabase Storage für zentrale Audio-Dateien
  • Signierte URLs mit Ablaufzeit
  • Lokaler Cache auf Geräten
  • Intelligente Garbage Collection

Phase 3: App-Integration

Ziel: Nahtlose Benutzererfahrung

Audio-Service Layer:

  • Abstraktion der Komplexität
  • Queue-Management für Wiedergabe
  • Prefetching für unterbrechungsfreies Hören
  • Fallback-Mechanismen

UI/UX Konzepte:

  • Ein-Tap Audio-Generierung
  • Visuelles Feedback während Processing
  • Download-Progress für Offline-Sync
  • Intuitive Playback-Controls

Phase 4: Optimierung & Skalierung

Ziel: Production-ready System

Performance:

  • CDN-Integration für schnelle Downloads
  • Chunk-Größen-Optimierung
  • Parallele Downloads
  • Background Processing

Kosten-Optimierung:

  • Caching bereits generierter Audios
  • Deduplizierung gleicher Textpassagen
  • Nutzungsbasierte Limits
  • Premium-Tier für Heavy Users

Monitoring:

  • Verwendungsstatistiken
  • Error Tracking
  • Performance Metriken
  • Kosten-Überwachung

Alleinstellungsmerkmale

🎯 Was Reader besonders macht:

  1. Höchste Audioqualität: Google Chirp Stimmen klingen natürlicher als Standard TTS
  2. True Offline: Einmal generiert, für immer verfügbar - kein Streaming nötig
  3. Minimalistisches Design: Fokus auf das Wesentliche ohne überflüssige Features
  4. Privacy-First: Deine Texte bleiben deine Texte
  5. Fair Pricing: Einmalige Generierung statt ständige Streaming-Kosten

Monetarisierung

Freemium Modell:

  • Free Tier: 10.000 Zeichen/Monat
  • Pro: 500.000 Zeichen/Monat + Premium Stimmen
  • Team: Unbegrenzt + Collaboration Features

Kostenstruktur:

  • Google TTS: ~$16 per 1 Million Zeichen (Chirp Voices)
  • Supabase: $25/Monat für Pro Features
  • Storage: $0.021 per GB/Monat

Zeitplan

Woche 1-2: Setup & Basis-Integration

  • Google Cloud und Supabase konfigurieren
  • Edge Functions entwickeln
  • Basis-App mit Authentifizierung

Woche 3-4: Audio-Pipeline

  • Chunk-System implementieren
  • Storage-Integration
  • Playback-Funktionalität

Woche 5-6: Polish & Launch

  • UI/UX Verfeinerung
  • Testing & Bugfixing
  • App Store Vorbereitung

Erfolgsmetriken

  • Nutzer-Aktivierung: 80% generieren ersten Audio innerhalb 5 Minuten
  • Retention: 40% Daily Active Users
  • Audio-Qualität: <2% Neu-Generierungen wegen Qualität
  • Performance: <3 Sekunden für Start der Wiedergabe
  • Conversion: 5% Free-to-Pro nach 30 Tagen

Risiken & Mitigationen

API-Kosten:

  • Monitoring und Alerts
  • Caching-Strategien
  • User Limits

Technische Komplexität:

  • Schrittweise Integration
  • Ausführliches Testing
  • Fallback-Optionen

Skalierung:

  • Edge Function Limits beachten
  • CDN frühzeitig einplanen
  • Horizontale Skalierung vorbereiten