mirror of
https://github.com/Memo-2023/mana-monorepo.git
synced 2026-05-15 13:01:09 +02:00
Move inactive projects out of active workspace: - bauntown (community website) - maerchenzauber (AI story generation) - memoro (voice memo app) - news (news aggregation) - nutriphi (nutrition tracking) - reader (reading app) - uload (URL shortener) - wisekeep (AI wisdom extraction) Update CLAUDE.md documentation: - Add presi to active projects - Document archived projects section - Update workspace configuration Archived apps can be re-activated by moving back to apps/ 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>
217 lines
6.2 KiB
Markdown
217 lines
6.2 KiB
Markdown
# Reader - Projektübersicht
|
|
|
|
## Was ist Reader?
|
|
|
|
Reader ist eine moderne Text-to-Speech App, die Texte mit hochqualitativen KI-Stimmen vorliest und für die Offline-Nutzung speichert. Die App kombiniert die neuesten Google Chirp Stimmen mit einer eleganten Benutzeroberfläche und intelligenter Audio-Verwaltung.
|
|
|
|
## Kernfunktionen
|
|
|
|
### 📚 Text-Management
|
|
|
|
- **Import**: Texte manuell eingeben oder aus Dateien importieren
|
|
- **Organisation**: Einfache Tag-basierte Verwaltung
|
|
- **Synchronisation**: Automatischer Sync zwischen Geräten via Supabase
|
|
- **Lesefortschritt**: Merkt sich wo du aufgehört hast
|
|
|
|
### 🎧 Premium Audio-Wiedergabe
|
|
|
|
- **Google Chirp Stimmen**: Natürlich klingende KI-Stimmen in Studio-Qualität
|
|
- **Offline-Verfügbarkeit**: Einmal generiert, immer verfügbar
|
|
- **Anpassbar**: Geschwindigkeit und Tonhöhe individuell einstellbar
|
|
- **Nahtlose Wiedergabe**: Intelligentes Chunk-System für unterbrechungsfreies Hören
|
|
|
|
### 💾 Smart Caching
|
|
|
|
- **Automatische Segmentierung**: Lange Texte werden intelligent aufgeteilt
|
|
- **Progressives Laden**: Chunks werden bei Bedarf geladen
|
|
- **Speicherverwaltung**: Übersicht über genutzten Speicherplatz
|
|
- **Selective Sync**: Wähle welche Texte offline verfügbar sein sollen
|
|
|
|
### 👤 Benutzerfreundlichkeit
|
|
|
|
- **Ein-Klick-Generierung**: Audio für komplette Texte erstellen
|
|
- **Hintergrund-Wiedergabe**: Weiterhören während andere Apps genutzt werden
|
|
- **Sleep Timer**: Automatisches Stoppen nach eingestellter Zeit
|
|
- **Lesezeichen**: Wichtige Stellen markieren
|
|
|
|
## Technische Architektur
|
|
|
|
### Frontend: React Native mit Expo
|
|
|
|
- **Plattformen**: iOS und Android aus einer Codebasis
|
|
- **UI Framework**: Native Komponenten für beste Performance
|
|
- **Offline-First**: Funktioniert auch ohne Internetverbindung
|
|
- **State Management**: React Context für einfache Datenverwaltung
|
|
|
|
### Backend: Supabase
|
|
|
|
- **Datenbank**: PostgreSQL mit einer minimalistischen Tabelle
|
|
- **Authentifizierung**: Sichere Benutzerkonten out-of-the-box
|
|
- **Realtime Sync**: Änderungen werden sofort synchronisiert
|
|
- **Edge Functions**: Serverless Audio-Generierung
|
|
|
|
### Audio-Pipeline: Google Cloud TTS
|
|
|
|
- **Chirp Voices**: Neueste Generation von Google's Text-to-Speech
|
|
- **Studio-Qualität**: Broadcast-taugliche Sprachausgabe
|
|
- **Mehrsprachig**: Unterstützung für 40+ Sprachen
|
|
- **Neural Synthesis**: KI-basierte Sprachgenerierung
|
|
|
|
## Projektkonzept für Google Chirp Integration
|
|
|
|
### Phase 1: Infrastruktur-Setup
|
|
|
|
**Ziel**: Grundlegende Verbindungen zwischen allen Systemen herstellen
|
|
|
|
**Google Cloud Konfiguration**:
|
|
|
|
- Google Cloud Projekt erstellen und Text-to-Speech API aktivieren
|
|
- Service Account für sichere API-Zugriffe einrichten
|
|
- Zugriffsschlüssel generieren und sicher speichern
|
|
- Kostenkontrolle durch Quotas und Budgets einrichten
|
|
|
|
**Supabase Edge Functions Setup**:
|
|
|
|
- Zwei Hauptfunktionen: Audio-Generierung und Batch-Processing
|
|
- Sichere Speicherung der Google Cloud Credentials
|
|
- CORS-Konfiguration für App-Zugriffe
|
|
- Error Handling und Logging-Strategie
|
|
|
|
### Phase 2: Audio-Generierungs-Pipeline
|
|
|
|
**Ziel**: Robuste und skalierbare Audio-Erstellung
|
|
|
|
**Text-Segmentierung**:
|
|
|
|
- Intelligente Aufteilung an Satzgrenzen
|
|
- Optimale Chunk-Größe für Balance zwischen Qualität und Performance
|
|
- Metadaten für nahtlose Wiedergabe speichern
|
|
|
|
**Batch-Processing**:
|
|
|
|
- Parallele Verarbeitung mit Rate Limiting
|
|
- Fortschrittsanzeige für Benutzer
|
|
- Fehlerbehandlung für einzelne Chunks
|
|
- Automatische Wiederholung bei Fehlern
|
|
|
|
**Storage-Strategie**:
|
|
|
|
- Supabase Storage für zentrale Audio-Dateien
|
|
- Signierte URLs mit Ablaufzeit
|
|
- Lokaler Cache auf Geräten
|
|
- Intelligente Garbage Collection
|
|
|
|
### Phase 3: App-Integration
|
|
|
|
**Ziel**: Nahtlose Benutzererfahrung
|
|
|
|
**Audio-Service Layer**:
|
|
|
|
- Abstraktion der Komplexität
|
|
- Queue-Management für Wiedergabe
|
|
- Prefetching für unterbrechungsfreies Hören
|
|
- Fallback-Mechanismen
|
|
|
|
**UI/UX Konzepte**:
|
|
|
|
- Ein-Tap Audio-Generierung
|
|
- Visuelles Feedback während Processing
|
|
- Download-Progress für Offline-Sync
|
|
- Intuitive Playback-Controls
|
|
|
|
### Phase 4: Optimierung & Skalierung
|
|
|
|
**Ziel**: Production-ready System
|
|
|
|
**Performance**:
|
|
|
|
- CDN-Integration für schnelle Downloads
|
|
- Chunk-Größen-Optimierung
|
|
- Parallele Downloads
|
|
- Background Processing
|
|
|
|
**Kosten-Optimierung**:
|
|
|
|
- Caching bereits generierter Audios
|
|
- Deduplizierung gleicher Textpassagen
|
|
- Nutzungsbasierte Limits
|
|
- Premium-Tier für Heavy Users
|
|
|
|
**Monitoring**:
|
|
|
|
- Verwendungsstatistiken
|
|
- Error Tracking
|
|
- Performance Metriken
|
|
- Kosten-Überwachung
|
|
|
|
## Alleinstellungsmerkmale
|
|
|
|
### 🎯 Was Reader besonders macht:
|
|
|
|
1. **Höchste Audioqualität**: Google Chirp Stimmen klingen natürlicher als Standard TTS
|
|
2. **True Offline**: Einmal generiert, für immer verfügbar - kein Streaming nötig
|
|
3. **Minimalistisches Design**: Fokus auf das Wesentliche ohne überflüssige Features
|
|
4. **Privacy-First**: Deine Texte bleiben deine Texte
|
|
5. **Fair Pricing**: Einmalige Generierung statt ständige Streaming-Kosten
|
|
|
|
## Monetarisierung
|
|
|
|
### Freemium Modell:
|
|
|
|
- **Free Tier**: 10.000 Zeichen/Monat
|
|
- **Pro**: 500.000 Zeichen/Monat + Premium Stimmen
|
|
- **Team**: Unbegrenzt + Collaboration Features
|
|
|
|
### Kostenstruktur:
|
|
|
|
- Google TTS: ~$16 per 1 Million Zeichen (Chirp Voices)
|
|
- Supabase: $25/Monat für Pro Features
|
|
- Storage: $0.021 per GB/Monat
|
|
|
|
## Zeitplan
|
|
|
|
**Woche 1-2**: Setup & Basis-Integration
|
|
|
|
- Google Cloud und Supabase konfigurieren
|
|
- Edge Functions entwickeln
|
|
- Basis-App mit Authentifizierung
|
|
|
|
**Woche 3-4**: Audio-Pipeline
|
|
|
|
- Chunk-System implementieren
|
|
- Storage-Integration
|
|
- Playback-Funktionalität
|
|
|
|
**Woche 5-6**: Polish & Launch
|
|
|
|
- UI/UX Verfeinerung
|
|
- Testing & Bugfixing
|
|
- App Store Vorbereitung
|
|
|
|
## Erfolgsmetriken
|
|
|
|
- **Nutzer-Aktivierung**: 80% generieren ersten Audio innerhalb 5 Minuten
|
|
- **Retention**: 40% Daily Active Users
|
|
- **Audio-Qualität**: <2% Neu-Generierungen wegen Qualität
|
|
- **Performance**: <3 Sekunden für Start der Wiedergabe
|
|
- **Conversion**: 5% Free-to-Pro nach 30 Tagen
|
|
|
|
## Risiken & Mitigationen
|
|
|
|
**API-Kosten**:
|
|
|
|
- Monitoring und Alerts
|
|
- Caching-Strategien
|
|
- User Limits
|
|
|
|
**Technische Komplexität**:
|
|
|
|
- Schrittweise Integration
|
|
- Ausführliches Testing
|
|
- Fallback-Optionen
|
|
|
|
**Skalierung**:
|
|
|
|
- Edge Function Limits beachten
|
|
- CDN frühzeitig einplanen
|
|
- Horizontale Skalierung vorbereiten
|