# Google Cloud Text-to-Speech Setup ## 1. Google Cloud Projekt erstellen 1. Besuche die [Google Cloud Console](https://console.cloud.google.com/) 2. Erstelle ein neues Projekt oder wähle ein existierendes aus 3. Notiere dir die **Project ID** ## 2. Text-to-Speech API aktivieren 1. Gehe zu "APIs & Services" → "Library" 2. Suche nach "Cloud Text-to-Speech API" 3. Klicke auf "Enable" ## 3. Service Account erstellen 1. Gehe zu "IAM & Admin" → "Service Accounts" 2. Klicke auf "Create Service Account" 3. Name: `reader-tts-service` 4. Rolle: `Cloud Text-to-Speech Client` 5. Klicke auf "Create and Continue" ## 4. API Key erstellen (Alternative) Für einfache Implementierung können wir einen API Key verwenden: 1. Gehe zu "APIs & Services" → "Credentials" 2. Klicke auf "Create Credentials" → "API Key" 3. Kopiere den API Key 4. Klicke auf "Restrict Key" für Sicherheit 5. Unter "API restrictions" wähle "Cloud Text-to-Speech API" ## 5. Supabase Environment Variables Füge folgende Variablen in deine Supabase Edge Functions ein: ```bash # In der Supabase Dashboard unter Settings → Edge Functions → Environment Variables GOOGLE_TTS_API_KEY=dein_api_key_hier ``` ## 6. Verfügbare Google Cloud TTS Voices ### Deutsch (de-DE) #### Neural2 Voices (Empfohlen - beste Balance zwischen Qualität und Kosten) - `de-DE-Neural2-A` (weiblich) - `de-DE-Neural2-B` (männlich) - `de-DE-Neural2-C` (weiblich) - `de-DE-Neural2-D` (männlich) - `de-DE-Neural2-E` (weiblich) - `de-DE-Neural2-F` (männlich) #### WaveNet Voices (Hochqualitativ) - `de-DE-Wavenet-A` (weiblich) - `de-DE-Wavenet-B` (männlich) - `de-DE-Wavenet-C` (weiblich) - `de-DE-Wavenet-D` (männlich) - `de-DE-Wavenet-E` (weiblich) - `de-DE-Wavenet-F` (männlich) #### Studio Voices (Broadcast-Qualität) - `de-DE-Studio-B` (männlich) - `de-DE-Studio-C` (weiblich) #### Standard Voices (Basis-Qualität, günstigste Option) - `de-DE-Standard-A` (weiblich) - `de-DE-Standard-B` (männlich) - `de-DE-Standard-C` (weiblich) - `de-DE-Standard-D` (männlich) - `de-DE-Standard-E` (weiblich) - `de-DE-Standard-F` (männlich) ### Englisch (US) - `en-US-Neural2-A` (männlich) - `en-US-Neural2-C` (weiblich) - `en-US-Neural2-D` (männlich) - `en-US-Neural2-E` (weiblich) ### Englisch (UK) - `en-GB-Neural2-A` (weiblich) - `en-GB-Neural2-B` (männlich) - `en-GB-Neural2-C` (weiblich) - `en-GB-Neural2-D` (männlich) ## 7. Kostenschätzung - **Standard Voices**: $4.00 pro 1 Million Zeichen - **Neural2 Voices**: $16.00 pro 1 Million Zeichen - **Erstes 1 Million Zeichen pro Monat**: Kostenlos ### Beispielrechnung für 10.000 Zeichen: - Standard: $0.04 - Neural2: $0.16 ## 8. Quotas und Limits - **Requests pro Minute**: 1,000 - **Requests pro Tag**: 100,000 - **Zeichen pro Request**: 5,000 ## 9. Test der API ```bash curl -X POST \ -H "Content-Type: application/json" \ -d '{ "input": {"text": "Hallo Welt, das ist ein Test."}, "voice": {"languageCode": "de-DE", "name": "de-DE-Neural2-A"}, "audioConfig": {"audioEncoding": "MP3"} }' \ "https://texttospeech.googleapis.com/v1/text:synthesize?key=YOUR_API_KEY" ``` ## 10. Nächste Schritte 1. API Key in Supabase Environment Variables eintragen 2. Edge Functions deployen 3. Audio-Generierung in der App testen 4. Monitoring und Logging einrichten ## Sicherheitshinweise - API Key niemals in Client-Code einbetten - Nur über Supabase Edge Functions verwenden - Regelmäßige Rotation der API Keys - Monitoring der API-Nutzung einrichten