mirror of https://github.com/Memo-2023/mana-monorepo.git synced 2026-05-15 20:19:39 +02:00

Till JS 076e0c843d chore: restore archived apps (bauntown, news, reader, uload, wisekeep)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

2026-03-29 01:08:51 +01:00

3.4 KiB

Raw Blame History

Google Cloud Text-to-Speech Setup

1. Google Cloud Projekt erstellen

Besuche die Google Cloud Console
Erstelle ein neues Projekt oder wähle ein existierendes aus
Notiere dir die Project ID

2. Text-to-Speech API aktivieren

Gehe zu "APIs & Services" → "Library"
Suche nach "Cloud Text-to-Speech API"
Klicke auf "Enable"

3. Service Account erstellen

Gehe zu "IAM & Admin" → "Service Accounts"
Klicke auf "Create Service Account"
Name: reader-tts-service
Rolle: Cloud Text-to-Speech Client
Klicke auf "Create and Continue"

4. API Key erstellen (Alternative)

Für einfache Implementierung können wir einen API Key verwenden:

Gehe zu "APIs & Services" → "Credentials"
Klicke auf "Create Credentials" → "API Key"
Kopiere den API Key
Klicke auf "Restrict Key" für Sicherheit
Unter "API restrictions" wähle "Cloud Text-to-Speech API"

5. Supabase Environment Variables

Füge folgende Variablen in deine Supabase Edge Functions ein:

# In der Supabase Dashboard unter Settings → Edge Functions → Environment Variables
GOOGLE_TTS_API_KEY=dein_api_key_hier

6. Verfügbare Google Cloud TTS Voices

Deutsch (de-DE)

Neural2 Voices (Empfohlen - beste Balance zwischen Qualität und Kosten)

de-DE-Neural2-A (weiblich)
de-DE-Neural2-B (männlich)
de-DE-Neural2-C (weiblich)
de-DE-Neural2-D (männlich)
de-DE-Neural2-E (weiblich)
de-DE-Neural2-F (männlich)

WaveNet Voices (Hochqualitativ)

de-DE-Wavenet-A (weiblich)
de-DE-Wavenet-B (männlich)
de-DE-Wavenet-C (weiblich)
de-DE-Wavenet-D (männlich)
de-DE-Wavenet-E (weiblich)
de-DE-Wavenet-F (männlich)

Studio Voices (Broadcast-Qualität)

de-DE-Studio-B (männlich)
de-DE-Studio-C (weiblich)

Standard Voices (Basis-Qualität, günstigste Option)

de-DE-Standard-A (weiblich)
de-DE-Standard-B (männlich)
de-DE-Standard-C (weiblich)
de-DE-Standard-D (männlich)
de-DE-Standard-E (weiblich)
de-DE-Standard-F (männlich)

Englisch (US)

en-US-Neural2-A (männlich)
en-US-Neural2-C (weiblich)
en-US-Neural2-D (männlich)
en-US-Neural2-E (weiblich)

Englisch (UK)

en-GB-Neural2-A (weiblich)
en-GB-Neural2-B (männlich)
en-GB-Neural2-C (weiblich)
en-GB-Neural2-D (männlich)

7. Kostenschätzung

Standard Voices: $4.00 pro 1 Million Zeichen
Neural2 Voices: $16.00 pro 1 Million Zeichen
Erstes 1 Million Zeichen pro Monat: Kostenlos

Beispielrechnung für 10.000 Zeichen:

Standard: $0.04
Neural2: $0.16

8. Quotas und Limits

Requests pro Minute: 1,000
Requests pro Tag: 100,000
Zeichen pro Request: 5,000

9. Test der API

curl -X POST \
  -H "Content-Type: application/json" \
  -d '{
    "input": {"text": "Hallo Welt, das ist ein Test."},
    "voice": {"languageCode": "de-DE", "name": "de-DE-Neural2-A"},
    "audioConfig": {"audioEncoding": "MP3"}
  }' \
  "https://texttospeech.googleapis.com/v1/text:synthesize?key=YOUR_API_KEY"

10. Nächste Schritte

API Key in Supabase Environment Variables eintragen
Edge Functions deployen
Audio-Generierung in der App testen
Monitoring und Logging einrichten

Sicherheitshinweise

API Key niemals in Client-Code einbetten
Nur über Supabase Edge Functions verwenden
Regelmäßige Rotation der API Keys
Monitoring der API-Nutzung einrichten

3.4 KiB Raw Blame History