Restructure the context app (formerly basetext) to follow the monorepo pattern with proper workspace configuration. Changes: - Move app files to apps/context/apps/mobile/ - Rename package to @context/mobile - Update bundle ID to com.manacore.context - Create pnpm-workspace.yaml for project workspace - Add dev scripts to root package.json - Update CLAUDE.md with project documentation The app structure is prepared for future web/backend additions. Note: Existing TypeScript errors in the original codebase are preserved. These should be fixed in a follow-up PR. 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>
8 KiB
BaseText: KI-Funktionen
Diese Dokumentation beschreibt mögliche KI-Funktionen, die in die BaseText-Plattform integriert werden können, sowie verschiedene Implementierungsoptionen und deren Vor- und Nachteile.
Übersicht der KI-Funktionen
BaseText kann durch verschiedene KI-Funktionen erweitert werden, um den Wert der Plattform für Benutzer zu steigern und die Arbeit mit Textdokumenten effizienter zu gestalten.
1. Automatische Textzusammenfassung
Beschreibung:
Automatische Generierung von prägnanten Zusammenfassungen für Dokumente jeder Länge.
Funktionsweise:
- Integration eines KI-Modells zur Generierung von Zusammenfassungen
- Neue Schaltfläche in der Dokumentenansicht: "Zusammenfassung generieren"
- Option zur Auswahl der Zusammenfassungslänge (kurz, mittel, ausführlich)
Vorteile:
- Schneller Überblick über lange Dokumente
- Zeitersparnis für Benutzer
- Erhöht den praktischen Nutzen der Plattform
Nachteile:
- API-Kosten bei Nutzung externer Dienste
- Qualität der Zusammenfassung abhängig vom verwendeten Modell
2. Semantische Dokumentensuche
Beschreibung:
Erweiterte Suchfunktion, die nicht nur nach Schlüsselwörtern, sondern nach semantischer Ähnlichkeit sucht.
Funktionsweise:
- Implementierung einer Vektorsuche mit Embeddings
- Speicherung von Dokumenten-Embeddings in Supabase
- Erweiterte Suchfunktion in der UI mit Relevanz-Ranking
Vorteile:
- Deutlich bessere Suchergebnisse als einfache Textsuche
- Findet thematisch verwandte Dokumente, auch ohne exakte Übereinstimmung
- Ermöglicht "Ähnliche Dokumente finden"-Funktion
Nachteile:
- Höhere Komplexität bei der Implementierung
- Zusätzlicher Speicherbedarf für Embeddings
3. Automatische Dokumentenklassifizierung
Beschreibung:
KI-basierte Kategorisierung von Dokumenten und automatische Zuweisung von Tags.
Funktionsweise:
- Analyse des Dokumenteninhalts beim Upload/Erstellen
- Automatische Zuweisung von Tags basierend auf erkannten Themen
- Vorschlag für die Einordnung in bestehende Spaces
Vorteile:
- Konsistente Kategorisierung
- Zeitersparnis bei der Organisation
- Verbesserte Auffindbarkeit von Dokumenten
Nachteile:
- Mögliche Fehlkategorisierungen
- Training oder Feinabstimmung für spezifische Kategorien notwendig
4. KI-gestützte Textgenerierung
Beschreibung:
Generierung neuer Texte basierend auf Prompts und/oder vorhandenen Dokumenten.
Funktionsweise:
- Integration eines generativen KI-Modells
- Neue Funktion "Text generieren" mit Prompt-Eingabe
- Option, mehrere Dokumente als Kontext zu verwenden
Vorteile:
- Kreative Unterstützung bei der Texterstellung
- Möglichkeit, Inhalte basierend auf vorhandenen Dokumenten zu erweitern
- Vielseitige Anwendungsmöglichkeiten (Briefe, Berichte, kreative Texte)
Nachteile:
- Qualitätskontrolle notwendig
- Potenzielle ethische und rechtliche Bedenken bei automatisch generierten Inhalten
5. Inhaltsanalyse und Insights
Beschreibung:
Tiefgehende Analyse von Dokumenten zur Extraktion von Erkenntnissen und Visualisierung von Zusammenhängen.
Funktionsweise:
- Extraktion von Schlüsselthemen, Entitäten und Stimmungen
- Visualisierung von Trends und Verbindungen zwischen Dokumenten
- Dashboard mit Insights über Dokumentensammlungen
Vorteile:
- Tiefere Einblicke in Dokumenteninhalte
- Erkennung von Mustern und Trends
- Unterstützung bei der Entscheidungsfindung
Nachteile:
- Rechenintensiv
- Komplexe Visualisierungen erforderlich
6. Sprachübergreifende Funktionen
Beschreibung:
Übersetzung von Dokumenten und mehrsprachige Analyse.
Funktionsweise:
- Integration von Übersetzungs-KI
- Mehrsprachige Suche und Analyse
- Automatische Spracherkennung
Vorteile:
- Erweiterung der Nutzbarkeit für internationale Benutzer
- Ermöglicht die Arbeit mit mehrsprachigen Dokumentensammlungen
- Überwindung von Sprachbarrieren
Nachteile:
- Qualität der Übersetzung variiert je nach Sprache
- Erhöhte Komplexität bei der Implementierung
Implementierungsoptionen
1. Integration externer KI-APIs
Beschreibung:
Anbindung an kommerzielle KI-Dienste wie OpenAI (GPT-4), Anthropic (Claude) oder Google (Gemini).
Umsetzung:
- Implementierung eines API-Clients in Ihrem Supabase-Backend
- Konfiguration von API-Schlüsseln und Modellparametern
- Zwischenspeicherung von Ergebnissen zur Kostenoptimierung
Vorteile:
- Schnelle Implementierung
- Zugriff auf leistungsstarke Modelle ohne eigene Infrastruktur
- Regelmäßige Verbesserungen durch den Anbieter
Nachteile:
- Laufende Kosten pro API-Aufruf
- Abhängigkeit von externen Diensten
- Datenschutzbedenken bei sensiblen Dokumenten
2. Lokale Modelle mit Ollama oder LM Studio
Beschreibung:
Ausführung von KI-Modellen lokal auf dem Server oder Client.
Umsetzung:
- Integration von lokalen Modellen wie Llama 3, Mistral oder Phi-3
- Nutzung von Ollama oder LM Studio als Backend
- Implementierung einer API-Schnittstelle zu diesen lokalen Diensten
Vorteile:
- Keine API-Kosten
- Volle Datenkontrolle (Dokumente verlassen nicht den Server)
- Anpassbare Modellauswahl
Nachteile:
- Höhere Hardware-Anforderungen
- Eingeschränkte Modellgröße je nach verfügbarer Hardware
- Mehr Entwicklungsaufwand
3. Hybridlösung
Beschreibung:
Kombination aus lokalen Modellen für einfache Aufgaben und externen APIs für komplexere Anforderungen.
Umsetzung:
- Lokale Modelle für unkritische, häufige Operationen (z.B. Tagging)
- Externe APIs für komplexere Aufgaben (z.B. Textgenerierung)
- Benutzereinstellungen für Modellpräferenzen
Vorteile:
- Kostenoptimierung
- Flexibilität je nach Anwendungsfall
- Bessere Balance zwischen Leistung und Datenschutz
Nachteile:
- Komplexere Architektur
- Unterschiedliche Qualität je nach verwendetem Modell
Architekturvorschlag für die Integration
Neue Komponenten
-
KI-Service-Modul (
services/aiService.ts):- Zentrale Schnittstelle für alle KI-Funktionen
- Abstraktion der konkreten Implementierung (API oder lokal)
- Konfigurierbare Modellauswahl
-
Erweiterung des Datenmodells:
- Neue Tabelle für KI-generierte Inhalte mit Referenz auf Quelldokumente
- Speicherung von Embeddings für semantische Suche
- Metadaten für KI-Generierungen (verwendetes Modell, Prompt, etc.)
-
UI-Komponenten:
- Neue Sektion "KI-Tools" in der Dokumentenansicht
- Modal-Dialoge für KI-Interaktionen
- Fortschrittsanzeigen für längere KI-Prozesse
Datenfluss
Benutzer → UI-Komponente → AI-Service → Modell (lokal/extern) → Ergebnis → Datenbank → UI-Aktualisierung
Implementierungsplan
Phase 1: Grundlegende Integration
- Einrichtung der KI-Service-Infrastruktur
- Implementierung der Textzusammenfassung als erste Funktion
- Benutzeroberfläche für KI-Funktionen
Phase 2: Erweiterte Funktionen
- Semantische Suche mit Embeddings
- Automatische Dokumentenklassifizierung
- Einfache Textgenerierung
Phase 3: Fortgeschrittene Funktionen
- Komplexe Textgenerierung mit Dokumentenkontext
- Inhaltsanalyse und Visualisierungen
- Sprachübergreifende Funktionen
Technische Anforderungen
Für externe APIs:
- API-Schlüssel und Konfiguration
- Kostenmanagement und Nutzungslimits
- Fehlerbehandlung und Fallback-Strategien
Für lokale Modelle:
- Ausreichende Serverressourcen (RAM, GPU)
- Modellverwaltung und -aktualisierung
- Optimierung für Reaktionszeit
Fazit
Die Integration von KI-Funktionen in BaseText bietet erhebliches Potenzial zur Steigerung des Nutzwerts der Plattform. Durch die schrittweise Implementierung, beginnend mit einfacheren Funktionen wie der Textzusammenfassung, kann die Plattform kontinuierlich erweitert werden, während gleichzeitig Benutzerfeedback gesammelt und in die Entwicklung einbezogen wird.
Die Wahl zwischen externen APIs, lokalen Modellen oder einer Hybridlösung sollte basierend auf den spezifischen Anforderungen an Datenschutz, Kosten und Leistung getroffen werden.