further rework to the documentation

2025-11-20 12:31:21 +01:00
parent 6afa44d947
commit 9afcaa7836
90 changed files with 1721 additions and 29 deletions
--- a/docker-compose.dokploy.yml
+++ b/docker-compose.dokploy.yml
@@ -117,7 +117,7 @@ services:

  queue:
    image: registry.internal:5443/${APP_IMAGE:-fotospiel-app:latest}
-    command: /var/www/html/docs/queue-supervisor/queue-worker.sh default
+    command: /var/www/html/scripts/queue-worker.sh default
    environment:
      <<: *app-env
      SKIP_CODE_SYNC: "1"
@@ -134,7 +134,7 @@ services:

  media-storage-worker:
    image: registry.internal:5443/${APP_IMAGE:-fotospiel-app:latest}
-    command: /var/www/html/docs/queue-supervisor/queue-worker.sh media-storage
+    command: /var/www/html/scripts/queue-worker.sh media-storage
    environment:
      <<: *app-env
      QUEUE_TRIES: 5
@@ -169,7 +169,7 @@ services:

  horizon:
    image: registry.internal:5443/${APP_IMAGE:-fotospiel-app:latest}
-    command: /var/www/html/docs/queue-supervisor/horizon.sh
+    command: /var/www/html/scripts/horizon.sh
    environment:
      <<: *app-env
      SKIP_CODE_SYNC: "1"
--- a/docker-compose.yml
+++ b/docker-compose.yml
@@ -42,7 +42,7 @@ services:

  queue:
    image: fotospiel-app:latest
-    command: /var/www/html/docs/queue-supervisor/queue-worker.sh default
+    command: /var/www/html/scripts/queue-worker.sh default
    env_file:
      - docker/.env.docker
    environment:
@@ -56,7 +56,7 @@ services:

  media-storage-worker:
    image: fotospiel-app:latest
-    command: /var/www/html/docs/queue-supervisor/queue-worker.sh media-storage
+    command: /var/www/html/scripts/queue-worker.sh media-storage
    env_file:
      - docker/.env.docker
    environment:
@@ -85,7 +85,7 @@ services:

  horizon:
    image: fotospiel-app:latest
-    command: /var/www/html/docs/queue-supervisor/horizon.sh
+    command: /var/www/html/scripts/horizon.sh
    env_file:
      - docker/.env.docker
    environment:
--- a/docker/app/entrypoint.sh
+++ b/docker/app/entrypoint.sh
@@ -27,8 +27,8 @@ sync_code() {
 }

 ensure_helper_scripts() {
-    if compgen -G "$APP_TARGET/docs/queue-supervisor/*.sh" > /dev/null; then
-        chmod +x "$APP_TARGET"/docs/queue-supervisor/*.sh || true
+    if compgen -G "$APP_TARGET/scripts/*.sh" > /dev/null; then
+        chmod +x "$APP_TARGET"/scripts/*.sh || true
    fi
 }

--- a/docs/archive/ADR-0006-tenant-admin-pwa.md
+++ b/docs/archive/ADR-0006-tenant-admin-pwa.md
--- a/docs/archive/plan-superadmin-filament.md
+++ b/docs/archive/plan-superadmin-filament.md
--- a/docs/archive/prp-addendum-2025-09-08-tenant-admin-pwa.md
+++ b/docs/archive/prp-addendum-2025-09-08-tenant-admin-pwa.md
--- a/docs/archive/prp/01-architecture.md
+++ b/docs/archive/prp/01-architecture.md
--- a/docs/archive/prp/02-tenancy.md
+++ b/docs/archive/prp/02-tenancy.md
--- a/docs/archive/prp/03-api.md
+++ b/docs/archive/prp/03-api.md
--- a/docs/archive/prp/04-data-model-migrations.md
+++ b/docs/archive/prp/04-data-model-migrations.md
--- a/docs/archive/prp/05-admin-superadmin.md
+++ b/docs/archive/prp/05-admin-superadmin.md
--- a/docs/archive/prp/06-tenant-admin-pwa.md
+++ b/docs/archive/prp/06-tenant-admin-pwa.md
--- a/docs/archive/prp/07-guest-pwa-routes-components.md
+++ b/docs/archive/prp/07-guest-pwa-routes-components.md
--- a/docs/archive/prp/07-guest-pwa.md
+++ b/docs/archive/prp/07-guest-pwa.md
--- a/docs/archive/prp/08-billing.md
+++ b/docs/archive/prp/08-billing.md
--- a/docs/archive/prp/09-security-compliance.md
+++ b/docs/archive/prp/09-security-compliance.md
--- a/docs/archive/prp/10-storage-media-pipeline.md
+++ b/docs/archive/prp/10-storage-media-pipeline.md
--- a/docs/archive/prp/11-ops-ci-cd.md
+++ b/docs/archive/prp/11-ops-ci-cd.md
--- a/docs/archive/prp/11-public-gallery.md
+++ b/docs/archive/prp/11-public-gallery.md
--- a/docs/archive/prp/12-i18n.md
+++ b/docs/archive/prp/12-i18n.md
--- a/docs/archive/prp/13-backend-authentication.md
+++ b/docs/archive/prp/13-backend-authentication.md
--- a/docs/archive/prp/14-freemium-business-model.md
+++ b/docs/archive/prp/14-freemium-business-model.md
--- a/docs/archive/prp/15-packages-design.md
+++ b/docs/archive/prp/15-packages-design.md
--- a/docs/archive/prp/99-glossary.md
+++ b/docs/archive/prp/99-glossary.md
--- a/docs/archive/prp/README.md
+++ b/docs/archive/prp/README.md
--- a/docs/archive/prp/marketing-checkout-payment-architecture.md
+++ b/docs/archive/prp/marketing-checkout-payment-architecture.md
--- a/docs/archive/prp/marketing-frontend-unification.md
+++ b/docs/archive/prp/marketing-frontend-unification.md
--- a/docs/archive/prp/packages-ui-improvements.md
+++ b/docs/archive/prp/packages-ui-improvements.md
--- a/docs/archive/prp/public-entrypoints.md
+++ b/docs/archive/prp/public-entrypoints.md
--- a/docs/archive/prp/tenant-app-specs/README.md
+++ b/docs/archive/prp/tenant-app-specs/README.md
--- a/docs/archive/prp/tenant-app-specs/api-usage.md
+++ b/docs/archive/prp/tenant-app-specs/api-usage.md
--- a/docs/archive/prp/tenant-app-specs/capacitor-setup.md
+++ b/docs/archive/prp/tenant-app-specs/capacitor-setup.md
--- a/docs/archive/prp/tenant-app-specs/functional-specs.md
+++ b/docs/archive/prp/tenant-app-specs/functional-specs.md
--- a/docs/archive/prp/tenant-app-specs/pages-ui-legacy.md
+++ b/docs/archive/prp/tenant-app-specs/pages-ui-legacy.md
--- a/docs/archive/prp/tenant-app-specs/pages-ui.md
+++ b/docs/archive/prp/tenant-app-specs/pages-ui.md
--- a/docs/archive/prp/tenant-app-specs/settings-config.md
+++ b/docs/archive/prp/tenant-app-specs/settings-config.md
--- a/docs/archive/screenshots/1start.png
+++ b/docs/archive/screenshots/1start.png
--- a/docs/archive/screenshots/2start.png
+++ b/docs/archive/screenshots/2start.png
--- a/docs/archive/screenshots/3emotionpicker.png
+++ b/docs/archive/screenshots/3emotionpicker.png
--- a/docs/archive/screenshots/4-taskscreen.png
+++ b/docs/archive/screenshots/4-taskscreen.png
--- a/docs/archive/screenshots/5-camerapage.png
+++ b/docs/archive/screenshots/5-camerapage.png
--- a/docs/archive/screenshots/6-general-landing-page.png
+++ b/docs/archive/screenshots/6-general-landing-page.png
--- a/docs/archive/screenshots/7-event-landing-page.png
+++ b/docs/archive/screenshots/7-event-landing-page.png
--- a/docs/archive/screenshots/free-step1-home.png
+++ b/docs/archive/screenshots/free-step1-home.png
--- a/docs/archive/screenshots/free-step1-packages.png
+++ b/docs/archive/screenshots/free-step1-packages.png
--- a/docs/archive/screenshots/free-step2-packages.png
+++ b/docs/archive/screenshots/free-step2-packages.png
--- a/docs/archive/screenshots/paid-end-step1-packages.png
+++ b/docs/archive/screenshots/paid-end-step1-packages.png
--- a/docs/archive/screenshots/paid-res-step1-packages.png
+++ b/docs/archive/screenshots/paid-res-step1-packages.png
--- a/docs/archive/screenshots/tenant-admin-onboarding/01-welcome-hero.svg
+++ b/docs/archive/screenshots/tenant-admin-onboarding/01-welcome-hero.svg
--- a/docs/archive/screenshots/tenant-admin-onboarding/02-how-it-works.svg
+++ b/docs/archive/screenshots/tenant-admin-onboarding/02-how-it-works.svg
--- a/docs/archive/screenshots/tenant-admin-onboarding/03-package-selection.svg
+++ b/docs/archive/screenshots/tenant-admin-onboarding/03-package-selection.svg
--- a/docs/archive/screenshots/tenant-admin-onboarding/04-order-summary.svg
+++ b/docs/archive/screenshots/tenant-admin-onboarding/04-order-summary.svg
--- a/docs/archive/screenshots/tenant-admin-onboarding/05-event-setup.svg
+++ b/docs/archive/screenshots/tenant-admin-onboarding/05-event-setup.svg
--- a/docs/archive/screenshots/tenant-admin-onboarding/README.md
+++ b/docs/archive/screenshots/tenant-admin-onboarding/README.md
--- a/docs/archive/wireframes/PWA_Wireframes.txt
+++ b/docs/archive/wireframes/PWA_Wireframes.txt
--- a/docs/archive/wireframes/guest-pwa.md
+++ b/docs/archive/wireframes/guest-pwa.md
--- a/docs/content/legal/agb-de.md
+++ b/docs/content/legal/agb-de.md
--- a/docs/content/legal/agb-en.md
+++ b/docs/content/legal/agb-en.md
--- a/docs/content/legal/datenschutz-de.md
+++ b/docs/content/legal/datenschutz-de.md
--- a/docs/content/legal/datenschutz-en.md
+++ b/docs/content/legal/datenschutz-en.md
--- a/docs/content/legal/impressum-de.md
+++ b/docs/content/legal/impressum-de.md
--- a/docs/content/legal/impressum-en.md
+++ b/docs/content/legal/impressum-en.md
--- a/docs/ops/README.md
+++ b/docs/ops/README.md
@@ -8,6 +8,6 @@ This section consolidates everything platform operators need: deployment guides,
 - `photobooth/` — FTP ingest service docs and ops playbooks.
 - `media-storage-spec.md` — Upload/archival flow overview.
 - `guest-notification-ops.md` — Push notification queue monitoring.
- `queue-workers.md` — Worker container instructions referencing scripts in `/docs/queue-supervisor/`.
+- `queue-workers.md` — Worker container instructions referencing scripts in `/scripts/`.

 Future additions (e.g., escalations, on-call checklists, Terraform notes) should live here as well so all ops content remains in one location.
--- a/docs/ops/backup-restore.md
+++ b/docs/ops/backup-restore.md
@@ -0,0 +1,94 @@
+---
+title: Backup & Restore / Disaster Recovery
+sidebar_label: Backup & DR
+---
+
+Dieses Dokument beschreibt, was gesichert werden sollte, wie Backups geprüft werden und wie ein Restore im Notfall abläuft.
+
+## 1. Was muss gesichert werden?
+
+- **Datenbank**
+  - MySQL‑Datenbank (alle Schemas/Tables des Fotospiel‑Backends).
+  - Enthält Tenants, Events, Fotos‑Metadaten, Join‑Tokens, Abrechnungsdaten, Logs (soweit in DB).
+- **Medienspeicher**
+  - Hot‑Storage: Pfade unter `storage/app/private` / `storage/app/public` oder konfigurierten „hot“‑Disks.
+  - Archivspeicher: Buckets/Disks, in denen `event_media_assets` mit Status `archived` liegen.
+- **Konfiguration**
+  - `.env` Dateien (ohne sie in Git zu speichern), Dokploy‑Compose‑Konfigurationen, Secrets für externe Dienste.
+  - Optional: Horizon‑Konfiguration, Monitoring‑Dashboards.
+
+> TODO: Füge hier konkrete Pfade/Bucket‑Namen und die verwendeten Backup‑Tools (z.B. `mysqldump`, S3‑Snapshots, Dokploy‑Backups) ein.
+
+## 2. Backup-Strategie
+
+- **Datenbank-Backups**
+  - Frequenz: mindestens täglich (idealerweise alle 4–6 Stunden für Produktions‑DB).
+  - Aufbewahrung: z.B. 7–30 Tage, mit Off‑Site‑Kopie.
+  - Prüfschritte:
+    - Dump/Backupfile auf Plausibilität (Größe, letzte Änderung).
+    - Regelmäßige Test‑Restores in eine Staging‑DB:
+      - Beispiel (einfacher Dump auf Host – Pfade/Passwörter an Umgebung anpassen):
+        - `mysqldump -h 127.0.0.1 -u fotospiel -p fotospiel > fotospiel-$(date +%F).sql`
+      - Restore in temporäre DB (z.B. `fotospiel_restore`) und kurze Stichproben:
+        - `mysql -h 127.0.0.1 -u fotospiel -p fotospiel_restore < fotospiel-YYYY-MM-DD.sql`
+- **Medien-Backups**
+  - Hot‑Storage:
+    - Snapshot/Incremental‑Backup der Storage‑Volumes oder S3‑Buckets.
+  - Archive:
+    - Sicherstellen, dass Archiv‑Backups nicht versehentlich durch Lifecycle‑Policies gelöscht werden, bevor gesetzliche Retention erfüllt ist.
+- **Konfig-Backups**
+  - `.env` und Secrets nur verschlüsselt speichern (z.B. in einem Secrets‑Manager, nicht in Klartext‑Backups).
+  - Dokploy‑/Compose‑Konfiguration versionieren (Git) und zusätzlich sicher exportieren.
+
+## 3. Restore-Szenarien
+
+### 3.1 Einzelner Tenant/Event defekt
+
+1. Reproduzieren, ob der Fehler rein logisch (Datenkonsistenz) oder physisch (Fehlender Medien‑Blob) ist.
+2. **DB‑Restore (punktuell)**:
+   - Wenn möglich, nur relevante Tabellenbereiche (z.B. `tenants`, `events`, `photos`, `event_media_assets`, `event_packages`) aus Backup in eine temporäre DB laden.
+   - Differenzanalyse: welche Daten fehlen/fehlerhaft? Manuell oder via Skript zurückspielen.
+3. **Medien-Check**
+   - Fehlende Dateien im Hot/Archive‑Storage identifizieren (z.B. per `event_media_assets` Pfade + `Storage::disk()->exists`).
+   - Wenn Dateien im Backup vorhanden, gezielt an den richtigen Pfad zurückkopieren.
+
+> Diese Schritte sollten zuerst in einer Staging‑Umgebung eingeübt werden, bevor sie in Produktion angewendet werden.
+
+### 3.2 Betriebsweite Störung (DB/Storage Verlust)
+
+1. **DB wiederherstellen**
+   - Leere Datenbank aufsetzen, letztes konsistentes Backup einspielen.
+2. **Storage wiederherstellen**
+   - Hot‑Storage‑Backup auf Volumes/Buckets zurückspielen (z.B. Docker‑Volume `app-storage` oder zugeordneten Bucket).
+   - Archiv‑Buckets ggf. unverändert lassen, sofern noch intakt.
+3. **App & Queues**
+   - App mit readonly/maintenance‑Flag starten, Queues gestoppt lassen.
+   - Konsistenzprüfungen (z.B. stichprobenartige Tenants, Events, Medien, Abrechnungsdaten).
+4. **Queues wieder freigeben**
+   - Wenn die wichtigsten Funktionen wieder intakt sind, Queues/Horizon graduell zuschalten.
+
+> TODO: Ergänze konkrete Kommandos (Migrationsstatus prüfen, Health‑Checks) und definierte RTO/RPO‑Ziele.
+
+## 4. Tests & DR-Übungen
+
+- Mindestens 1–2 Mal pro Jahr einen vollständigen Restore in einer separaten Umgebung durchspielen:
+  - DB‑Backup einspielen.
+  - Medien‑Backups anbinden.
+  - Eine Handvoll Tenants/Events kompletter durchklicken (Upload, Galerie, Admin‑Funktionen).
+- Ergebnisse im `docs/process/changes/`‑Ordner dokumentieren (z.B. „DR‑Übung 2026‑Q1“ mit Learnings).
+
+## 5. Verantwortlichkeiten
+
+- **Backup-Ownership**: Wer stellt sicher, dass Backups laufen und testweise wiederhergestellt werden?
+- **DR-Ownership**: Wer führt die DR‑Übungen durch und wer entscheidet im Ernstfall über Failover/Restore?
+
+Diese Punkte sollten mit konkreten Namen/Rollen befüllt werden, damit im Ernstfall keine Unklarheiten bestehen.
+
+## 6. Ergänzende DR-Playbooks
+
+Spezielle DR‑Szenarien sind in separaten Runbooks beschrieben:
+
+- `docs/ops/dr-tenant-event-restore.md` – Vorgehen bei versehentlich gelöschten oder beschädigten Tenants/Events.
+- `docs/ops/dr-storage-issues.md` – Vorgehen bei Hot‑/Archive‑Storage‑Problemen (voll, hängende Archivierung, fehlende Medien).
+
+Dieses Dokument bleibt die High‑Level‑Übersicht – für konkrete Fälle solltest du immer auch die entsprechenden Playbooks konsultieren.
--- a/docs/ops/billing-ops.md
+++ b/docs/ops/billing-ops.md
@@ -0,0 +1,133 @@
+---
+title: Billing & Zahlungs-Operationen
+sidebar_label: Billing-Runbook
+---
+
+Dieses Runbook beschreibt, wie mit Zahlungsproblemen, Paddle/RevenueCat‑Webhooks und Paket‑Inkonsistenzen operativ umzugehen ist.
+
+## 1. Komponentenüberblick
+
+- **Paddle**
+  - Abwicklung von Web‑Checkout, Paketen und Subscriptions.
+  - Webhooks für Käufe, Verlängerungen, Stornos.
+- **Fotospiel Backend**
+  - Modelle wie `Tenant`, `Packages`, `tenant_packages`, `event_packages`.
+  - Services/Jobs zur Paket‑Zuweisung, Limit‑Berechnung und Nutzungstracking.
+
+> Details zur Architektur findest du in den PRP‑Kapiteln (Billing/Freemium) sowie in den TODO‑Dokumenten unter `docs/process/todo/paddle-migration.md` und `docs/process/todo/paddle-catalog-sync.md`.
+
+## 2. Typische Problemszenarien
+
+- **Webhook kommt nicht an / schlägt fehl**
+  - Symptom: Paddle zeigt Zahlung „completed“, Tenant‑Paket im Backend bleibt unverändert.
+  - Checkliste:
+    - Logs der Webhook‑Routes prüfen (Statuscodes, Exceptions).
+      - Endpoint: `POST /paddle/webhook` → `PaddleWebhookController::handle()`.
+      - Controller ruft `CheckoutWebhookService::handlePaddleEvent()` auf.
+    - Webhook‑Replay über das Paddle Dashboard auslösen (für einzelne Events).
+    - Queue‑Status prüfen:
+      - Falls Webhooks über Queues verarbeitet werden, auf `default`/`billing`‑Queues achten (je nach Konfiguration).
+- **Doppelte oder fehlende Abbuchungen**
+  - Abgleich von Zahlungsprovider‑Daten (Paddle/RevenueCat) mit internem Ledger.
+  - Bei doppelten Buchungen: Prozess definieren (Refund via Paddle, Anpassung im Ledger).
+  - Bei fehlenden Buchungen: ggf. manuelle Paketzuweisung nach erfolgter Zahlung.
+- **Pakete/Limits passen nicht zur Realität**
+  - Tenant meldet: „Paket falsch“, „Galerie schon abgelaufen“ o.Ä.
+  - Prüfen:
+    - Aktives Paket (`tenant_packages`, `event_packages`).
+    - Limit‑Zähler (`used_photos`, `used_events`) und aktuelle Nutzung.
+    - Letzte relevante Webhooks/Jobs (z.B. vor kurzem migriert?).
+
+## 3. Operative Schritte bei Payment Incidents
+
+1. **Event/Tenant identifizieren**
+   - IDs und relevante Paket‑Infos aus DB/Admin UI holen.
+2. **Provider-Status prüfen**
+    - Paddle‑Dashboard: ist die Zahlung dort korrekt verbucht? (Transaktions‑/Abonnement‑Ansicht).
+3. **Backend-Status prüfen**
+    - Paketzuweisung und Limits in der DB (Read‑only!) inspizieren:
+      - `checkout_sessions` – wurde die Session korrekt auf `completed` gesetzt? (`provider = paddle`, `paddle_transaction_id` gefüllt?)
+      - `package_purchases` – existiert ein Eintrag für Tenant/Package mit erwarteter Provider‑Referenz?
+      - `tenant_packages` – stimmt der `active`‑Status und `expires_at` mit dem erwarteten Abostatus überein?
+4. **Entscheidung**
+    - Automatische Nachverarbeitung via Webhook‑Replay/Job‑Retry:
+      - Paddle‑Events erneut senden lassen, ggf. `tests/api/_testing/checkout/sessions/{session}/simulate-paddle` (in Test‑Umgebungen) nutzen.
+    - Notfall: manuelle Paket‑Anpassung (nur mit klar dokumentierter Begründung):
+      - Paket in `tenant_packages` aktivieren/verlängern und `package_purchases` sauber nachziehen.
+5. **Dokumentation**
+   - Vorgang im Ticket / `docs/process/changes/*` festhalten, falls wiederkehrend.
+
+> TODO: Ergänze konkrete Tabellen-/Modellnamen und die relevanten Jobs/Artisan Commands, sobald Paddle/RevenueCat Migration finalisiert ist.
+
+## 4. Zusammenarbeit mit Finance/Support
+
+- Klar definieren, wer Rückerstattungen freigibt und durchführt.
+- Playbook für Support:
+  - Welche Informationen sie sammeln sollen, bevor sie an Ops eskalieren (Tenant‑ID, Event‑ID, Payment‑Provider‑Referenz, Zeitstempel).
+  - Welche Standardantworten es gibt (z.B. „Zahlung in Prüfung, Paket kurzfristig manuell freigeschaltet“).
+
+## 5. Hinweise zur Implementierung
+
+- **Konfiguration**
+  - Paddle‑Keys, Webhook‑Secrets und Feature‑Flags sollten ausschließlich in `.env`/Config‑Dateien liegen und niemals im Code/Logs landen.
+  - Sandbox vs. Live‑Keys klar trennen; Ops sollte wissen, welche Umgebung gerade aktiv ist.
+- **Sicherheit**
+  - Webhook‑Signaturen und Timestamps prüfen; bei verdächtigen Mustern (z.B. Replay‑Angriffe) Security‑Runbooks konsultieren.
+  - Keine sensiblen Payment‑Details in Applikations‑Logs ausgeben.
+
+Diese Sektion ist bewusst generisch gehalten, damit sie auch nach Implementation der finalen Billing‑Architektur noch passt. Details zu Tabellen/Jobs sollten ergänzt werden, sobald die Paddle‑Migration abgeschlossen ist.
+
+## 6. Konkrete Paddle-Flows im System
+
+### 6.1 Checkout-Erstellung
+
+- Marketing-Checkout / API:
+  - `MarketingController` und `PackageController` nutzen `PaddleCheckoutService::createCheckout()` (`App\Services\Paddle\PaddleCheckoutService`).
+  - Der Service:
+    - Stellt sicher, dass ein `paddle_customer_id` für den Tenant existiert (`PaddleCustomerService::ensureCustomerId()`).
+    - Baut Metadaten (`tenant_id`, `package_id`, optional `checkout_session_id`) für spätere Zuordnung.
+    - Ruft `POST /checkout/links` im Paddle‑API auf und erhält eine `checkout_url`.
+- Ops-Sicht:
+  - Wenn `paddle_price_id` bei einem Package fehlt, wird kein Checkout erzeugt – Marketing‑UI zeigt entsprechende Fehlertexte (siehe `resources/lang/*/marketing.php`).
+  - Bei wiederkehrenden „checkout failed“‑Fehlern die Logs (`PaddleCheckoutService`, Controller) und Package‑Konfiguration prüfen.
+
+### 6.2 Webhook-Verarbeitung & Idempotenz
+
+- Endpoint: `POST /paddle/webhook` → `PaddleWebhookController::handle()`.
+- Service: `CheckoutWebhookService` (`App\Services\Checkout\CheckoutWebhookService`):
+  - Unterscheidet zwischen **Transaktions‑Events** (`transaction.*`) und **Subscription‑Events** (`subscription.*`).
+  - Idempotenz:
+    - Nutzt ein Cache‑Lock (`checkout:webhook:paddle:{transaction_id|session_id}`), um parallele Verarbeitung desselben Events zu verhindern.
+    - Schreibt Metadaten (`paddle_last_event`, `paddle_status`, `paddle_checkout_id`) in `checkout_sessions.provider_metadata`.
+- Ergebnis:
+  - Bei `transaction.completed`:
+    - `CheckoutSession` wird als `processing` markiert.
+    - `CheckoutAssignmentService::finalise()` weist Paket/Tenant zu.
+    - Session wird auf `completed` gesetzt.
+  - Bei `transaction.failed` / `transaction.cancelled`:
+    - Session wird auf `failed` gesetzt, Coupons werden als fehlgeschlagen markiert.
+
+### 6.3 Subscriptions & TenantPackages
+
+- Subscription‑Events (`subscription.*`) werden ebenfalls von `CheckoutWebhookService` behandelt:
+  - Tenant wird aus `metadata.tenant_id` oder `paddle_customer_id` ermittelt.
+  - Package wird über `metadata.package_id` oder `paddle_price_id` aufgelöst.
+  - `TenantPackage` wird erstellt/aktualisiert (`paddle_subscription_id`, `expires_at`, `active`).
+  - `Tenant.subscription_status` und `subscription_expires_at` werden gesteuert.
+- Ops-Sicht:
+  - Bei abweichenden Abostatus (z.B. Paddle zeigt „active“, Tenant nicht):
+    - Subscription‑Events im Paddle‑Dashboard prüfen.
+    - Letzte `subscription.*`‑Events in den Logs, `TenantPackage`‑ und `Tenant`‑Felder gegenprüfen.
+
+### 6.4 Paket- & Coupon-Synchronisation
+
+- Pakete:
+  - Artisan‑Command `paddle:sync-packages` (`App\Console\Commands\PaddleSyncPackages`) stößt für ausgewählte oder alle Pakete `SyncPackageToPaddle`/`PullPackageFromPaddle` Jobs an.
+  - Sync‑Jobs nutzen `PaddleCatalogService`, um Produkte/Preise in Paddle zu erstellen/aktualisieren und `paddle_product_id`/`paddle_price_id` lokal zu pflegen.
+- Coupons:
+  - `SyncCouponToPaddle`‑Job spiegelt interne Coupon‑Konfiguration in Paddle Discounts (`PaddleDiscountService`).
+- Ops-Sicht:
+  - Bei Katalog‑Abweichungen `paddle:sync-packages --dry-run` verwenden, um Snapshots zu prüfen, bevor tatsächliche Änderungen gesendet werden.
+  - Fehlgeschlagene Syncs in den Logs (`Paddle package sync failed`, `Paddle discount sync failed`) beobachten.
+
+Diese Untersektion soll dir als Operator helfen zu verstehen, wie Paddle‑Aktionen im System abgebildet sind und an welchen Stellen du im Fehlerfall ansetzen kannst.
--- a/docs/ops/compliance-dsgvo-ops.md
+++ b/docs/ops/compliance-dsgvo-ops.md
@@ -0,0 +1,90 @@
+---
+title: DSGVO & Compliance-Operationen
+sidebar_label: DSGVO-Operationen
+---
+
+Dieses Runbook beschreibt praktische Abläufe für Datenschutz‑Anfragen, Datenlöschung und Aufbewahrungsfristen.
+
+## 1. Grundprinzipien
+
+- Gäste benötigen kein Konto; die meisten Daten sind Event‑ und Foto‑bezogen.
+- Tenant Admins sind in der Regel Verantwortliche im Sinne der DSGVO, Fotospiel fungiert als Auftragsverarbeiter (je nach Vertragsmodell).
+- Rechtsgrundlagen, Impressum und Datenschutzerklärungen werden über die Legal‑Pages im Admin verwaltet – dieses Dokument fokussiert sich auf **Betriebsprozesse**.
+
+## 2. Typische Anfragen & Aktionen
+
+- **Auskunftsanfragen**
+  - Gast möchte wissen, ob Fotos von ihm/ihr gespeichert sind.
+  - Typischer Ablauf:
+    - Gast an Tenant verweisen (wenn Veranstalter Ansprechpartner ist).
+    - Falls Fotospiel direkt handeln muss: Event/Foto‑IDs anhand bereitgestellter Infos identifizieren (z.B. Link, Screenshot, Zeitfenster).
+    - Relevante Datensätze in DB (Fotos, Likes, Meldungen) lokalisieren und dokumentieren.
+- **Löschanfragen**
+  - Ein Gast/Tenant bittet um Löschung spezifischer Fotos oder eines ganzen Events.
+  - Vorgehen:
+    1. Identität und Berechtigung prüfen (z.B. Tenant Admin, verifizierte Anfrage).
+    2. Fotos/Ereignisse über Admin UI oder interne Tools löschen/archivieren.
+       - Sicherstellen, dass `event_media_assets` und Archiv‑Speicher ebenfalls bereinigt werden.
+    3. Prüfen, ob Logs/Audits pseudonymisiert bleiben können, ohne personenbezogene Inhalte.
+    4. Anfrage und Zeitpunkt dokumentieren (Ticket, internes Log).
+- **Datenexport**
+  - Tenant will einen Export seiner Daten (Events, Medien, Statistiken).
+  - Nutzung der vorhandenen Export‑Funktionen (z.B. CSV/ZIP im Admin) bevorzugen.
+  - Falls diese nicht ausreichen, manuelle Exporte via Skript/DB mit Datenschutz im Blick (keine unnötigen Felder).
+    - Beispiel: nur die Felder exportieren, die für den Zweck der Anfrage wirklich notwendig sind (kein Debug‑Log, keine internen IDs, sofern nicht sinnvoll).
+
+### 2.1 Konkrete Tools & Endpoints
+
+- **Profil-Datenexport (User-Ebene)**
+  - Controller: `App\Http\Controllers\ProfileDataExportController`.
+  - UI: Profilbereich der Tenant Admin PWA; Nutzer kann dort einen Export anstoßen.
+  - Ablauf:
+    1. Nutzer triggert Export → `ProfileDataExportController::store()` legt einen `DataExport`‑Eintrag an (`status = pending`) und dispatcht `GenerateDataExport`.
+    2. Der Job `GenerateDataExport` erstellt ein ZIP mit relevanten Daten und setzt `status = ready`, `path`, ggf. `expires_at`.
+    3. Nutzer kann die Datei über `ProfileDataExportController::download()` abrufen, solange `isReady()` und nicht `hasExpired()`.
+  - Ops-Sicht:
+    - Wenn Exporte „hängen bleiben“ (lange `pending`/`processing`), Queue/Horizon und Logs prüfen, ggf. Job neu anstoßen.
+    - Für DSGVO‑Exports bevorzugt diesen Pfad nutzen, statt ad‑hoc DB‑Abfragen.
+
+- **Account-Anonymisierung (User/Tenant-Ebene)**
+  - Service: `App\Services\Compliance\AccountAnonymizer`.
+  - Job: `App\Jobs\AnonymizeAccount` nutzt diesen Service typischerweise im Hintergrund.
+  - Verhalten:
+    - Löscht/entfernt Medien (`EventMediaAsset`, `Photo`) für einen Tenant.
+    - Anonymisiert Tenant‑ und User‑Daten (setzt neutrale Namen, entfernt Kontaktinfos, sperrt Accounts).
+  - Ops-Sicht:
+    - Nur nach klarer Freigabe einsetzen, da Anonymisierung irreversibel ist.
+    - Vor Einsatz prüfen, ob für den betreffenden Tenant alle vertraglichen Zusagen (z.B. Datenexport) erfüllt sind.
+
+## 3. Retention & automatisierte Löschung
+
+- **Event-bezogene Aufbewahrung**
+  - Standard‑Retentionsfristen für Events/Fotos (z.B. X Tage nach Eventende/Archivierung) laut Produkt‑Spezifikation.
+  - Jobs/Kommandos, die nach Ablauf Medien archivieren oder löschen (siehe `docs/ops/media-storage-spec.md`).
+- **Logs**
+  - Aufbewahrungsdauer von Applikations‑Logs (z.B. 30–90 Tage), Rotation/Anonymisierung.
+- **Konfiguration pro Tenant**
+  - Wenn Tenants eigene Retention wünschen, prüfen ob das UI/Config‑Model dies unterstützt (nicht ad‑hoc in SQL ändern).
+
+## 4. Operative Checkliste bei DSGVO-Fällen
+
+1. Anfrage klassifizieren (Auskunft, Löschung, Export, Sonstiges).
+2. Verantwortlichkeit klären (Tenant vs. Fotospiel).
+3. Technische Schritte definieren (welche Events/Fotos/Accounts betroffen).
+4. Durchführung:
+   - In Admin UI oder via internen Tools.
+   - Medien/Metadaten konsistent behandeln (keine „hängenden“ Records).
+5. Dokumentation:
+   - Ticket/E-Mail‑Thread mit Datum, Betreff, Maßnahmen.
+6. Follow‑Up:
+   - Prüfen, ob Runbooks/Automatisierungen angepasst werden sollten (z.B. besserer Self‑Service für Tenants).
+
+## 5. Verbindung zu Security-Hardening
+
+Das Security‑Hardening‑Epic (`docs/process/todo/security-hardening-epic.md`) enthält mehrere Workstreams, die DSGVO‑relevant sind:
+
+- Signierte Asset‑URLs statt direkter Storage‑Links.
+- Verbesserte Token‑/Auth‑Flows.
+- Storage‑Health und Checksummen‑Verifizierung.
+
+Wenn dort neue Features produktiv gehen, sollten die Auswirkungen auf DSGVO‑Prozesse in diesem Runbook ergänzt werden.
--- a/docs/ops/deployment/docker.md
+++ b/docs/ops/deployment/docker.md
@@ -67,7 +67,7 @@ If you already have data, skip the seeder or seed only new records.

 ## 5. Queue & Horizon management

-Worker entrypoints live in `docs/queue-supervisor/`. The Compose services mount the same application volume so code stays in sync. Adjust concurrency by scaling services:
+Worker entrypoints live in `/scripts/` inside the container (copied from the repository’s `scripts/` folder). The Compose services mount the same application volume so code stays in sync. Adjust concurrency by scaling services:

 ```bash
 docker compose up -d --scale queue=2 --scale media-storage-worker=2
--- a/docs/ops/deployment/dokploy.md
+++ b/docs/ops/deployment/dokploy.md
@@ -8,8 +8,8 @@ Dokploy is our self-hosted PaaS for orchestrating the Fotospiel stack (Laravel a
 |---------|-------|
 | **Laravel App** | Build from this repository. Expose port 8080 (or Dokploy HTTP service). Attach the production `.env`. Health check `/up`. |
 | **Scheduler** | Clone the app container; command `php artisan schedule:work`. |
-| **Queue workers** | Use `docs/queue-supervisor/queue-worker.sh` scripts (default, media-storage, media-security). Deploy each as a dedicated Dokploy application or Docker service. |
-| **Horizon (optional)** | Run `docs/queue-supervisor/horizon.sh` for dashboard + metrics. |
+| **Queue workers** | Use the `/scripts/queue-worker.sh` entrypoints (default, media-storage, media-security). Deploy each as a dedicated Dokploy application or Docker service. |
+| **Horizon (optional)** | Run `/scripts/horizon.sh` for dashboard + metrics. |
 | **Redis / Database** | Use managed offerings or self-host in Dokploy. Configure network access for the app + workers. |
 | **vsftpd container** | Expose port 2121 and mount the shared Photobooth volume. |
 | **Photobooth Control Service** | Lightweight API (Go/Node/Laravel Octane) that can be redeployed together with vsftpd for ingest controls. |
@@ -72,10 +72,10 @@ Follow these steps for each component:
 3. **Queue workers**
   - Duplicate the image.
   - Commands:
-     - `docs/queue-supervisor/queue-worker.sh default`
-     - `docs/queue-supervisor/queue-worker.sh media-storage`
-     - `docs/queue-supervisor/queue-worker.sh media-security`
-   - Optionally create a dedicated container for Horizon using `docs/queue-supervisor/horizon.sh`.
+     - `/var/www/html/scripts/queue-worker.sh default`
+     - `/var/www/html/scripts/queue-worker.sh media-storage`
+     - `/var/www/html/scripts/queue-worker.sh media-security`
+   - Optionally create a dedicated container for Horizon using `/var/www/html/scripts/horizon.sh`.

 4. **vsftpd + Photobooth control**
   - Nutze deinen bestehenden Docker-Compose-Stack (z. B. `docker-compose.dokploy.yml`) oder dedizierte Compose-Applikationen.
--- a/docs/ops/diagrams.md
+++ b/docs/ops/diagrams.md
@@ -0,0 +1,42 @@
+---
+title: Architekturdiagramme
+sidebar_label: Diagramme
+---
+
+Diese Seite bündelt einfache Diagramme für zentrale Plattform‑Flows. Sie sind absichtlich high‑level gehalten und sollen neuen Operatoren einen schnellen Überblick geben.
+
+## 1. Medien‑Pipeline (Mermaid)
+
+```mermaid
+flowchart LR
+    Guest[Guest PWA] -->|Foto upload| API[Laravel API]
+    API -->|Validierung & DB| DB[(DB: events,\nevent_media_assets)]
+    API -->|Datei schreiben| HotStorage[(Hot Storage\n/var/www/storage)]
+
+    HotStorage --> QueueMedia[Queue: media-storage]
+    QueueMedia --> WorkerMedia[Worker: media-storage-worker]
+    WorkerMedia --> Archive[(Archive Storage\nz.B. S3/Wasabi)]
+
+    WorkerMedia --> Thumbs[Job: Thumbnails]
+    Thumbs --> HotStorage
+
+    DB --> PublicAPI[Public API]
+    PublicAPI --> Guest
+```
+
+## 2. Checkout & Billing (Mermaid)
+
+```mermaid
+flowchart LR
+    Tenant[Browser Tenant-Admin] -->|Paket wählen| App[Laravel App]
+    App -->|CheckoutSession anlegen| DB[(DB: checkout_sessions,\n tenant_packages)]
+    App -->|Redirect| Paddle[Paddle Checkout]
+
+    Paddle -->|Zahlung erfolgreich| Webhook[Paddle Webhook Endpoint]
+    Webhook -->|Event verarbeiten| BillingService[CheckoutWebhookService]
+    BillingService -->|TenantPackage aktualisieren| DB
+
+    DB --> App
+    App --> Tenant
+```
+
--- a/docs/ops/dr-storage-issues.md
+++ b/docs/ops/dr-storage-issues.md
@@ -0,0 +1,74 @@
+---
+title: DR-Playbook – Storage-Probleme (Hot/Archive)
+sidebar_label: DR – Storage
+---
+
+Dieses Playbook beschreibt, wie du vorgehst, wenn es Probleme mit dem Medien‑Storage gibt – z.B. Hot‑Storage voll, Archivierung bleibt hängen oder viele Assets im Status `failed`.
+
+## 1. Symptome & erste Checks
+
+Typische Symptome:
+
+- Gäste können keine Fotos mehr hochladen (Fehlermeldungen im Upload‑Flow).
+- Tenant Admins sehen „fehlende Medien“ oder sehr langsame Galerien.
+- `event_media_assets` enthält viele Einträge mit Status `pending` oder `failed`.
+- Logs enthalten Hinweise auf fehlgeschlagene Archivierungen oder fehlende Dateien.
+
+Erste Checks:
+
+- Storage‑Usage der Hot‑Volumes/Buckets prüfen (Docker‑Volume, S3‑Dashboard o.ä.).
+- `EventMediaAsset`‑Status stichprobenartig prüfen (`hot`, `archived`, `pending`, `failed`).
+- Queue‑Längen und Fehler in `media-storage` und `media-security` via Horizon und Logs.
+
+## 2. Hot-Storage voll oder kurz vor Limit
+
+1. **Warnungen bestätigen**
+   - System‑/Provider‑Warnungen (z.B. 90 % voll) bestätigen.
+   - Prüfen, ob `storage:monitor` oder ähnliche Kommandos bereits Alerts ausgelöst haben.
+2. **Sofortmaßnahmen**
+   - Archivierung priorisieren: sicherstellen, dass `storage:archive-pending` regelmäßig läuft und die `media-storage`‑Queue abgearbeitet wird.
+   - Temporäre Limits erhöhen, falls Provider dies erlaubt (z.B. S3‑Bucket praktisch „unbegrenzt“ vs. lokaler Disk).
+3. **Aufräumen**
+   - Alte Caches/Thumbnails, die problemlos neu generiert werden können, ggf. gezielt löschen.
+   - Keine unüberlegten `rm -rf` Aktionen auf dem Storage – immer mit klarer Strategie arbeiten.
+
+## 3. Archivierung hängt oder schlägt häufig fehl
+
+1. **Queue-Status prüfen**
+   - `media-storage` Queue‑Länge, Failed Jobs in Horizon prüfen.
+   - Log‑Channel `storage-jobs` nach Fehlermeldungen durchsuchen.
+2. **Fehlerbilder auswerten**
+   - Typische Ursachen:
+     - Netzwerk‑/Credential‑Probleme beim Zugriff auf den Archiv‑Bucket.
+     - Zeitüberschreitungen bei sehr großen Medien.
+     - Inkonsistente `EventMediaAsset`‑Einträge (Pfad nicht mehr vorhanden, falscher Disk‑Key).
+3. **Abhilfe**
+   - Netzwerk/Credentials fixen (z.B. S3‑Keys, Endpoints, Rechte).
+   - Problematische Assets gezielt in den Logs identifizieren und manuell nachziehen (Kopie auf Archive‑Disk, Status auf `archived` setzen, Fehler‑Feld leeren).
+   - Wenn viele Assets betroffen sind, lieber ein dediziertes Skript/Job bauen als ad‑hoc SQL.
+
+## 4. Fehlende oder beschädigte Medien-Dateien
+
+Wenn `EventMediaAsset`‑Einträge existieren, die zu nicht mehr vorhandenen Dateien zeigen:
+
+1. **Umfang ermitteln**
+   - Stichproben auf Basis der Fehlerlogs oder per Batch‑Check (z.B. ein Artisan‑Command, das `exists()` prüft).
+2. **Backup-Sicht**
+   - Prüfen, ob die Dateien noch im Backup vorhanden sind (Hot‑/Archive‑Backups).
+3. **Wiederherstellung**
+   - Fehlende Dateien an den erwarteten Pfad im Storage kopieren (Hot oder Archive).
+   - `EventMediaAsset`‑Status und Timestamps ggf. aktualisieren (`hot` vs. `archived`).
+
+Wenn keine Backups existieren, bleibt nur, die betroffenen Assets sauber als „nicht mehr verfügbar“ zu kennzeichnen und die Nutzer entsprechend zu informieren.
+
+## 5. Nach einem Storage-Incident
+
+- **Monitoring schärfen**
+  - Schwellwerte in `storage-monitor` anpassen (Warnung/Kritisch), Alerts für Queues/Storage erweitern.
+- **Kapazitätsplanung**
+  - Erkenntnisse über Medienwachstum nutzen, um frühzeitig auf größere Volumes/Buckets oder häufigere Archivierung umzusteigen.
+- **Dokumentation**
+  - Incident und Maßnahmen in `docs/process/changes/*` dokumentieren.
+  - Dieses Playbook aktualisieren, wenn neue Muster entdeckt wurden.
+
+Dieses Playbook ist eng mit `docs/ops/media-storage-spec.md` und `docs/ops/monitoring-observability.md` verknüpft. Nutze diese Dokumente für Detailinformationen zu Queues, Thresholds und Storage‑Targets.
--- a/docs/ops/dr-tenant-event-restore.md
+++ b/docs/ops/dr-tenant-event-restore.md
@@ -0,0 +1,97 @@
+---
+title: DR-Playbook – Tenant/Event versehentlich gelöscht
+sidebar_label: DR – Tenant/Event
+---
+
+Dieses Playbook beschreibt, wie du vorgehst, wenn ein Tenant oder Event versehentlich gelöscht oder stark beschädigt wurde. Es baut auf den allgemeinen Hinweisen aus `docs/ops/backup-restore.md` auf.
+
+> Wichtig: Diese Schritte sollten zuerst in einer **Staging-Umgebung** geübt werden. In Produktion nur nach klarer Freigabe und mit sauberer Dokumentation anwenden.
+
+## 1. Schadensbild erfassen
+
+Bevor du irgendetwas wiederherstellst:
+
+- **Was genau ist betroffen?**
+  - Nur ein Event (z.B. versehentlich im Admin archiviert/gelöscht)?
+  - Mehrere Events eines Tenants?
+  - Der komplette Tenant (inkl. Benutzer, Events, Pakete)?
+- **Welche Daten fehlen/fehlerhaft?**
+  - Fehlen nur Metadaten (Events, Fotos, Pakete) oder auch Medien‑Dateien?
+  - Gibt es noch Spuren im Admin/UI (z.B. leere Übersichten, aber Logs mit Fehlermeldungen)?
+- **Zeitfenster eingrenzen**
+  - Wann wurde der Fehler bemerkt?
+  - Wann war der Zustand sicher noch korrekt (z.B. vor letztem Deploy / gestern Abend)?
+
+Diese Informationen bestimmen, welches Backup verwendet werden sollte.
+
+## 2. Logische vs. physische Schäden unterscheiden
+
+- **Logischer Schaden**
+  - Falsche Flags (Status falsch, Event „archiviert“ statt „aktiv“).
+  - Inkompatible Paket‑Zuweisungen, aber Daten sind noch vorhanden.
+  - Lösbare Fälle oft ohne Restore durch gezielte Updates / Admin‑UI.
+- **Physischer Schaden**
+  - Reihen in Kern‑Tabellen gelöscht (z.B. `events`, `photos`, `event_media_assets`, `tenants`).
+  - Medien‑Dateien im Storage gelöscht/überschrieben.
+
+Nur bei physischen Schäden ist ein Restore aus Backup nötig. Logische Schäden sollten möglichst mit minimalinvasiven Korrekturen behoben werden.
+
+## 3. Vorgehen bei einzelnen Events
+
+### 3.1 Datenbank – Event-Datensätze identifizieren
+
+1. **Event-IDs ermitteln**
+   - Aus Logs, alten Links, Metriken oder Backups.
+2. **Querverweise prüfen**
+   - `events` (Basisdaten), `photos`, `event_media_assets`, `event_packages`, ggf. `event_join_tokens`.
+3. **Temporäre Restore-DB nutzen**
+   - Erzeuge eine temporäre Datenbank (z.B. `fotospiel_restore`) und spiele den relevanten Backup‑Dump ein.
+   - Dort die betroffenen Event‑Datensätze suchen.
+
+### 3.2 Selektiver Restore von Event-Daten
+
+Empfohlenes Muster:
+
+- In **Restore-DB**:
+  - Exportiere alle relevanten Zeilen für das Event (z.B. `events`, `photos`, `event_media_assets`) in SQL/CSV.
+- In **Produktions-DB**:
+  - Prüfe, ob IDs kollidieren (z.B. neue Events seit dem Backup).
+  - Freie IDs und referentielle Integrität beachten; wenn IDs bereits vergeben sind, ist ein reiner Import meist nicht möglich → dann manuelle Rekonstruktion (neues Event + Medien erneut verknüpfen).
+
+> Dieses Playbook beschreibt bewusst kein generisches „SQL-Skript“, weil die tatsächliche Struktur und IDs von der aktuellen Migration abhängen. Ziel ist, die **Vorgehensweise** zu standardisieren, nicht ein unüberlegtes Massen‑Update.
+
+### 3.3 Medien-Dateien
+
+1. In der Restore‑Umgebung prüfen, welche Pfade `event_media_assets` für das Event referenzieren.
+2. Im Backup‑Storage nach diesen Pfaden suchen (Hot‑ und ggf. Archiv‑Bucket).
+3. Fehlende Dateien in das produktive Storage‑Volume/Bucket an den erwarteten Pfad kopieren.
+
+Wenn die Medien physisch nicht mehr vorhanden sind, ist nur eine teilweise Rekonstruktion möglich (z.B. Thumbnails ohne Originale) – das sollte mit dem Tenant klar kommuniziert werden.
+
+## 4. Vorgehen bei Tenant-weiten Fehlern
+
+Wenn ein kompletter Tenant versehentlich gelöscht wurde (inkl. Benutzer/Events):
+
+1. **Einordnung**
+   - Handelt es sich um einen isolierten Tenant oder könnten mehrere betroffen sein (z.B. durch fehlerhaftes Skript)?
+2. **Restore-Strategie wählen**
+   - _Variante A: Partial Restore_ – nur die Tabellenzeilen zum Tenant aus der Backup‑DB in die Produktions‑DB zurückführen.
+   - _Variante B: Backup-Spiegel_ – Tenant + zugehörige Medien in eine separate Umgebung wiederherstellen und dem Kunden dort einen temporären Zugang geben.
+3. **Risikoabwägung**
+   - Partial Restore in eine laufende Produktions‑DB trägt höhere Risiken (Kollisionsgefahr mit neuen Daten).
+   - Spiegel‑Variante ist operativ aufwändiger, kann aber sicherer sein, wenn viele neue Daten seit dem Backup hinzugekommen sind.
+
+> Welche Variante gewählt wird, sollte von Platform‑Ops + Produkt gemeinsam entschieden werden.
+
+## 5. Kommunikation & Dokumentation
+
+- **Mit dem betroffenen Tenant**
+  - Ehrlich kommunizieren, was passiert ist, was wiederherstellbar ist und welches Risiko ein Restore birgt.
+  - Zeitrahmen und mögliche Einschränkungen klar benennen.
+- **Intern**
+  - Den gesamten Prozess in einem `docs/process/changes/*`‑Eintrag oder im Ticketing festhalten:
+    - Was, wann, warum schief ging.
+    - Welche Restore‑Schritte durchgeführt wurden.
+    - Welche Verbesserungen künftig notwendig sind (z.B. bessere Schutzmechanismen, zusätzliche Bestätigungen beim Löschen).
+
+Dieses Playbook ist bewusst höher‑levelig gehalten; spezifische SQL‑ oder Tool‑Snippets sollten ergänzend in einem internen Notizsystem oder als separate Anhänge gepflegt werden, sobald eure Backup‑Pipelines stabil etabliert sind.
--- a/docs/ops/guest-notification-ops.md
+++ b/docs/ops/guest-notification-ops.md
@@ -22,7 +22,7 @@ This runbook explains how to keep the guest notification centre healthy, roll ou
 Push deliveries are dispatched on the dedicated `notifications` queue. Ensure one of the queue workers listens to it:

 ```bash
-docs/queue-supervisor/queue-worker.sh default,notifications
+/var/www/html/scripts/queue-worker.sh default,notifications
 ```

 If Horizon is in use just add `notifications` to the list of queues for at least one supervisor. Monitor `storage/logs/notifications.log` (channel `notifications`) for transport failures.
--- a/docs/ops/howto-dsgvo-delete-photo.md
+++ b/docs/ops/howto-dsgvo-delete-photo.md
@@ -0,0 +1,79 @@
+---
+id: howto-dsgvo-delete-photo
+title: How-to – DSGVO-Löschung eines Fotos
+sidebar_label: DSGVO – Foto löschen
+---
+
+Dieses How‑to beschreibt den operativen Ablauf, wenn ein Gast verlangt, dass ein konkretes Foto DSGVO‑konform gelöscht wird.
+
+## 1. Anfrage & Berechtigung prüfen
+
+Bevor du etwas löschst:
+
+- Handelt der Gast über den Veranstalter (Tenant) oder direkt bei Fotospiel?
+- Kann das Foto eindeutig identifiziert werden?
+  - Am besten via Link zur Galerie / Foto‑Detailseite.
+  - Alternativ via Screenshot + Event‑Name + Zeitfenster.
+- Ist der Tenant (Veranstalter) einverstanden?
+  - In der Regel sollte die Entscheidung, ob ein Foto gelöscht wird, beim Tenant liegen, sofern der Vertrag dies vorsieht.
+
+Alle relevanten Informationen und Entscheidungen sollten im Ticket erfasst werden.
+
+## 2. Foto im System identifizieren
+
+1. Über die Admin‑UI:
+   - In der Tenant Admin PWA den betroffenen Event öffnen.
+   - Foto über Moderations‑/Galerieansicht suchen.
+   - ID des Fotos notieren (sofern sichtbar) oder den direkten Admin‑Link verwenden.
+2. Falls nötig, über DB/Logs:
+   - Anhand von Dateinamen/URLs aus Logs (`event_media_assets.path`, `photos.thumbnail_path`) das Foto lokalisieren.
+
+## 3. Löschung über Admin-UI (präferiert)
+
+Wenn die Admin‑Oberfläche eine Delete/Hide‑Funktion bietet:
+
+1. Tenant Admin das Foto über das Moderationsinterface löschen lassen.
+2. Sicherstellen, dass:
+   - Foto nicht mehr in Galerie/Moderationslisten erscheint.
+   - Share‑Links oder öffentliche Galerien das Foto nicht mehr anzeigen.
+3. Falls es trotzdem noch angezeigt wird:
+   - Caches prüfen (Browser, CDN, ggf. Thumbnail‑Caches).
+
+## 4. Technischer Löschpfad (Backend)
+
+Falls eine UI‑Löschung nicht ausreicht oder du nachkontrollieren willst:
+
+1. **Datenbank**
+   - `photos`:
+     - Prüfen, dass der Eintrag für das Foto gelöscht oder hinreichend anonymisiert wurde.
+   - `event_media_assets`:
+     - Alle Einträge, die auf dieses Foto (`photo_id`) zeigen, identifizieren.
+     - Pfade (`disk`, `path`) notieren.
+2. **Storage**
+   - Für alle relevanten `EventMediaAsset`‑Einträge:
+     - Dateien im Hot‑/Archive‑Storage löschen (Original + Derivate/Thumbnails).
+3. **Verknüpfungen**
+   - Sicherstellen, dass keine weiteren Verweise existieren:
+     - Likes/Statistiken für dieses Foto (z.B. `photo_likes`) – optional mit entfernen, sofern vorhanden.
+
+> Hinweis: Wenn ihr `AccountAnonymizer` auf Tenant‑/User‑Ebene verwendet, löscht dieser im Regelfall großflächig Medien. Für Einzelfälle (ein Foto) ist der oben skizzierte Weg geeigneter.
+
+## 5. Dokumentation & Bestätigung
+
+- Im Ticket festhalten:
+  - Welches Foto (Event, ID/URL).
+  - Wer die Löschung veranlasst und genehmigt hat.
+  - Welche Schritte tatsächlich durchgeführt wurden (UI, DB, Storage).
+- Tenant/Gast informieren:
+  - Bestätigung, dass das Foto aus Galerie und Speicher entfernt wurde.
+  - Hinweis, dass ggf. Browser‑/CDN‑Caches eine kurze Zeit nachlaufen können, aber keine neuen Zugriffe mehr möglich sind.
+
+## 6. Präventive Verbesserungen
+
+Wenn dieser Vorgang häufig vorkommt:
+
+- Prüfen, ob die Admin‑UI einen klareren, selbstbedienbaren Weg zur Foto‑Löschung bietet.
+- Sicherstellen, dass die Dokumentation für Tenant Admins (siehe Help‑Center) erklärt, wie sie Fotos eigenständig löschen und wie sich das auf Gäste auswirkt.
+
+Dieses How‑to ergänzt `docs/ops/compliance-dsgvo-ops.md` um einen konkreten Einzelfall. Für komplexere Anonymisierungs‑Szenarien siehe den Abschnitt zum `AccountAnonymizer`.
+
--- a/docs/ops/howto-guest-upload-failing.md
+++ b/docs/ops/howto-guest-upload-failing.md
@@ -0,0 +1,83 @@
+---
+id: howto-guest-upload-failing
+title: How-to – Gäste können nicht hochladen
+sidebar_label: Gäste können nicht hochladen
+---
+
+Dieses How‑to beschreibt, wie du vorgehst, wenn Gäste melden, dass sie keine Fotos mehr hochladen können (Fehler im Upload‑Flow oder „hängenbleibende“ Uploads).
+
+## 1. Problem eingrenzen
+
+Fragen an den Tenant/Support:
+
+- Betrifft es **alle** Gäste oder nur einzelne?
+- Betrifft es **alle** Events oder nur ein bestimmtes Event?
+- Welche Fehlermeldung erscheint im Guest‑Frontend (so genau wie möglich, gerne mit Screenshot)?
+- Seit wann tritt das Problem auf? (Zeitfenster)
+
+Diese Informationen bestimmen, ob du in Richtung API/Rate‑Limit, Storage/Queues oder Event‑Konfiguration schauen musst.
+
+## 2. Basischecks – API & App
+
+1. **Public-API Status**
+   - Teste manuell einen Upload gegen ein Test‑Event oder reproduziere das Problem mit dem betroffenen Join‑Token.
+   - Achte auf HTTP‑Statuscodes im Browser‑Network‑Tab (4xx vs. 5xx).
+2. **App- / Deployment-Status**
+   - Prüfe in Docker/Dokploy, ob App/Queue/Redis/DB‑Container gesund sind.
+   - Schaue in `storage/logs/laravel.log` nach offensichtlichen Exceptions rund um das gemeldete Zeitfenster.
+
+Wenn die Public‑API generell 5xx liefert, greift eher das Public‑API‑Incident‑Playbook (`docs/ops/deployment/public-api-incident-playbook.md`).
+
+## 3. Queues & Upload-Health
+
+Wenn das Problem hauptsächlich Uploads betrifft (andere Funktionen laufen):
+
+1. **Queue-Längen prüfen**
+   - In Horizon:
+     - `media-storage`, `media-security` und ggf. `notifications` Queue‑Längen ansehen.
+   - In Logs:
+     - Warnungen aus `storage:check-upload-queues` oder `storage-jobs` suchen.
+2. **Upload-Health-Command**
+   - Sicherstellen, dass `storage:check-upload-queues` regelmäßig läuft (Cron / Scheduler).
+   - Manuell ausführen (in der App‑Container‑Shell):
+     ```bash
+     php artisan storage:check-upload-queues
+     ```
+   - Ausgaben/Logs prüfen:
+     - Meldungen zu „stalled“ Uploads, Events mit dauerhaft vielen Pending‑Assets.
+
+## 4. Storage & Limit-Probleme
+
+1. **Hot-Storage-Füllstand**
+   - Prüfen, ob das Storage‑Volume/Bucket nahe an 100 % ist (siehe `docs/ops/dr-storage-issues.md`).
+   - Wenn ja:
+     - Archivierung beschleunigen (`storage:archive-pending` verifizieren).
+     - Kurzfristig Speicher vergrößern oder Caches aufräumen.
+2. **Paket-/Limit-Prüfungen**
+   - Wenn nur bestimmte Events betroffen sind:
+     - Paket‑Limits des Events prüfen (z.B. max_photos/max_guests).
+     - Event‑Status (abgelaufen/archiviert?) prüfen.
+   - Logs können Fehlercodes liefern wie „photo_limit_exceeded“ – diese deuten auf bewusst ausgelöste Limit‑Sperren hin, nicht auf technische Fehler.
+
+## 5. Typische Muster & Gegenmaßnahmen
+
+- **Hohe Fehlerrate beim Upload (5xx)**
+  - Hinweis auf API‑/Backend‑Problem:
+    - Siehe Public‑API‑Runbook und App‑Logs (Datenbank‑/Redis‑Fehler, Timeouts).
+- **Uploads bleiben „ewig“ auf „wird verarbeitet“**
+  - Queues laufen nicht oder `media-storage`/`media-security` steckt fest:
+    - Horizon prüfen, ob Worker‑Container laufen.
+    - Ggf. Worker neu starten und Failed Jobs analysieren.
+- **Nur ein Event betroffen, andere funktionieren**
+  - Meist Limit‑ oder Konfig‑Thema (Paket voll, Galerie abgelaufen, Event deaktiviert).
+  - Tenant‑Admin‑UI prüfen: Event‑Status, Paket‑Status, Data Lifecycle Einstellungen.
+
+## 6. Kommunikation
+
+- **An Tenant/Support zurückmelden**:
+  - Was war die Ursache? (z.B. Paket‑Limit, temporäre Überlastung, Storage‑Knappheit).
+  - Was wurde getan? (z.B. Paket angepasst, Queues neu gestartet, Storage erweitert).
+  - Ob und wie der Tenant/gäste weiteres tun müssen (z.B. Seite neu laden, später erneut probieren).
+
+Für tiefere Ursachen rund um Storage siehe `docs/ops/media-storage-spec.md` und `docs/ops/dr-storage-issues.md`.
+
--- a/docs/ops/howto-photobooth-no-photos.md
+++ b/docs/ops/howto-photobooth-no-photos.md
@@ -0,0 +1,87 @@
+---
+id: howto-photobooth-no-photos
+title: How-to – Photobooth lädt keine Fotos
+sidebar_label: Photobooth lädt nichts
+---
+
+Dieses How‑to beschreibt, wie du vorgehst, wenn ein Tenant meldet, dass von der Photobooth keine Fotos im Event ankommen.
+
+## 1. Problem eingrenzen
+
+Fragen an den Tenant:
+
+- Welcher Event ist betroffen? (Event‑ID oder Titel).
+- Wird im Tenant‑Admin unter „Fotobox-Uploads“ angezeigt, dass die Photobooth aktiviert ist?
+- Sieht der Photobooth‑Operator offensichtliche Fehler am Gerät (z.B. FTP‑Fehler, Timeout)?
+- Seit wann kommt nichts mehr an? (Zeitfenster)
+
+Diese Infos helfen dir, zwischen Konfigurations‑, FTP‑ oder Ingest‑Problem zu unterscheiden.
+
+## 2. Konfiguration im Admin prüfen
+
+1. Im Tenant-Admin:
+   - Den betroffenen Event öffnen.
+   - Prüfen, ob die Photobooth‑Funktion für diesen Event aktiviert ist.
+2. Wenn Photobooth deaktiviert ist:
+   - Tenant bitten, sie im UI zu aktivieren (dies triggert die Provisionierung und Credentials).
+   - Danach erneut testen, ob Uploads ankommen.
+
+## 3. FTP-/Control-Service überprüfen
+
+Siehe auch `docs/ops/photobooth/control_service.md` und `docs/ops/photobooth/ops_playbook.md`.
+
+1. **FTP-Erreichbarkeit**
+   - Host/Port aus den Photobooth‑Einstellungen entnehmen.
+   - Testverbindung (z.B. über lokales FTP‑Tool oder `nc`/`telnet`) herstellen:
+     - Port (z.B. 2121) erreichbar?
+2. **Credentials validieren**
+   - Prüfen, ob Username/Passwort im Tenant‑Admin zu den Control‑Service‑Daten passen.
+   - Bei Verdacht auf Fehler:
+     - Im Admin die Zugangsdaten neu generieren lassen.
+     - Tenant/Photobooth‑Team informieren, dass sie die neuen Credentials konfigurieren müssen.
+
+## 4. Ingest-Service & Scheduler prüfen
+
+Die Photobooth legt Dateien zunächst in einem Import‑Pfad ab, der dann vom Ingest‑Service verarbeitet wird.
+
+1. **Import-Verzeichnis prüfen**
+   - Pfad: üblicherweise `storage/app/photobooth/{tenant}/{event}` (siehe `docs/ops/photobooth/README.md`).
+   - In den Logs kontrollieren, ob neue Dateien dort landen.
+2. **Ingest-Command**
+   - Sicherstellen, dass `photobooth:ingest` regelmäßig läuft (Scheduler/Cron):
+     ```bash
+     php artisan photobooth:ingest --max-files=100
+     ```
+   - Optional: für einen konkreten Event:
+     ```bash
+     php artisan photobooth:ingest --event=EVENT_ID --max-files=50 -vv
+     ```
+   - Logs auf Hinweise prüfen:
+     - Fehler beim Lesen der FTP‑Dateien.
+     - Probleme beim Schreiben in den Hot‑Storage.
+3. **Queues**
+   - Verifizieren, dass relevante Queues laufen (falls Ingest Jobs dispatcht).
+
+## 5. Typische Fehlerbilder & Lösungen
+
+- **FTP erreicht, aber Import-Verzeichnis bleibt leer**
+  - Photobooth‑Software schreibt nicht an den erwarteten Pfad → Pfad in der Photobooth‑Konfiguration mit den Angaben aus `PHOTOBOOTH_IMPORT_ROOT` abgleichen.
+  - Evtl. Berechtigungsproblem im FTP‑Container (Perms/Ownership).
+- **Import-Verzeichnis gefüllt, aber nichts im Event**
+  - `photobooth:ingest` läuft nicht oder bricht ab:
+    - Scheduler prüfen (`scheduler`‑Service in Docker/Dokploy).
+    - Kommando manuell ausführen und Fehler analysieren.
+- **Fotos tauchen mit großer Verzögerung auf**
+  - Ingest läuft zu selten (Cron/Intervalle zu groß).
+  - Events haben hohe Medienlast → `--max-files` erhöhen oder Ingest häufiger anstoßen.
+
+## 6. Kommunikation mit dem Tenant
+
+- Sobald Ursache und Fix klar sind:
+  - Tenant informieren, ob es ein Konfig‑, Netzwerk‑ oder Ingest‑Problem war.
+  - Falls nötig, dem Photobooth‑Team neue Credentials/Anweisungen zukommen lassen.
+- Falls einige Dateien irreversibel verloren gegangen sind:
+  - Transparent kommunizieren und ggf. Kulanzlösungen (z.B. Gutschrift) über Finance/Success abstimmen.
+
+Nutze für tiefere Analysen die ausführlicheren Playbooks in `docs/ops/photobooth/ops_playbook.md`.
+
--- a/docs/ops/howto-tenant-full-export.md
+++ b/docs/ops/howto-tenant-full-export.md
@@ -0,0 +1,52 @@
+---
+title: How‑to – Tenant‑Komplett‑Export
+sidebar_label: Tenant-Komplett-Export
+---
+
+Dieses How‑to beschreibt, wie du für einen Tenant kurz vor Vertragsende einen möglichst vollständigen Daten‑Export erstellst.
+
+## 1. Anfrage prüfen
+
+- Schriftliche Anfrage des Tenants (E‑Mail/Ticket).
+- Klarer Scope:
+  - Nur Medien?
+  - Medien + Metadaten (Events, Gäste, Likes)?
+  - Billing‑Nachweise (Rechnungen)?
+
+## 2. Medien‑Export
+
+- Für jeden relevanten Event:
+  - Prüfen, ob alle Upload‑Jobs durch sind (`event_media_assets` ohne `pending`/`failed`).
+  - Archiv‑Export nutzen (sofern vorhanden) oder:
+    - Medien‑Ordner pro Event aus dem Storage exportieren.
+    - Thumbnails optional, Originale Pflicht.
+
+## 3. Metadaten‑Export
+
+- Events, Gäste, Likes, Kommentare nach Bedarf exportieren:
+  - Entweder über bestehende Export‑Funktion (CSV/JSON).
+  - Oder über einen einmaligen, internen Report (z.B. `php artisan make:report`‑ähnlicher Flow, falls vorhanden).
+- Output als ZIP mit klarer Ordnerstruktur:
+  - `media/`
+  - `metadata/events.csv`
+  - `metadata/guests.csv`
+
+## 4. Billing-Unterlagen
+
+- Rechnungen / Zahlungsbelege:
+  - Paddle‑Belege (Links oder PDFs).
+  - Interne Rechnungs‑PDFs (falls generiert).
+
+## 5. Nach dem Export
+
+- Export dem Tenant sicher zur Verfügung stellen (z.B. Download‑Link mit Ablaufdatum).
+- Dokumentieren:
+  - Datum des Exports.
+  - Umfang (welche Tabellen/Events enthalten).
+  - Speicherort und Aufbewahrungsdauer des Export‑Bundles.
+
+Siehe auch:
+
+- `docs/ops/compliance-dsgvo-ops.md`
+- `docs/ops/backup-restore.md`
+
--- a/docs/ops/howto-tenant-package-not-active.md
+++ b/docs/ops/howto-tenant-package-not-active.md
@@ -0,0 +1,95 @@
+---
+id: howto-tenant-package-not-active
+title: How-to – Zahlung erfolgreich, Paket nicht aktiv
+sidebar_label: Zahlung ok, Paket nicht aktiv
+---
+
+Dieses How‑to beschreibt, wie du vorgehst, wenn ein Tenant meldet: „Zahlung war erfolgreich, aber mein Paket ist nicht aktiv / Galerie bleibt limitiert.“
+
+## 1. Informationen vom Tenant einsammeln
+
+Bevor du nachschaust:
+
+- Tenant‑ID oder Tenant‑Slug.
+- Betroffenes Paket (Name oder Beschreibung, z.B. „Pro‑Paket 79 €“).
+- Zeitpunkt der Zahlung (Datum/Uhrzeit, ggf. Screenshot).
+- Ggf. Auszug aus der Paddle‑Bestätigung (ohne vollständige Kartendaten!).
+
+Diese Infos erlauben dir, die korrekte Transaktion sowohl in Paddle als auch im Backend zu finden.
+
+## 2. Paddle-Status prüfen
+
+1. Im Paddle‑Dashboard:
+   - Suche nach E‑Mail, Tenant‑Name oder dem vom Tenant genannten Transaktions‑Identifier.
+   - Stelle sicher, dass die Zahlung dort als „completed“/„paid“ markiert ist.
+2. Notiere:
+   - Paddle‑Transaction‑ID und ggf. Checkout‑ID.
+   - Status (paid/processing/failed/cancelled).
+
+Wenn Paddle die Zahlung nicht als erfolgreich zeigt, ist dies primär ein Finance‑/Customer‑Topic – ggf. mit Customer Support klären, ob eine neue Zahlung oder Klärung mit dem Kunden notwendig ist.
+
+## 3. Backend-Status prüfen
+
+Mit bestätigter Zahlung in Paddle:
+
+1. `checkout_sessions`:
+   - Suche nach Sessions des Tenants (`tenant_id`) mit dem betroffenen `package_id`:
+     - Achte auf `status` (erwartet `completed`) und `provider = paddle`.
+     - Prüfe `provider_metadata` auf `paddle_last_event`, `paddle_status`, `paddle_checkout_id`.
+   - Wenn du die Session über Paddle‑Metadaten finden möchtest:
+     - `paddle_checkout_id` aus dem Webhook/Provider‑Metadata oder `transaction_id` verwenden.
+2. `package_purchases`:
+   - Prüfe, ob ein Eintrag für `(tenant_id, package_id)` mit passender Provider‑Referenz existiert:
+     - z.B. `provider = 'paddle'`, `provider_id` = Transaction‑ID.
+3. `tenant_packages`:
+   - Prüfe, ob es einen aktiven Eintrag für `(tenant_id, package_id)` gibt:
+     - `active = 1`, `expires_at` in der Zukunft.
+
+## 4. Webhook-/Verarbeitungsstatus untersuchen
+
+Wenn `checkout_sessions` noch nicht auf `completed` steht oder `tenant_packages` nicht aktualisiert wurden:
+
+1. Logs prüfen:
+   - `storage/logs/laravel.log` und ggf. `billing`‑Channel.
+   - Suche nach Einträgen von `PaddleWebhookController` / `CheckoutWebhookService` rund um den Zahlungszeitpunkt.
+2. Typische Ursachen:
+   - Webhook nicht zugestellt (Netzwerk/SSL).
+   - Webhook konnte die Session nicht auflösen (`[CheckoutWebhook] Paddle session not resolved`).
+   - Idempotenz‑Lock (`Paddle lock busy`) hat dazu geführt, dass Event nur teilweise verarbeitet wurde.
+
+## 5. Korrektur-Schritte
+
+### 5.1 Automatischer Replay (empfohlen)
+
+1. Im Paddle‑Dashboard:
+   - Den betreffenden `transaction.*`‑Event finden.
+   - Webhook‑Replay auslösen.
+2. In den Logs beobachten:
+   - Ob `CheckoutWebhookService::handlePaddleEvent()` diesmal die Session findet und `CheckoutAssignmentService::finalise()` ausführt.
+3. Nochmal `checkout_sessions` und `tenant_packages` prüfen:
+   - Session sollte auf `completed` stehen, Paket aktiv sein.
+
+### 5.2 Manuelle Korrektur (Notfall)
+
+Nur anwenden, wenn klare Freigabe vorliegt und Paddle die Zahlung eindeutig als erfolgreich listet.
+
+1. `tenant_packages` aktualisieren:
+   - Entweder neuen Eintrag anlegen oder bestehenden für `(tenant_id, package_id)` so setzen, dass:
+     - `active = 1`,
+     - `purchased_at` und `expires_at` zu Paddle‑Daten passen.
+2. `package_purchases` ergänzen:
+   - Sicherstellen, dass die Zahlung als Zeile mit `provider = 'paddle'`, `provider_id = Transaction‑ID` und passender `price` existiert (für spätere Audits).
+3. Konsistenz prüfen:
+   - Admin UI für Tenant öffnen und prüfen, ob Limits/Paketstatus jetzt korrekt angezeigt werden.
+4. Dokumentation:
+   - Den Vorgang im Ticket oder in `docs/process/changes/*` (falls wiederkehrend) dokumentieren.
+
+## 6. Kommunikation mit dem Tenant
+
+- Sobald der Backend‑Status korrigiert ist:
+  - Kurz bestätigen, dass das Paket aktiv ist und welche Auswirkungen das hat (z.B. neue Limits, verlängerte Galerie).
+- Falls Paddle die Zahlung nicht als erfolgreich führt:
+  - Ehrlich kommunizieren, dass laut Zahlungsprovider noch keine endgültige Zahlung vorliegt und welche Optionen es gibt (z.B. neue Zahlung, Klärung mit Bank/Kreditkarte).
+
+Dieses How‑to sollte dem Support/On‑Call helfen, den gängigsten Billing‑Fehlerfall strukturiert abzuarbeiten. Für tiefere Ursachenanalysen siehe `docs/ops/billing-ops.md`.
+
--- a/docs/ops/incidents-major.md
+++ b/docs/ops/incidents-major.md
@@ -0,0 +1,79 @@
+---
+title: Major Incidents & Eskalation
+sidebar_label: Major Incidents
+---
+
+Diese Seite beschreibt, wie du bei größeren Störungen (SEV‑1/SEV‑2) vorgehst. Sie ergänzt die spezifischen Runbooks (Public API, Medien‑Pipeline, Photobooth) um einen einheitlichen Rahmen.
+
+## 1. Incident-Klassifikation
+
+- **SEV‑1 (kritisch)**
+  - Gäste können nicht mehr hochladen ODER keine Events/Galerien mehr öffnen.
+  - Tenant Admins können sich nicht einloggen oder keine Kernaktionen ausführen (Events verwalten, Medien moderieren).
+  - Datenverlust oder potenzieller Datenverlust (z.B. Löschjob auf falscher Storage‑Ebene).
+- **SEV‑2 (hoch)**
+  - Teilweise Degradation (z.B. Photobooth‑Uploads hängen, Public‑API stark verlangsamt, eine Region betroffen).
+  - Kritische Background‑Jobs (Archivierung, AV/EXIF‑Scans, Zahlungs‑Webhooks) stauen sich, ohne dass Gäste sofort komplett blockiert sind.
+- **SEV‑3 (mittel)**
+  - Einzelne Features gestört (Notification‑Center, Join‑Token‑Analytics, einzelne Admin‑Views).
+  - Workaround möglich (z.B. manuelle Nacharbeit durch Support).
+
+> Wichtig: Jede Störung, die einen zahlenden Eventkunden am Tag des Events blockiert, sollte mindestens als SEV‑2, ggf. als SEV‑1 eingeordnet werden.
+
+## 2. Erstmaßnahmen (Triage)
+
+1. **Scope bestimmen**
+  - Welche Benutzer sind betroffen? (Alle Gäste, einzelne Tenants, nur Photobooth, nur Admins?)
+  - Betrifft es nur eine Umgebung (staging vs. production)?
+2. **Schnell-Checks**
+   - Status von App, Queue, Redis, DB (Docker/Dokploy‑Übersicht prüfen).
+   - Horizon/Queues: sind relevante Queues leer, wachsend, „stuck“? Gibt es viele Failed Jobs?
+   - Logs für relevante Kanäle: `storage/logs/laravel.log`, spezielle Channels wie `storage-jobs`, `notifications`, `billing`, Nginx/Proxy‑Logs.
+   - Monitoring: externe Uptime‑Checks / Dashboards (z.B. Public‑API Latenz, Error‑Rate).
+3. **Einordnung & Eskalation**
+  - SEV‑1/2: On‑Call informieren (Pager/Chat), Incident‑Kanal im Teamchat eröffnen.
+  - SEV‑3: Im Issue‑Tracker erfassen, ggf. gebündelt mit anderen Findings.
+
+Nutze bei Public‑API‑Problems zusätzlich das `docs/ops/deployment/public-api-incident-playbook.md`.
+
+## 3. Standard-Runbooks nach Bereich
+
+- **Public API / Gast-Zugriff**
+  - Siehe `docs/ops/deployment/public-api-incident-playbook.md`.
+  - Typische Auslöser: Peaks, Abuse, externe Integrationen, Ratenlimits.
+- **Medien-Pipeline / Uploads**
+  - Siehe `docs/ops/media-storage-spec.md` und `docs/ops/guest-notification-ops.md`.
+  - Fälle: Uploads bleiben im Pending, Archivjobs laufen nicht, Speicherkapazität erreicht, Gäste bekommen „Uploads hängen noch…“.
+- **Photobooth**
+  - Siehe `docs/ops/photobooth/ops_playbook.md`.
+  - Fälle: FTP nicht erreichbar, Ingest nicht laufend, falsche Credentials, Security‑Vorfälle.
+- **Abrechnung & Billing**
+  - Siehe `docs/ops/billing-ops.md`.
+  - Fälle: Paddle/RevenueCat‑Webhook‑Fehler, falsche Paket‑Zustände, doppelte/fehlende Buchungen.
+
+Dieses Dokument verweist immer nur auf die jeweils tieferen Runbooks – bei konkreten Problemen gehst du dort in die Details.
+
+## 4. Kommunikation
+
+- **Intern (Team)**
+  - Eröffne einen dedizierten Incident‑Thread im Chat (mit Zeitstempel, SEV‑Level, Kurzbeschreibung).
+  - Halte dort Statusupdates fest (z.B. „17:05 – Upload‑Queue entstaut, weitere Beobachtung 30 min“).
+  - Notiere bewusst Entscheidungen (z.B. „19:10 – Feature X temporär deaktiviert“, „19:25 – Rollback auf vorheriges Release“).
+- **Extern (Kunden)**
+  - Ab SEV‑2: Überlege einen kurzen Statushinweis (Status‑Seite oder manuelle Kommunikation an direkt betroffene Tenants).
+  - Bei Incidents während Events: Koordiniere mit Success/Support, um proaktiv auf Tenant Admins zuzugehen.
+
+> TODO: Falls du eine Status‑Seite oder automatisierte E‑Mails hast, dokumentiere hier, wie und wann sie ausgelöst werden.
+
+## 5. Nachbereitung (Postmortem)
+
+Nach einem SEV‑1/2 Incident:
+
+1. **Fakten sammeln** (Timeline, betroffene Tenants/Events, konkrete Auswirkungen).
+2. **Ursache** (Root Cause) möglichst präzise identifizieren – auch dann, wenn direkt „nur“ Symptome gefixt wurden.
+3. **Kurzfristige Maßnahmen** (Hotfixes, Konfig‑Anpassungen, zusätzliche Checks).
+4. **Langfristige Maßnahmen** – sollten als Epics/Tasks in `docs/process/todo/*` bzw. `docs/process/changes/*` landen (inkl. Link zum Incident).
+5. **Dokumentation aktualisieren**
+  - Relevante Runbooks (dieses Dokument, Public‑API‑Runbook, Storage‑Spec, Billing‑Ops, etc.) mit neuen Learnings ergänzen.
+
+Ziel ist, dass die Time‑to‑Detect und Time‑to‑Resolve für ähnliche Probleme in Zukunft sinkt.
--- a/docs/ops/media-storage-spec.md
+++ b/docs/ops/media-storage-spec.md
@@ -33,7 +33,7 @@ This document explains how customer photo uploads move through the Fotospiel pla
 | Component | Role |
 | --- | --- |
 | `app` (Laravel FPM) | Accepts uploads, writes to the hot disk, and records metadata. |
-| `media-storage-worker` | Runs `/docs/queue-supervisor/queue-worker.sh media-storage`; consumes archival/restoration jobs and copies data between disks. Shares the same `app-code` volume so it sees `/var/www/html/storage`. |
+| `media-storage-worker` | Runs `/scripts/queue-worker.sh media-storage`; consumes archival/restoration jobs and copies data between disks. Shares the same `app-code` volume so it sees `/var/www/html/storage`. |
 | `queue` workers | Default queue consumers for non-storage background jobs. |
 | `media-security-worker` | Processes `ProcessPhotoSecurityScan` jobs (antivirus + EXIF scrub). |
 | `scheduler` | Runs `php artisan schedule:work`, triggering `storage:archive-pending`, `storage:monitor`, queue health checks, etc. |
@@ -92,7 +92,7 @@ This document explains how customer photo uploads move through the Fotospiel pla
 ## Related Documentation

 - `docs/prp/10-storage-media-pipeline.md` — canonical architecture diagram for storage tiers.
- `docs/ops/queue-workers.md` — how to run `media-storage` and `media-security` workers (scripts in `/docs/queue-supervisor/`).
+- `docs/ops/queue-workers.md` — how to run `media-storage` and `media-security` workers (scripts live in `/scripts/`).
 - `docs/ops/deployment/docker.md` / `docs/ops/deployment/dokploy.md` — container topology and volumes.
 - `config/security.php`, `config/storage-monitor.php`, and `config/filesystems.php` for runtime knobs.

--- a/docs/ops/monitoring-observability.md
+++ b/docs/ops/monitoring-observability.md
@@ -0,0 +1,146 @@
+---
+title: Monitoring & Observability
+sidebar_label: Monitoring
+---
+
+Dieses Dokument sammelt die wichtigsten Monitoring‑Punkte der Plattform und soll helfen, die richtigen Dashboards und Alerts aufzubauen.
+
+## 1. Was sollte überwacht werden?
+
+- **Verfügbarkeit**
+  - HTTP‑Checks auf zentrale Endpunkte (Landing, Join‑Token‑Flows, Guest Upload, Tenant Admin Login).
+  - Public‑API‑Checks (`/api/v1/events/{token}`, Galerie, Upload‑Endpoints).
+- **Queues**
+  - Länge und Durchsatz der Queues `default`, `media-storage`, `media-security`, `notifications`.
+  - Age/Time‑in‑Queue, Anzahl der Failed Jobs.
+- **Storage**
+  - Füllstand der Hot‑Storage‑Volumes/Buckets.
+  - Anzahlen/Status in `event_media_assets` (z.B. viele `pending` oder `failed`).
+- **Fehler-Raten**
+  - HTTP 5xx/4xx spitzenweise, gruppiert nach Route/Service.
+  - Applikations‑Logs mit Error/Warning‑Level.
+- **Billing & Webhooks**
+  - Fehlgeschlagene Paddle/RevenueCat‑Webhooks.
+  - Differenz zwischen erwarteten und verarbeiteten Zahlungen (optional).
+
+## 2. Werkzeuge & Quellen
+
+- **Horizon**
+  - Live‑Überblick über Laravel‑Queues.
+  - Alerts, wenn eine Queue zu lange Backlog aufbaut.
+- **Docker/Dokploy**
+  - Container‑Health (Restart‑Loops, Ressourcennutzung).
+  - Service‑Healthchecks.
+- **Logs**
+  - Laravel‑Logs (`storage/logs/*.log`), ggf. via Promtail/Loki oder ELK zentralisiert.
+  - Spezifische Channels (z.B. `storage-jobs`, `notifications`, `billing`).
+- **Metriken**
+  - Falls vorhanden: Prometheus/Grafana‑Dashboards für App‑/DB‑/Redis‑Metriken.
+
+> TODO: Wenn konkrete Dashboards in Grafana o.Ä. existieren, füge hier Screenshots/Links und eine kurze Erklärung der Panels ein.
+
+## 3. Alarmierung & Schwellenwerte
+
+Konkrete Schwellenwerte hängen von Traffic und Infrastruktur ab, aber folgende Muster haben sich bewährt:
+
+- **Queues**
+  - `default`:
+    - Warnung: > 100 Jobs oder ältester Job > 5 Minuten.
+    - Kritisch: > 300 Jobs oder ältester Job > 15 Minuten.
+  - `media-storage`:
+    - Warnung: > 200 Jobs oder ältester Job > 10 Minuten.
+    - Kritisch: > 500 Jobs oder ältester Job > 30 Minuten.
+  - `media-security`:
+    - Warnung: > 50 Jobs oder ältester Job > 5 Minuten.
+    - Kritisch: > 150 Jobs oder ältester Job > 15 Minuten.
+  - `notifications`:
+    - Warnung: > 100 Jobs dauerhaft im Backlog.
+    - Kritisch: wenn die Queue dauerhaft wächst, während Events live laufen.
+- **Uploads**
+  - Fehlerquote bei Upload‑Endpoints:
+    - Warnung: 2–5 % Fehler (HTTP 4xx/5xx) über 5‑minütiges Fenster.
+    - Kritisch: > 5–10 % Fehler in 5 Minuten.
+  - Anzahl „hängender“ Uploads:
+    - Warnung, wenn `storage:check-upload-queues` für denselben Event wiederholt Alarm schlägt (z.B. mehr als 5 benachrichtigte Events in 10 Minuten).
+- **Public API**
+  - Latenz für `GET /api/v1/events/{token}` und `/photos`:
+    - Warnung: P95 > 500 ms über 5 Minuten.
+    - Kritisch: P95 > 1–2 s über 5 Minuten.
+  - Fehlerraten für diese Endpoints:
+    - Warnung: > 2 % 5xx über 5 Minuten.
+    - Kritisch: > 5 % 5xx über 5 Minuten.
+- **Billing**
+  - Failed Webhooks:
+    - Warnung: mehr als N (z.B. 5–10) fehlgeschlagene Webhooks pro 10 Minuten.
+    - Kritisch: schneller Anstieg oder > 20 % Fehleranteil.
+  - Differenz zwischen erwarteten und verarbeiteten Zahlungen:
+    - Regelmäßige Reports (z.B. täglich) statt harter Alerts, aber auffällige Abweichungen sollten ein Incident auslösen.
+
+## 4. Betriebliche Nutzung
+
+- **Daily Checks**
+  - Horizon Queue‑Dashboard kurz prüfen.
+  - Logs auf neue Fehler‑/Warnmuster scannen.
+- **Bei Incidents**
+  - Monitoring‑Daten helfen, Ursache und zeitlichen Verlauf zu rekonstruieren (siehe `docs/ops/incidents-major.md`).
+
+## 5. Zusammenspiel mit bestehenden Kommandos
+
+Einige Artisan‑Kommandos sind explizit für Monitoring/Health gedacht. Sie sollten in Cron/Scheduler oder externe Checks integriert werden:
+
+- `storage:monitor` (falls vorhanden)
+  - Aggregiert Storage‑Auslastung und Queue‑Health basierend auf `config/storage-monitor.php`.
+  - Kann Alerts per Mail/Log triggern, wenn Schwellwerte überschritten werden.
+- `storage:check-upload-queues`
+  - Überprüft, ob Upload‑bezogene Queues im erwarteten Rahmen liegen und triggert Gast‑Alerts bei Problemen (siehe `docs/ops/guest-notification-ops.md`).
+- `storage:archive-pending`
+  - Kein klassisches Monitoring‑Kommando, aber relevant, um zu prüfen, ob Archivierungsjobs hinterherhinken (z.B. viele alte `hot`‑Assets).
+
+Diese Kommandos sind kein Ersatz für echtes Monitoring, liefern aber wertvolle Signale, die in Dashboards und Alerts einfließen können.
+
+## 6. Beispiele für Metrik- und Alert-Definitionen
+
+Nachfolgend beispielhafte Formulierungen, wie Alerts unabhängig vom verwendeten Monitoring‑System aussehen könnten.
+
+### 6.1 Queue-Backlog Alert (Pseudocode)
+
+**Ziel**: Meldung, wenn `media-storage` zu lange Backlog aufbaut.
+
+- Bedingung:
+  - `queue_length("media-storage") > 500` **OR**
+  - `oldest_job_age("media-storage") > 30min`
+- Dauer:
+  - 2 aufeinanderfolgende Messintervalle (z.B. 2×5 Minuten).
+- Aktion:
+  - Alarm an On‑Call + Hinweis auf `docs/ops/media-storage-spec.md` und `docs/ops/dr-storage-issues.md`.
+
+### 6.2 Upload-Error-Rate Alert
+
+**Ziel**: Upload‑Probleme für Gäste früh erkennen.
+
+- Bedingung:
+  - Anteil `5xx` oder „applikationsspezifische Fehlercodes“ bei `POST /api/v1/events/*/upload` > 5 % in 5 Minuten.
+- Aktion:
+  - Alarm an On‑Call, Link zum Public‑API‑Incident‑Playbook und Storage‑Runbook.
+
+### 6.3 Public-API-Latenz Alert
+
+**Ziel**: Langsame Galerien / Token‑Aufrufe frühzeitig sehen.
+
+- Bedingung:
+  - `P95(latency(GET /api/v1/events/*)) > 1000ms` über 5 Minuten.
+- Aktion:
+  - Alarm an On‑Call, eventuell automatische Skalierung oder Untersuchung (DB/Redis‑Last).
+
+### 6.4 Billing-Webhook Alert
+
+**Ziel**: Fehler bei Paddle/RevenueCat‑Webhook‑Verarbeitung erkennen.
+
+- Bedingung:
+  - Mehr als 10 fehlgeschlagene Webhook‑Verarbeitungen innerhalb von 10 Minuten, oder Verhältnis `failed/success` > 0,2.
+- Aktion:
+  - Alarm an On‑Call + Finance/Billing‑Verantwortliche, Verweis auf `docs/ops/billing-ops.md`.
+
+Diese Beispiele sollen helfen, konkrete Regeln in eurem Monitoring‑Tool zu definieren. Die genauen Zahlen sollten anhand realer Traffic‑Muster feinjustiert werden.
+
+Dieses Dokument ist bewusst technologie‑agnostisch formuliert – die konkrete Implementierung (Prometheus, Grafana, Loki, ELK, SaaS‑Monitoring) sollte hier nachgezogen und mit Beispielen ergänzt werden.
--- a/docs/ops/oncall-cheatsheet.md
+++ b/docs/ops/oncall-cheatsheet.md
@@ -0,0 +1,48 @@
+---
+title: On‑Call Cheat Sheet
+sidebar_label: On‑Call Spickzettel
+---
+
+Dieser Spickzettel ist für On‑Call‑Personen gedacht, die im Incident schnell handeln müssen. Er konzentriert sich bewusst auf die wichtigsten Kommandos, Dashboards und Checks.
+
+## 1. Top‑10 Kommandos
+
+- App‑Container Logs (Laravel / Horizon):
+  - `docker compose logs -f app`
+  - `docker compose logs -f horizon`
+- Queue‑Status:
+  - `php artisan queue:failed`
+  - `php artisan horizon:status`
+- Storage‑Health:
+  - `php artisan storage:monitor`
+  - `php artisan storage:check-upload-queues`
+- Datenbank‑Checks (Beispiele):
+  - `php artisan tinker` → gezielte Queries zu `events`, `event_media_assets`, `checkout_sessions`.
+
+## 2. Erstdiagnose bei „Nichts geht mehr“
+
+- Statusseite / Monitoring prüfen (HTTP‑Status, Fehler‑Rate, Queue‑Länge).
+- `docker compose ps` → welche Services sind „unhealthy“ oder down?
+- Logs der auffälligen Services anschauen (App, Queue, DB, Nginx).
+- Kurz festhalten:
+  - Wann trat das Problem auf?
+  - Betrifft es **alle** Tenants oder einzelne?
+  - Nur Guest‑PWA, nur Tenant‑Admin oder beides?
+
+## 3. Wichtigste Dashboards (Beispiele)
+
+- API‑Fehler‑Rate (5xx, 4xx für Public API).
+- Queue‑Backlog (`default`, `media-storage`, `media-security`, `notifications`).
+- Response‑Time Guest‑/Tenant‑PWA.
+- Paddle‑Webhook‑Fehler (falls im Monitoring abgebildet).
+
+> Ergänze hier konkrete Links zu euren Grafana/Datadog‑Dashboards, sobald diese stabil sind.
+
+## 4. Wann eskalieren?
+
+- SEV‑1: Plattform weitgehend nicht nutzbar (> 15 Minuten Ausfall, viele Tenants betroffen).
+- SEV‑2: Kritische Kernfunktion (Uploads, Logins, Zahlungen) länger als 30 Minuten gestört.
+- SEV‑3: Einzelne Tenants oder Funktionen, Workaround vorhanden.
+
+Siehe auch `docs/ops/incidents-major.md` für detaillierte SEV‑Definitionen und Kommunikationsregeln.
+
--- a/docs/ops/oncall-roles.md
+++ b/docs/ops/oncall-roles.md
@@ -0,0 +1,126 @@
+---
+title: Rollen & On-Call-Handbuch
+sidebar_label: Rollen & On-Call
+---
+
+Dieses Dokument beschreibt, **wer** im Betrieb wofür zuständig ist und **wie** On‑Call‑Bereitschaft organisiert wird. Es ergänzt die technischen Runbooks um eine klare Verantwortungsebene.
+
+> Hinweis: Konkrete Namen/Kontaktdaten sollten nicht in Git stehen, sondern getrennt (z.B. in einem internen Adressbuch oder Passwort‑Safe). Dieses Dokument definiert Rollen und Prozesse.
+
+## 1. Rollenübersicht
+
+### 1.1 Platform Ops
+
+- Verantwortlich für:
+  - Infrastruktur (Docker/Dokploy‑Stacks, Netzwerke, TLS, Backups).
+  - Technische Verfügbarkeit der Services (App, Queues, DB, Redis, Storage).
+  - Umsetzung und Pflege der Runbooks unter `docs/ops/`.
+- Typische Aufgaben:
+  - Deployments koordinieren (`docker-compose`, Dokploy, Migrations).
+  - Monitoring/Alerting pflegen (`ops/monitoring-observability.md`).
+  - Incident‑Response bei SEV‑1/SEV‑2 (`ops/incidents-major.md`).
+
+### 1.2 On-Call Engineer
+
+- Rolle, die im wechselnden Turnus (z.B. wöchentlich) On‑Call ist.
+- Verantwortlich für:
+  - Reaktion auf laufende Alerts (Monitoring, Pager, Chat‑Bots).
+  - Erstes Triage nach `ops/incidents-major.md`.
+  - Eskalation an weitere Rollen (z.B. Platform Ops, Produkt, Security).
+- Voraussetzungen:
+  - Zugriff auf Produktions‑Logs, Monitoring‑Dashboards, Dokploy/Horizon.
+  - Vertraut mit den wichtigsten Runbooks (Public‑API, Storage, Photobooth, Billing).
+
+### 1.3 Support / Customer Success
+
+- Verantwortlich für:
+  - Kontakt mit Tenants (E‑Mail/Telefon/Chat).
+  - Übersetzung technischer Probleme in Kundensprache.
+  - Sammeln aller relevanten Informationen, bevor an On‑Call/Platform Ops eskaliert wird.
+- Typische Aufgaben:
+  - Tickets aus dem Help‑System triagieren.
+  - Proaktive Kommunikation bei Events („Wir haben ein Upload‑Problem identifiziert, wir arbeiten daran“).
+
+### 1.4 Produkt / Engineering Leads
+
+- Verantwortlich für:
+  - Entscheidungen bei Feature‑Flags, Rollbacks, Hotfix‑Releases.
+  - Priorisierung langfristiger Maßnahmen nach Incidents (`docs/process/roadmap.md`, `docs/process/todo/*`).
+- Typische Aufgaben:
+  - Teilnahme an Postmortems.
+  - Freigabe von riskanteren Änderungen (z.B. große Migrations).
+
+## 2. On-Call-Modell
+
+### 2.1 Bereitschaftszeiten
+
+Empfohlene Einteilung (anpassbar an dein Team):
+
+- **Bürozeiten (z.B. 09:00–17:00)**  
+  - On‑Call ist die jeweils zuständige Platform‑Ops‑Person des Tages.
+  - Reaktionsziel: 15 Minuten bei SEV‑1/2, 60 Minuten bei SEV‑3.
+- **Außerhalb der Bürozeiten / Event-Spitzen**  
+  - Optional: Rotierender On‑Call‑Dienst mit Rufbereitschaft.  
+  - Reaktionsziel: nach individueller Vereinbarung (z.B. 30–60 Minuten bei SEV‑1).
+
+> Wenn ihr keinen formalen 24/7‑Dienst habt, sollte klar dokumentiert sein, **wann** keine garantierte Reaktionszeit besteht (z.B. nachts/wochenends) und wie das Kunden gegenüber kommuniziert wird.
+
+### 2.2 Rotation & Übergabe
+
+- On‑Call‑Rotation (z.B. wöchentlich) im Teamtool (Kalender/Issue‑Tracker) pflegen.
+- Vor Start einer Schicht:
+  - Offene Incidents und bekannte Problemzonen durchgehen.
+  - Sicherstellen, dass Aufrufwege funktionieren (Chat, Telefon, Pager).
+- Nach Schicht:
+  - Kurze Übergabe an nächste On‑Call‑Person (offene Themen, laufende Beobachtungen).
+
+## 3. Eskalationspfad bei Incidents
+
+### 3.1 Standard-Eskalation (SEV-2/3)
+
+1. On‑Call nimmt Alert entgegen, prüft grob die Lage (`ops/incidents-major.md` → Triage).
+2. Wenn Problem lösbar erscheint:
+   - Runbooks anwenden (z.B. Public‑API‑Playbook, Medien‑Runbook, Photobooth‑Ops).
+   - Kundenkommunikation via Support abstimmen.
+3. Wenn unklar oder größer:
+   - Platform‑Ops bzw. Engineering Lead im Chat markieren.
+   - Incident‑Thread mit Statusupdates führen.
+
+### 3.2 SEV-1 (kritisch)
+
+1. On‑Call ruft sofort **Platform‑Ops** und ggf. **Produkt‑Lead** in den Incident‑Thread.
+2. Falls nötig, mit Produkt die Entscheidung für:
+   - Rollback auf letztes Release,
+   - temporäre Abschaltung einzelner Features (Feature‑Flags),
+   - Aktivierung einer Maintenance‑Seite
+   treffen.
+3. Support/Success informieren betroffene Tenants mit kurzem Status und ETA (auch wenn ETA noch grob ist).
+
+## 4. Tools & Zugänge
+
+Für On‑Call/Platform‑Ops sollten mindestens folgende Zugänge eingerichtet und getestet sein:
+
+- **Dokploy / Docker-Orchestrierung**
+  - Zugriff auf Compose‑Stacks, Logs, Health‑Checks.
+- **Horizon / Queue-Monitoring**
+  - Zugriff auf `/horizon` (nur für SuperAdmins).
+- **Logs**
+  - Zentralisierte Logs (Loki/ELK) oder SSH‑Zugriff zur Maschine mit `storage/logs`.
+- **Monitoring/Alerts**
+  - Zugang zu Uptime‑/Monitoring‑Service (Status‑Dashboard, Alert‑Konfiguration).
+
+> Stelle sicher, dass On‑Call‑Personen ausprobiert haben, ob sie diese Tools tatsächlich erreichen können (VPN, 2FA, etc.), bevor eine Schicht beginnt.
+
+## 5. Verbindung zu den Runbooks
+
+Bei einem Incident sollte die On‑Call‑Person immer vom **Betriebshandbuch** aus denken:
+
+- Einstieg über `docs/ops/operations-manual.md` (Docusaurus‑Startseite).
+- Je nach Symptome:
+  - **API-/Frontend-Probleme** → Public‑API‑Playbook (`ops/deployment/public-api-incident-playbook.md`), ggf. Marketing/Guest‑PWA‑Spezifikationen in `docs/prp/` (in PRP, nicht im Ops‑Bereich).
+  - **Upload/Storage-Probleme** → `ops/media-storage-spec.md`, `ops/guest-notification-ops.md`.
+  - **Photobooth** → `ops/photobooth/ops_playbook.md`.
+  - **Abrechnung** → `ops/billing-ops.md`.
+  - **DSGVO-Fälle** → `ops/compliance-dsgvo-ops.md`.
+
+Dieses Dokument soll nicht alle technischen Details wiederholen, sondern sicherstellen, dass immer klar ist, **wer** reagiert und **welches** Runbook als nächstes geöffnet werden sollte.
--- a/docs/ops/operations-manual.md
+++ b/docs/ops/operations-manual.md
@@ -0,0 +1,131 @@
+---
+title: Betriebshandbuch & Ops-Startseite
+sidebar_label: Betriebshandbuch
+slug: /
+---
+
+Willkommen im Betriebshandbuch von Fotospiel. Dieses Dokument ist der Einstiegspunkt für alle, die die Plattform betreiben: Infrastruktur‑Ops, On‑Call, Support mit erweiterten Rechten und Produkt‑Owner, die Auswirkungen von Änderungen verstehen möchten.
+
+Ziel ist, dass du von hier aus schnell zu den relevanten Runbooks und Referenzen springen kannst.
+
+## 1. Systemübersicht & Verantwortlichkeiten
+
+- **Rollen & Verantwortlichkeiten**
+  - Wer ist für welche Ebene zuständig? (App‑Verfügbarkeit, Infrastruktur, Sicherheit, Abrechnung, Support.)
+  - Empfehlung: definiere mindestens _On‑Call_, _Plattform‑Ops_ und _Support (2nd Level)_ als feste Rollen – diese Seite ist für alle drei.
+- **Systemlandschaft (High‑Level)**
+  - Laravel App + Nginx + Redis + MySQL.
+  - Async‑Pipeline: Queues (`default`, `media-storage`, `media-security`, `notifications`) und Horizon.
+  - Satelliten: Photobooth‑FTP + Control‑Service, Docs‑Site (`/internal-docs`), Monitoring/Dokploy.
+  - Externe Dienste: Paddle (Billing), RevenueCat (Mobile‑Abos), E‑Mail Provider, Logging/Monitoring (Loki/Grafana o.ä.).
+
+> TODO: Ergänze ein Architekturdiagramm aus Sicht des Betriebs (z.B. als PNG oder PlantUML) und verlinke es hier.
+
+## 2. Deployments & Infrastruktur
+
+Diese Kapitel erklären, wie die Plattform in Docker/Dokploy betrieben wird.
+
+- **Docker-Deployment (Compose‑Stack)**
+  - `docs/ops/deployment/docker.md` – Referenz für `docker-compose.yml`, Services, Volumes, Migrations und Scheduler‑Setup.
+- **Dokploy-Deployment (PaaS)**
+  - `docs/ops/deployment/dokploy.md` – Wie die gleichen Services als Dokploy‑Compose‑Stacks betrieben werden, inkl. SuperAdmin‑Integration.
+- **Join-Token-Analytics & Public API**
+  - `docs/ops/deployment/join-token-analytics.md` – Konfiguration der Analytics‑Pfade für Join‑Tokens.
+  - `docs/ops/deployment/public-api-incident-playbook.md` – Runbook für Public‑API‑Störungen (Rate‑Limits, Abuse, Outages).
+- **Lokale Podman/Dev-URLs**
+  - `docs/ops/deployment/lokale-podman-adressen.md` – Übersicht über lokale Services/Ports bei Podman‑Setups.
+
+Fragen zur Infrastruktur (Netzwerk, TLS, DNS, Backups) sollten immer zuerst gegen diese Dokumente geprüft werden.
+
+## 3. Queues, Storage & Medien-Pipeline
+
+Fotos sind das Herz des Produkts – entsprechend wichtig ist ein klarer Blick auf die Medien‑Pipeline.
+
+- **Queues & Worker**
+  - `docs/ops/queue-workers.md` – Wie die Worker‑Container (`queue`, `media-storage-worker`, `media-security-worker`, `notifications`) gestartet, skaliert und überwacht werden.
+- **Media Storage & Archivierung**
+  - `docs/ops/media-storage-spec.md` – Detaillierte Beschreibung, wie Uploads in den „hot“‑Storage laufen, wie `event_media_assets` gepflegt werden und wie Archive‑Jobs funktionieren.
+- **Upload-Gesundheit & Notifications**
+  - `docs/ops/guest-notification-ops.md` – Runbook für das Notification‑Center, Push‑Registrierung und Upload‑Health‑Alerts.
+
+> TODO: Ergänze ein zentrales „Storage & Queues Monitoring“-Kapitel mit konkreten Schwellenwerten und Alarmierung (z.B. Einbindung von Horizon, Redis‑Monitoring, Log-Channels).
+
+## 4. Photobooth-Pipeline
+
+Die Photobooth‑Integration hat eigene Betriebsanforderungen:
+
+- `docs/ops/photobooth/README.md` – Überblick über Photobooth‑Setup und Datenfluss.
+- `docs/ops/photobooth/control_service.md` – Steuer‑API (User‑Provisionierung, Credentials, Rate‑Limits).
+- `docs/ops/photobooth/ops_playbook.md` – Operatives Playbook für Aktivierung, Fehleranalyse und Incident‑Response rund um Photobooth‑Uploads.
+
+> Prüfe vor großen Events mit gebuchten Photobooths diese Playbooks und stelle sicher, dass Volumes, Credentials und Scheduler korrekt konfiguriert sind.
+
+## 5. Störungs- & Incident-Runbooks
+
+Die folgenden Dokumente sind deine erste Anlaufstelle im Incident‑Fall:
+
+- **Major Incidents & Eskalation**
+  - `docs/ops/incidents-major.md` – genereller Rahmen (SEV‑Levels, Triage, Kommunikation, Postmortems) und Verweise auf die spezifischen Runbooks unten.
+- **Public API Störungen**
+  - `docs/ops/deployment/public-api-incident-playbook.md` – Schritt‑für‑Schritt‑Plan bei Missbrauch, Fehlerspitzen oder Ausfällen der öffentlichen APIs.
+- **Upload-/Medien-Probleme**
+  - `docs/ops/media-storage-spec.md` – Referenz, welche Queues/Jobs beteiligt sind und wie man Fehlerzustände erkennt (z.B. lange „pending“-Assets, gescheiterte Archivierung).
+  - `docs/ops/guest-notification-ops.md` – Upload‑Alerts und Gastbenachrichtigungen.
+- **Photobooth-Incidents**
+  - `docs/ops/photobooth/ops_playbook.md` – Vorgehen bei ausfallendem FTP, Ingest‑Fehlern oder Sicherheitsvorfällen (Credentials).
+
+Zusätzlich gibt es kurze „How‑to“-Runbooks für häufige Supportfälle:
+
+- `docs/ops/howto-tenant-package-not-active.md` – Zahlung erfolgreich, Paket nicht aktiv.
+- `docs/ops/howto-guest-upload-failing.md` – Gäste können nicht hochladen.
+- `docs/ops/howto-photobooth-no-photos.md` – Photobooth‑Uploads landen nicht im Event.
+- `docs/ops/howto-dsgvo-delete-photo.md` – DSGVO‑Löschung eines konkreten Fotos.
+
+> TODO: Ergänze ein allgemeines „Major Incident“‑Kapitel (SEV‑1/2 Definition, Kommunikationskanäle, Vorlagen) und verlinke es hier.
+
+## 6. Prozesse, Roadmap & Änderungen
+
+Der Betreiber muss wissen, welche größeren Änderungen anstehen oder kürzlich live gegangen sind.
+
+- **Prozess-Hub**
+  - `docs/process/README.md` – erklärt Struktur von `changes/`, `todo/` und `roadmap.md`.
+- **Roadmap & Epics**
+  - `docs/process/roadmap.md` – Überblick über aktive Epics (z.B. Security Hardening, Paddle‑Migration, Streaming‑Uploads) und kürzlich abgeschlossene Themen.
+  - `docs/process/todo/security-hardening-epic.md` – Security‑Hardening‑Plan mit Bezug zu Ops (Signierte URLs, AV/EXIF, Monitoring‑Workstreams).
+  - Paddle‑Themen: `docs/process/todo/paddle-migration.md`, `docs/process/todo/paddle-catalog-sync.md`.
+- **Changes & Retro-Notizen**
+  - `docs/process/changes/*` – Session‑Notizen, Refactor‑Pläne und Lessons Learned (z.B. Checkout‑Refactor, Registrierung‑Fixes).
+
+Als Betreiber lohnt es sich, bei größeren Deployments kurz in `roadmap.md` und den passenden `changes/*` zu schauen, um Seiteneffekte zu antizipieren.
+
+## 7. Tests, Qualität & Releases
+
+Stabile Releases sind Grundvoraussetzung für ruhigen Betrieb:
+
+- **E2E-Tests & Qualität**
+  - `docs/testing/e2e.md` – beschreibt, welche End‑to‑End‑Tests existieren und wie sie als Smoke‑Suite für Releases verwendet werden können.
+- **Release-Prozess (Entwurf)**
+  - `docs/ops/releases.md` – Checkliste für CI‑Pipelines, Staging‑Deploy, Prod‑Rollout, Smoke‑Tests und Rollback‑Überlegungen.
+
+## 8. Nächste Schritte für das Betriebshandbuch
+
+Die folgenden Kapitel sind als eigenständige Runbooks angelegt und sollten mit der Zeit weiter gefüllt werden:
+
+- **Rollen & On-Call-Handbuch**
+  - `docs/ops/oncall-roles.md` – definiert Platform‑Ops, On‑Call, Support und Produktrollen sowie Eskalationswege.
+- **On-Call Cheat Sheet**
+  - `docs/ops/oncall-cheatsheet.md` – schnelle Übersicht über wichtige Kommandos, Logs und Dashboards für Incidents.
+- **Support & Eskalation**
+  - `docs/ops/support-escalation-guide.md` – beschreibt, welche Informationen Support von Kunden einsammeln sollte, bevor an Ops eskaliert wird.
+- **Backup & Restore / Disaster Recovery**
+  - `docs/ops/backup-restore.md` – Was gesichert werden muss, Restore‑Szenarien und DR‑Übungen.
+- **DSGVO & Compliance-Operationen**
+  - `docs/ops/compliance-dsgvo-ops.md` – Praktische Abläufe für Auskunfts‑/Löschanfragen, Retention und Dokumentation.
+- **Billing & Zahlungs-Operationen**
+  - `docs/ops/billing-ops.md` – Umgang mit Zahlungsproblemen, Webhook‑Fehlern und Paket‑Inkonsistenzen.
+- **Monitoring & Observability**
+  - `docs/ops/monitoring-observability.md` – Welche Signale, Metriken und Alerts es geben sollte.
+- **Architektur-Diagramme**
+  - `docs/ops/diagrams.md` – Mermaid‑Diagramme für Media‑Pipeline und Checkout/Billing‑Flow.
+
+Das Betriebshandbuch bleibt damit ein lebendes Dokument. Neue Runbooks sollten unter `docs/ops/` entstehen und hier verlinkt werden, damit Operatoren einen klaren Einstiegspunkt behalten.
--- a/docs/ops/queue-workers.md
+++ b/docs/ops/queue-workers.md
@@ -1,15 +1,15 @@
 ## Docker Queue & Horizon Setup

-This directory bundles ready-to-use entrypoint scripts and deployment notes for running Fotospiel’s queue workers inside Docker containers. The examples assume you already run the main application in Docker (e.g. via `docker-compose.yml`) and share the same application image for workers. The shell scripts referenced below remain under `/docs/queue-supervisor/` so existing Dockerfile references stay valid.
+This directory bundles ready-to-use entrypoint scripts and deployment notes for running Fotospiel’s queue workers inside Docker containers. The examples assume you already run the main application in Docker (e.g. via `docker-compose.yml`) and share the same application image for workers. Queue entrypoints now live in `/scripts/` inside the container so every service can execute the same shell scripts.

 ### 1. Prepare the application image

 Make sure the worker scripts are copied into the image and marked as executable:

 ```dockerfile
-# Dockerfile
-COPY docs/queue-supervisor /var/www/html/docs/queue-supervisor
-RUN chmod +x /var/www/html/docs/queue-supervisor/*.sh
+# Dockerfile (excerpt)
+COPY scripts /var/www/html/scripts
+RUN chmod +x /var/www/html/scripts/*.sh
 ```

 If you keep the project root mounted as a volume during development the `chmod` step can be skipped because the files will inherit host permissions.
@@ -31,7 +31,7 @@ services:
      QUEUE_TRIES: 3              # optional overrides
      QUEUE_SLEEP: 3
    command: >
-      /var/www/html/docs/queue-supervisor/queue-worker.sh default
+      /var/www/html/scripts/queue-worker.sh default

  media-storage-worker:
    image: fotospiel-app
@@ -44,7 +44,7 @@ services:
      QUEUE_TRIES: 5
      QUEUE_SLEEP: 5
    command: >
-      /var/www/html/docs/queue-supervisor/queue-worker.sh media-storage
+      /var/www/html/scripts/queue-worker.sh media-storage

  media-security-worker:
    image: fotospiel-app
@@ -57,7 +57,7 @@ services:
      QUEUE_TRIES: 3
      QUEUE_SLEEP: 5
    command: >
-      /var/www/html/docs/queue-supervisor/queue-worker.sh media-security
+      /var/www/html/scripts/queue-worker.sh media-security
 ```

 Scale workers by increasing `deploy.replicas` (Swarm) or adding `scale` counts (Compose v2).
@@ -79,7 +79,7 @@ services:
      APP_ENV: ${APP_ENV:-production}
      QUEUE_CONNECTION: redis
    command: >
-      /var/www/html/docs/queue-supervisor/horizon.sh
+      /var/www/html/scripts/horizon.sh
 ```

 Expose Horizon via your web proxy and protect it with authentication (the app already guards `/horizon` behind the super admin panel login if configured).
--- a/docs/ops/releases.md
+++ b/docs/ops/releases.md
@@ -0,0 +1,48 @@
+---
+title: Releases & Deployments
+sidebar_label: Releases & Deployments
+---
+
+Dieses Dokument beschreibt, wie Releases vorbereitet und durchgeführt werden und welche Tests aus Ops‑Sicht Pflicht sind.
+
+## 1. Vor dem Release
+
+- Changelog grob durchsehen (Feature‑/Bugfix‑Umfang verstehen).
+- Datenbank‑Migrations prüfen:
+  - Sind `up`/`down` sauber und idempotent?
+  - Gibt es lange laufende Migrations (Index‑Builds)?
+- Konfig‑Änderungen:
+  - Neue ENV‑Variablen in `dokploy`/Compose hinterlegt?
+  - Secrets über Secret‑Store / Dokploy‑UI konfiguriert?
+
+## 2. Pflicht‑Tests vor Prod‑Deploy
+
+- **PHPUnit**:
+  - `php artisan test` oder mindestens relevante Suites (z.B. „Checkout“, „Storage“).
+- **Frontend‑Build**:
+  - `npm run build` (bzw. CI‑Job).
+- **E2E‑Smoke‑Tests** (siehe `docs/testing/e2e.md`):
+  - Guest‑Flow: Event beitreten, Foto hochladen, Anzeige prüfen.
+  - Tenant‑Flow: Login, Event anlegen, Medienübersicht öffnen.
+
+## 3. Deployment‑Ablauf (Beispiel Dokploy)
+
+- Neues Image wird gebaut und getaggt (z.B. `fotospiel-app:2025-11-20`).
+- Dokploy‑Stack aktualisieren:
+  - App‑Container.
+  - Queue/Horizon‑Container.
+  - Docs‑Container (falls betroffen).
+- Nach dem Deploy:
+  - `php artisan migrate --force`.
+  - Queues prüfen (`horizon:status`, `queue:failed`).
+  - Schnelle Smoke‑Tests in Prod (nur lesende Aktionen oder Test‑Tenant).
+
+## 4. Rollback‑Strategie
+
+- Vor dem Deploy aktuellen Datenbank‑Snapshot sicherstellen.
+- Vorheriges Image‑Tag notieren.
+- Rollback:
+  - Dokploy/Compose auf vorheriges Image zurückdrehen.
+  - Falls Migrations rückwärtskompatibel: ggf. `migrate:rollback`.
+  - Incident‑Eintrag mit Ursache und Lessons Learned ergänzen.
+
--- a/docs/ops/support-escalation-guide.md
+++ b/docs/ops/support-escalation-guide.md
@@ -0,0 +1,50 @@
+---
+title: Support → Ops Eskalationsleitfaden
+sidebar_label: Support-Eskalation
+---
+
+Dieses Dokument beschreibt, welche Informationen der Support einsammeln sollte, bevor ein Ticket an Ops eskaliert wird. Ziel: weniger Ping‑Pong, schnellere Lösung.
+
+## 1. Pflichtinfos pro Ticket
+
+- **Tenant‑ID** bzw. Tenant‑Slug.
+- **Event‑ID** bzw. Event‑Slug.
+- **Zeitstempel** der Beobachtung (lokale Zeit + Zeitzone).
+- **Betroffene User**:
+  - Gast‑Session ID (falls verfügbar).
+  - E‑Mail (für Tenant‑Admins).
+- **Umgebung**:
+  - Browser + Version.
+  - Betriebssystem / Device.
+  - Mobil / Desktop.
+- **Screenshots / Screenrecording**:
+  - Fehlermeldungen.
+  - UI‑Zustand (z.B. Upload hängt bei 90 %).
+
+## 2. Typische Fälle & Zusatzinfos
+
+- **Upload schlägt fehl**
+  - URL des Join‑Links.
+  - Anzahl betroffener Gäste (einige / viele / alle).
+  - Grobe Dateigröße (Handyfoto, stark komprimiert, RAW etc.).
+- **Photobooth‑Fotos fehlen**
+  - Name/Typ der Photobooth.
+  - Zeitpunkt der letzten sichtbaren Fotos.
+  - Ob die Photobooth selbst Fehler anzeigt.
+- **Paket nicht aktiv / Limits falsch**
+  - Bestellnummer / Paddle‑Checkout‑ID (falls vorhanden).
+  - Zeitpunkt der Zahlung.
+  - Welches Paket wurde erwartet?
+
+## 3. Wie an Ops übergeben?
+
+- Ticket im Tracker mit Label „ops“ versehen.
+- Kurzes Summary in ein bis zwei Sätzen:
+  - „Gäste können seit 18:30 Uhr im Event XYZ keine Fotos hochladen. Fehler: ‚Upload fehlgeschlagen‘.“
+- Alle oben genannten Pflichtinfos als strukturierte Liste ergänzen.
+
+Siehe auch:
+
+- `docs/ops/oncall-roles.md`
+- `docs/ops/oncall-cheatsheet.md`
+
--- a/docs/site/docusaurus.config.js
+++ b/docs/site/docusaurus.config.js
@@ -35,7 +35,7 @@ const config = {
          routeBasePath: '/',
          sidebarPath: require.resolve('./sidebars.js'),
          include: ['**/*.md', '**/*.mdx'],
-          exclude: ['site/**', 'archive/**', '**/_drafts/**'],
+          exclude: ['site/**', 'help/**', 'agents/**', 'content/**', 'archive/**', '**/_drafts/**'],
          editUrl: undefined,
          showLastUpdateAuthor: true,
          showLastUpdateTime: true,
--- a/docs/site/sidebars.js
+++ b/docs/site/sidebars.js
@@ -4,7 +4,145 @@

 /** @type {import('@docusaurus/plugin-content-docs').SidebarsConfig} */
 const sidebars = {
-  docsSidebar: [{ type: 'autogenerated', dirName: '.' }],
+  docsSidebar: [
+    // Ops first: Betriebshandbuch + alle Runbooks
+    {
+      type: 'category',
+      label: 'Ops & Betrieb',
+      collapsed: false,
+      items: [
+        {
+          type: 'category',
+          label: 'Grundlagen',
+          collapsed: false,
+          items: [
+            'ops/operations-manual',
+            'ops/oncall-roles',
+            'ops/oncall-cheatsheet',
+            'ops/support-escalation-guide',
+          ],
+        },
+        {
+          type: 'category',
+          label: 'Incidents & DR',
+          items: [
+            'ops/incidents-major',
+            'ops/backup-restore',
+            'ops/dr-tenant-event-restore',
+            'ops/dr-storage-issues',
+          ],
+        },
+        {
+          type: 'category',
+          label: 'Medien & Upload',
+          items: [
+            'ops/media-storage-spec',
+            'ops/guest-notification-ops',
+            'ops/queue-workers',
+            'ops/howto-guest-upload-failing',
+            'ops/howto-photobooth-no-photos',
+          ],
+        },
+        {
+          type: 'category',
+          label: 'Photobooth',
+          items: [
+            'ops/photobooth/README',
+            'ops/photobooth/control_service',
+            'ops/photobooth/ops_playbook',
+          ],
+        },
+        {
+          type: 'category',
+          label: 'Billing',
+          items: [
+            'ops/billing-ops',
+            'ops/howto-tenant-package-not-active',
+          ],
+        },
+        {
+          type: 'category',
+          label: 'DSGVO & Compliance',
+          items: [
+            'ops/compliance-dsgvo-ops',
+            'ops/howto-dsgvo-delete-photo',
+            'ops/howto-tenant-full-export',
+          ],
+        },
+        {
+          type: 'category',
+          label: 'Deployment',
+          items: [
+            'ops/deployment/docker',
+            'ops/deployment/dokploy',
+            'ops/deployment/join-token-analytics',
+            'ops/deployment/lokale-podman-adressen',
+            'ops/deployment/public-api-incident-playbook',
+          ],
+        },
+        {
+          type: 'category',
+          label: 'Releases & Tests',
+          items: [
+            'ops/releases',
+            'testing/e2e',
+          ],
+        },
+        {
+          type: 'category',
+          label: 'Monitoring & Diagramme',
+          items: [
+            'ops/monitoring-observability',
+            'ops/diagrams',
+          ],
+        },
+      ],
+    },
+
+    // Prozesse, Roadmap, Changes
+    {
+      type: 'category',
+      label: 'Prozess & Roadmap',
+      collapsed: true,
+      items: [
+        'process/README',
+        'process/roadmap',
+        {
+          type: 'category',
+          label: 'TODO / Epics',
+          items: [
+            'process/todo/security-hardening-epic',
+            'process/todo/paddle-migration',
+            'process/todo/paddle-catalog-sync',
+            'process/todo/localized-seo-hreflang-strategy',
+            'process/todo/media-streaming-upload-refactor',
+          ],
+        },
+        {
+          type: 'category',
+          label: 'Changes',
+          items: [
+            'process/changes/2025-09-08-session',
+            'process/changes/2025-10-02-registration-role-fixes',
+            'process/changes/2025-10-05-checkout-refactor-todo',
+            'process/changes/2025-10-09-paypal-sdk-migration',
+            'process/changes/2025-10-10-tenant-admin-onboarding-plan',
+            'process/changes/2025-11-08-coupon-ops',
+          ],
+        },
+      ],
+    },
+
+    // Testing / Qualität
+    {
+      type: 'category',
+      label: 'Testing',
+      collapsed: true,
+      items: ['testing/e2e'],
+    },
+
+    
+  ],
 };

 module.exports = sidebars;
--- a/docs/queue-supervisor/horizon.sh
+++ b/docs/queue-supervisor/horizon.sh
--- a/docs/queue-supervisor/queue-worker.sh
+++ b/docs/queue-supervisor/queue-worker.sh