SEO-DAY BLOG

Podcast-Suchmaschine für SEO & Online-Marketing: Discovery, KI-Profile und filterbare Suche

作者 Fabian Rossbacher

发布日期 07. Juni 2026

Kernaussage: Wir starten die Podcast-Suchmaschine für SEO und Online-Marketing auf seo-day.de – Discovery über Websearch und 10 Podcast-Verzeichnisse, KI-Relevanzprüfung, Website-Crawl, KI-Profile, Episoden-Suggests und eine filterbare Suche mit Themen, Aktualität und Sortierung. Alles läuft über start-podcast-de-import.php (8 CLI-Steps) und endet in der öffentlichen Suche unter /podcasts.

Inhaltsverzeichnis

Elf Kapitel – vom Launch-Überblick über die 8-Step-Pipeline bis zu Git-Statistiken, klassischer Aufwandsschätzung und Agentur-CTA. Direkt zur gewünschten Section springen.

Was ist neu?

Ab sofort findet ihr auf seo-day.de eine Podcast-Suchmaschine für SEO und Online-Marketing – erreichbar unter /podcasts. Die Ergebnisliste lädt per AJAX über /api/podcast-suche-results, Autosuggest über /api/podcast-suche-autosuggest. Statt einer statischen Liste bauen wir ein wachsendes Verzeichnis aus freigegebenen Kanälen, die wir automatisiert finden, per KI auf Relevanz prüfen, anreichern und strukturieren.

Das bedeutet für euch in der Praxis:

001 Filterbare Suche nach Freitext, Themen-Tags, Episoden-Aktualität (1/3/7 Tage) und Sortierung
002 KI-Profile pro Kanal – aus Website-Crawl, podcast.de-Metadaten und Episoden
003 Autosuggest aus echten Episoden-Titeln (CLI Step 008, Tabelle podcast_de_search_suggest)
004 Letzte Episoden direkt in der Karte – bis zu drei neueste Folgen mit Datum, Laufzeit und Themen

Discovery-Pipeline: 8 CLI-Steps

Die Datenbasis entsteht über php start-podcast-de-import.php. Der Orchestrator CLIPodcastDeImportOrchestrator führt acht Steps aus – jeder Step ist ein eigener Service mit fester Verantwortung:

CLI start-podcast-de-import.php – Step-Übersicht

Step	Service	Aufgabe
001	CLIPodcastDeImport001LogFileClearService	Log-Verzeichnis `logs-podcast-de-import` vorbereiten
002	CLIPodcastDeImport002WebSearchDiscoveryService	Cursor-Agent Websearch nach SEO-/Marketing-Podcasts mit Ausschlussliste bekannter Kanäle
003	CLIPodcastDeImport003DirectorySearchDiscoveryService	Verzeichnis-Suche auf 10 Plattformen (podcast.de, fyyd, Podchaser, …) – max. ein Lauf pro Plattform und Tag
004	CLIPodcastDeImport004RelevanceValidationService	KI-Relevanzprüfung vor DB-Speicherung – nur SEO/Online-Marketing-Podcasts
005	CLIPodcastDeImport005ImportService	Import freigegebener Kanäle in `podcast_de_channel` via podcast.de/Typesense
006	CLIPodcastDeImport006WebsiteEnrichmentService	Publisher-Website aus RSS + Domain-Crawl → `website_crawl_markdown`
007	CLIPodcastDeImport007AiProfileGenerationService	Einmaliges KI-Profil nach Website-Crawl → `ai_profile_text`
008	CLIPodcastDeImport008SearchSuggestGenerationService	Such-Suggests aus Episoden-Titeln → `podcast_de_search_suggest`

Jeder Step schreibt Fortschritt in eigene Tabellen oder direkt in podcast_de_channel, damit Wiederholungsläufe nur offene Arbeit nachziehen – keine doppelten Agent-Läufe ohne Grund.

Themen und Verzeichnisse

Die Themen-Kategorien kommen aus config/podcast-de-import/podcast-topic-config.php. Der vollständige Satz umfasst derzeit 10 Themen-Slugs – darunter eine repräsentative Auswahl:

seo sea amazon online-marketing geo email-marketing affiliate social-media analytics e-commerce

Die Verzeichnis-Queries kommen aus config/podcast-de-import/podcast-directory-search-config.php – derzeit 4 Suchbegriffe (online marketing, onlinemarketing, suchmaschinenoptimierung, seo) auf 10 Plattformen (podcast.de, fyyd, podcaster.de, Podcastatlas, Deutsche Podcasts, Podcastplattform, Podcastclub, Podcast Index, Listen Notes, Podchaser). Pro Plattform höchstens ein Agent-Lauf pro Kalendertag; Treffer landen in podcast_directory_search_hit, der letzte Lauf in podcast_directory_search_platform_last_run.

Merksatz: Discovery ist kein einmaliger Scrape, sondern ein wiederholbarer Kreislauf – neue Verzeichnisse, neue Kandidaten, neue Profile, ohne manuelles Copy-Paste.

Welche Daten wir extrahieren

Freigegebene Kanäle werden in podcast_de_channel persistiert (Schema: briefing/database/004-podcast_de_channel.sql). Die wichtigsten Felder für Suche und Karten:

Identität & Metadaten

title, subtitle, description, podcast_author, podcast_url, web_feed, publisher_website_url.

Episoden & Aktualität

recent_episodes_json, num_of_shows, show_pub_at_latest, year_created, episodes_in_json_ld.

KI-Anreicherung

ai_profile_text, website_crawl_markdown, podcast_language, topic_tags (pro Episode im JSON).

Suche & Filter

Freitext auf Titel/Untertitel/Beschreibung/Autor; Themen-Filter pro Episode; Aktualitäts-Filter 1d/3d/7d; Sortierung nach Episoden, Datum, Startjahr.

Datenbank-Übersicht

Sechs MySQL-Tabellen bilden den Import- und Verzeichnis-Stack ab. Die Grafik zeigt, welcher CLI-Step welche Tabelle befüllt und wie die Daten zum zentralen Kanal-Verzeichnis und zur Autosuggest-Suche fließen:

MySQL Podcast-Import & Suche – Tabellen und Datenfluss

Step 002–003 Discovery

Verzeichnis

podcast_directory_search_hit

platform_key + podcast_url
topic_tag

Treffer aus 10 Plattformen (fyyd, Podchaser, …)

Throttle

podcast_directory_search_platform_last_run

platform_key
last_search_completed_at
last_discovered_count

Max. ein Agent-Lauf pro Plattform und Tag

Step 004 KI-Relevanz

Freigabe

podcast_de_relevance_validation

podcast_de_id
is_relevant
topic_tags

Nur SEO-/Online-Marketing-Podcasts passieren hier

Step 005–007 Verzeichnis

Haupttabelle

podcast_de_channel

podcast_de_id · title · topic_tags
recent_episodes_json · show_pub_at_latest
website_crawl_markdown · ai_profile_text

Import, Website-Crawl und KI-Profil – Quelle für /podcasts und die API

API Suche

Liest aus podcast_de_channel

Step 008 Suggests

Roh-Titel

podcast_de_search_suggest_episode_title

normalized_episode_title
analyzed_at · episode_language

Autosuggest

podcast_de_search_suggest

suggest_text
first_found_at · last_found_at

Vorschläge für /api/podcast-suche-autosuggest

Merksatz: Discovery-Tabellen sammeln Kandidaten, die Relevanz-Tabelle filtert, podcast_de_channel ist das zentrale Verzeichnis – die Suggest-Tabellen hängen daran für Autocomplete in der Suche.

Jetzt ausprobieren

Die Suche ist live – filtert nach euren Kriterien und zeigt KI-Profile sowie letzte Episoden direkt in der Karte:

CTA: Podcast-Suche öffnen (/podcasts) – Themen, Aktualität, Sortierung und Autosuggest in einer Oberfläche.

Deep Tech: Wie dieser Blogpost und die Plattform gebaut sind

Transparenz gehört zum Launch dazu. Weder die Podcast-Suche noch dieser Artikel laufen über ein klassisches CMS oder ein JavaScript-Framework – beides ist reines PHP, Twig und linearer Screen-Flow.

Was ist ein Screen?

Eine PHP-Datei unter htdocs/scripts/app/screen-*/ – sie delegiert an einen Orchestrator und rendert Twig. Keine Business-Logik im Screen selbst.

Schichtenmodell

Screen → ScreenOrchestrator → ScreenServices → Services → Repositories. Jeder Step genau ein Service-Call – Hollywood-Prinzip.

Briefing-First

Jede Änderung beginnt in briefing/ – erst Markdown-Briefing, dann PHP, Twig, CSS, Tests. Dieser Post folgt demselben Muster.

KI-fähige Qualitätssicherung

Cursor Rules, Skills, Subagents, Ralph Loop – jede Nacht automatische Checks und PHPUnit (UI, Service, Repository, Orchestrator). Keine Zeile „von Hand“ im klassischen Sinn: alles mit Cursor und LLMs gebaut, aber unter harten Regeln.

Mehr Hintergrund zu Architektur und Nightly-Checks findet ihr in diesen Blog-Artikeln:

Git-Statistik: Wie schnell das wirklich ging

Transparenz endet nicht bei der Architektur – auch die Git-Historie erzählt die Geschichte. Der Podcast-Stack ist Greenfield-Neubau ab dem 1. Juni 2026 – erster Commit am 1. Juni 2026 um 13:41 Uhr, Finalisierung mit 8 CLI-Steps, KI-Profilen und Autosuggest am 7. Juni 2026 um 17:51 Uhr (MESZ). Die Kennzahlen unten beziehen sich ausschließlich auf den Podcast-Scope (Briefings, PHP, Twig, CSS, JS, Tests, Config, SQL, Prompts – keine fremden Treffer wie Crawler-Daten zu podcast.de aus anderen Features).

Git Kennzahlen zum Podcast-Feature (Stand 7. Juni 2026)

Kennzahl	Wert
Erster Podcast-Commit	01.06.2026, 13:41 Uhr
Letzter Commit (Stand Redaktion)	07.06.2026, 17:51 Uhr
Entwicklungszeitraum	1.–7. Juni 2026 (~6 Tage Wanduhr)
Commits im Podcast-Scope	52 Commits (nur Podcast-Dateien)
Betroffene Dateien (Podcast-Scope)	361 Dateien (Briefings, PHP, Twig, CSS, JS, Tests, Config, SQL)
Neue Codezeilen (Podcast-Scope)	~39.420 Zeilen (Einfügungen, Greenfield-Neubau)
MySQL-Tabellen	6 (`podcast_de_channel` + 5 Import-/Suche-Tabellen)
CLI-Steps	8 im Orchestrator `CLIPodcastDeImportOrchestrator`
Verzeichnis-Plattformen	10 (podcast.de, fyyd, Podchaser, …)
Netto-Zeitinvest Fabian (Launch-Sprint)	~20 Minuten aktive Steuerung (Prompts, Review, Freigaben)

Was bedeutet das? In knapp einer Woche (1.–7. Juni 2026) entstanden 361 Dateien und fast 40.000 neue Zeilen im Podcast-Scope – alles Greenfield, ohne Altlasten. Das zeigt die Maschinen-Geschwindigkeit von Agentic AI Coding. Die 20 Minuten sind die menschliche Netto-Arbeit pro Iterationsrunde: Richtung vorgeben, Ergebnisse prüfen, freigeben – nicht jede Zeile tippen.

Gegenschätzung: Was wäre das klassisch gewesen?

Was steckt in 361 Dateien und fast 40.000 neuen Zeilen im Podcast-Scope? Ein komplettes Feature: Discovery über Websearch und Verzeichnisse, KI-Relevanz, Import, Website-Crawl, KI-Profile, Episoden-Suggests, Suche mit AJAX-Filtern, API-Endpoints, Briefings, Translations in sechs Sprachen und PHPUnit-Tests über alle Schichten. Wäre das ohne Agentic AI Coding mit klassischem Team gebaut worden, sähe der Aufwand grob so aus:

Schätzung Klassisches Team vs. Agentic AI Coding (Größenordnung, DACH-Markt)

Rolle	Personentage (Richtwert)	Typischer Tagessatz
Software-Architekt	1–2 PT	~950–1.100 €
Backend-Entwickler	5–6 PT	~800–950 €
Frontend-Entwickler	2–3 PT	~750–900 €
QA / Test-Engineer	1–2 PT	~600–750 €
Projektmanager	1 PT	~850–1.000 €
Summe	~10–14 Personentage	~8.500–10.500 € Projektkosten

Kalenderzeit und Risiko im klassischen Modell:

001 2–4 Wochen Kalenderzeit mit Abstimmung, Reviews und Testzyklen – realistisch für ein Feature dieser Tiefe.
002 Spezifikations-Drift: Briefings, Schema und UI würden in getrennten Köpfen leben – hier erzwingt Briefing-First + Agenten einen synchronen Stand.
003 Agentic AI Coding: ~20 Minuten Netto-Steuerung pro Launch-Runde, iterativ über Wochen bis zum finalen Stand – der Rest läuft über Cursor, Subagents und automatisierte Tests.

Die Schätzung ist bewusst eine Gegengerechnung, keine Agentur-Rechnung. Sie zeigt die Größenordnung: Was klassisch ein mehrwöchiges Teamprojekt mit zwei bis drei Köpfen wäre, ist mit dem richtigen KI-Framework in iterativen Sprints machbar – wenn Architektur, Regeln und Tests von Anfang an mitgedacht werden.

Ihr wollt so etwas auch bauen?

Viele Teams haben Ideen auf der Backlog-Liste, die aus Budget- oder Machbarkeitsgründen liegen bleiben: ein internes Verzeichnis, eine Discovery-Pipeline oder ein mehrsprachiger Screen mit Testabdeckung. Mit Agentic AI Coding lassen sich solche Umsetzungen in vielen Fällen deutlich kompakter planen als im klassischen Setup.

Beauftragung & Kontakt: Wer ein vergleichbares Projekt umsetzen möchte – ob Podcast-Verzeichnis, Branchen-Discovery oder eigenes KI-Produkt – kann sich bei uns melden. Auf /ki findet ihr unseren Agentur-Screen mit Vorgehen und Kontaktmöglichkeit. Unser Fokus liegt auf überschaubaren, testbaren und produktionsreifen Lösungen.

Fazit

Podcast-Discovery für SEO und Online-Marketing ist kein manuelles Link-Verzeichnis mehr, sondern ein automatisierter Kreislauf: Websearch → Verzeichnisse → KI-Relevanz → Import → Crawl → Profil → Suggests → filterbare Suche. 361 Dateien, ~39.400 neue Zeilen, 6 Tabellen, 8 CLI-Steps – in einer Woche (1.–7. Juni 2026) und netto ~20 Minuten menschliche Steuerung pro Iterationsrunde. Probiert die Suche unter /podcasts aus. Wer ähnliches für das eigene Unternehmen will: /ki.