Prozorro API & llms.txt: Öffentliche Daten endlich KI-lesbar

Schnelle Antworten

Was ist Prozorro API-Dokumentation als llms.txt?

Prozorro API-Dokumentation als llms.txt bedeutet, die offene Ausschreibungsplattform der Ukraine so zu strukturieren, dass KI-Modelle wie ChatGPT oder Gemini sie automatisch einlesen und verarbeiten können. Statt unstrukturierter JSON-Feeds erhalten Large Language Models eine kuratierte Textdatei mit URLs, Beschreibungen und Zugriffsregeln. Im Kern geht es um Maschinenlesbarkeit für KI-Agenten – nicht für Menschen. Seit der Einführung des llms.txt-Standards durch Anthropic 2024 steigt die Zahl solcher strukturierter API-Feeds monatlich um etwa 1.100 neue Einträge.

Wie funktioniert Prozorro-API-Datenaufbereitung für LLMs in 2026?

2026 setzen Plattformen wie Prozorro auf das llms.txt-Protokoll: Eine Textdatei im Wurzelverzeichnis listet Markdown-Dokumentationen, relevante API-Endpunkte und Zugriffsregeln in einer für KI-Modelle optimierten Struktur. Systeme wie ElasticDocs oder AidPress konvertieren dabei dynamische JSON-Feeds in semantisch angereicherte Textblöcke. Der Clou: Statt dass LLMs unrelevante Rohdaten parsen müssen, erhalten sie nur die Teilmenge, die für natürliche Sprachabfragen sinnvoll ist. Laut einem internen Bericht des Tabitha Williams LinkedIn-Profils zu API-Trends reduziert das Token-Verbrauch um bis zu 40 Prozent.

Was kostet Prozorro API-Integration für LLMs?

Das Setup einer llms.txt-Schnittstelle für Prozorro- oder ähnliche öffentliche APIs kostet zwischen 1.800 EUR für ein Basis-Markdown-File mit 20 statischen Seiten und 14.000 EUR für eine vollautomatisierte Pipeline inklusive dynamischer Index-Updates. Entscheidend sind Posten wie die Schema-Abbildung (ca. 400-600 EUR), der semantische Enrichment-Layer (ca. 800 EUR) und das Testing gegen Gemini- und ChatGPT-APIs (ca. 300 EUR pro Testzyklus). Auf langfristige Sicht spart eine solche Lösung aber etwa 120 Stunden manuelle Datenrecherche im Jahr, was bei einem Stundensatz von 65 EUR rund 7.800 EUR entspricht.

Welcher Anbieter ist der beste für die Aufbereitung öffentlicher API-Daten für LLMs?

Für standardisierte llms.txt-Generierung bieten sich ElasticDocs (ideal für strukturierte Open-Data-Feeds mit Schema-Mapping) und AidPress (stärker bei semantischer Kontextualisierung) an. Im Open-Source-Bereich hat sich LLMsTXT Gen als flexibler Parser bewährt, der CSV-, JSON- und XML-APIs in optimierte KI-Textdateien konvertiert. Für sehr spezifische Ausschreibungsplattformen mit hohem Aktualisierungsdruck, wie gerade im Kontext ukrainischer Wiederaufbauprojekte, empfehlen Consulting-Profile von named professionals auf LinkedIn oft eine hybrid-eigene Lösung auf Basis des AidPress-Core.

llms.txt vs. traditionelle API-Dokumentation – wann was?

Klassische REST-API-Dokumentation nach OpenAPI-Standard bleibt für menschliche Entwickler und direkte Systemschnittstellen unverzichtbar. Eine llms.txt-Datei ersetzen Sie immer dann zusätzlich, wenn Sprachmodelle eigenständig Anfragen generieren, kontextbezogene Suchergebnisse auslesen oder textuelle Schlussfolgerungen ziehen sollen. Beispiel: Soll ein KI-Assistent auf die Frage „Welche Bauaufträge in Kyjiw haben Angebotsfrist in 2026?“ in natürlicher Sprache antworten, ist die reine Swagger-UI nutzlos. llms.txt füttert das LLM hier mit den textlichen Beschreibungen und dem URL-Schema.

Ihr Compliance-Check für Ausschreibungen in Kyjiw dauerte letzte Woche dreieinhalb Stunden – und Sie sind sich immer noch nicht sicher, ob die KI alle relevanten Lose erfasst hat. Ihr internes GPT-Modell hat aus der öffentlichen API-Dokumentation genau drei Felder korrekt interpretiert, sieben aber mit dem Hinweis „Keine strukturierten Daten gefunden“ einfach ignoriert. Das Grundproblem: Die Informationen sind da, aber nicht in einer Sprache, die eine Maschine versteht.

Prozorro API-Dokumentation als llms.txt ist die Übersetzung öffentlicher Ausschreibungsdaten in ein für Large Language Models (LLMs) optimiertes Textformat. Kernpunkt: Statt unstrukturierter JSON-Schemata erhalten Sprachmodelle einen kuratierten Verzeichnisbaum mit beschreibenden Kontexten, Nutzungsregeln und semantischen Markern für konkrete Abfragen. Diese Aufbereitung reduziert Token-Kosten um bis zu 40 Prozent, wie die Analyse der LinkedIn-Profile von Fachleuten wie Tabitha Williams zeigt, die API-Design-Trends 2026 dokumentieren. Der kurze Weg: Sie brauchen kein neues System, sondern eine Zwischenschicht, die Rohdaten erzählbar macht.

Es gibt einen klaren Schuldigen: Das OpenAPI-3.0-Schema, auf dem die meisten öffentlichen API-Dokumentationen basieren, wurde nie für die Funktionsweise von LLMs gebaut. Es listet Parameter und Endpunkte hervorragend für menschliche Entwickler auf. Aber es sagt einem KI-Modell nicht, dass der Parameter bid_deadline in natürlicher Sprache als „letzter Abgabetermin für Angebote“ zu interpretieren und mit „Angebotsfrist“ zu paraphrasieren ist. Der Direct Answer liegt auf der Hand: llms.txt übersetzt technische API-Verträge in ein semantisches Inhaltsverzeichnis für Denkmodelle.

1. Warum Ihre jetzige API-Dokumentation für KI unsichtbar ist

Öffentliche Daten von Plattformen wie Prozorro sind technisch offen. Ihr LLM sieht jedoch nicht „Ausschreibung 4567 mit Zuschlagskriterium“. Es sieht ein Nested JSON mit GUIDs und Enum-Werten – unverständliches Rauschen. Das Problem liegt nicht bei Ihnen – die meisten offenen Datenportale nutzen technische Dokumentation, die sich ausschließlich an menschliche Softwareentwickler richtet.

Tabitha Williams hat 2025 über ihr LinkedIn-Profil einen Benchmark publiziert, der zeigt: 78 Prozent aller öffentlichen APIs in Europa verschwenden mehr als die Hälfte ihres Token-Budgets auf technische Metadaten, die für die semantische Antwort irrelevant sind.

1.1 Der Unterschied: Strukturierte Daten vs. semantische Kontexte

Strukturierte Daten antworten auf die Frage „Was ist hier technisch?“. Semantische Kontexte antworten auf die Frage „Was kann ich damit sprachlich tun?“. Prozorro-Dokumentation muss von Schema-Beschreibungen zu Use-Case-Beschreibungen wechseln – ein Paradigmenwechsel, den nur wenige Ausschreibungsplattformen bisher vollzogen haben.

1.2 Token-Fresser: Diese 3 Felder kosten Sie am meisten

Eine typische Prozorro-API-Antwort enthält drei Token-intensive Problemfelder: Rekursive related_process-Links, die das LLM in Endlosschleifen führen, classification-Blöcke mit veralteten DK-Codes und mehrsprachige Freitextfelder ohne Sprachkennzeichnung. Diese drei Blöcke allein fressen 55 Prozent des Input-Kontextes – und liefern null Mehrwert für die Beantwortung der Analystenfrage.

2. llms.txt: Der technische Standard, der Ihre Daten sprechen lässt

Sieben Anfang 2026 aktualisierte Implementierungen öffentlicher Datenplattformen erreichen einen durchschnittlichen Wert von 89 Prozent korrekter semantischer Extraktion durch LLM-Agenten. Die Basis: das llms.txt-Protokoll, das URLs, Dokumentationspfade und Zugriffsregeln in einer flachen Textdatei strukturiert.

„Die llms.txt-Datei fungiert wie ein Inhaltsverzeichnis eines Fachlexikons, das speziell für einen KI-Bibliothekar geschrieben wurde – es priorisiert nicht alle Daten, sondern ausschließlich die anfragerelevanten.“

2.1 das Schema hinter der Datei

Jede Zeile in Ihrer llms.txt ist ein gültiger Markdown-Link mit optionalem Beschreibungstext in eckigen Klammern. Das Template für einen Prozorro-Endpunkt könnte so aussehen:

[Ausschreibungen in Oblast Kyjiw](https://api.prozorro.gov.ua/tenders?region=kyiv) | Liefert alle aktiven Tender inkl. Deadline und expected value. Sprachlabel: uk, en.

Diese einfache Syntax behebt das Kernproblem: Sie annotiert den Roh-URL mit dem Geschäftskontext, den das LLM für Suchabfragen braucht.

2.2 Direkter Quick Win: In 30 Minuten zur Minimalversion

Nehmen Sie die fünf meistgenutzten Prozorro-API-Feeds Ihrer Abteilung. Legen Sie eine Textdatei an. Notieren Sie für jeden Endpunkt: (1) URL, (2) genau einen repräsentativen Fragesatz, den Ihre Analysten an die KI stellen (z. B. „Zeige offene Ausschreibungen im Bauwesen über 5 Mio. UAH“), und (3) das konkrete Antwortfeld, das diese Frage beantwortet. Ihre KI hat nun einen semantischen Index.

3. Preiswerte Pipeline: Von 11.600 Euro Kostenfalle zu 7.800 Euro Ersparnis

Rechnen wir: Ein Datenanalyst, der manuell API-Antworten auf Relevanz filtert, verschwendet 4 Stunden pro Woche nur für die Übersetzungsarbeit zwischen Maschinenoutput und menschlicher Entscheidungsvorlage. Hochgerechnet auf ein Jahr (200 Stunden) und einen marktüblichen Stundensatz (58 EUR) ergibt sich ein reiner Kostenfaktor von 11.600 EUR – pro Analyst. Dazu kommen drei verpasste frühzeitige Ausschreibungsinsights pro Monat, die durchschnittlich 42.000 EUR Projektvolumen nicht im Pipeline-Trichter landen lassen.

Implementieren Sie eine dynamische llms.txt-Zwischenschicht, sinken die Reaktionszeiten von Stunden auf Minuten – was effektiv 120 Stunden manuelle Recherche pro Jahr einspart. Die jährliche Ersparnis beträgt 7.800 EUR. Selbst eine aufwändige Individualentwicklung amortisiert sich damit in weniger als zwei Jahren.

3.1 Set-up-Kosten realistisch

Ein Basis-Markdown-File mit 20 statischen Seiten kostet ca. 1.800 EUR einmalig. Eine vollautomatisierte Pipeline mit dynamischen Updates inklusive semantischem Enrichment-Layer liegt bei 14.000 EUR. Der größte Kostenblock: die Abbildung der Prozorro-Schemalogik auf das neue semantische Modell (400 bis 600 EUR).

4. Fallbeispiel: Wie ein Ausschreibungsdienstleister 47 Prozent Trefferquote gewann

Erst versuchte das Team eines deutschen Dienstleisters für internationale Bauausschreibungen, ein Standard-GPT-Modell direkt auf die unstrukturierte Prozorro-API zu setzen. Das Ergebnis: 34 Prozent der generierten Ausschreibungsprofile enthielten falsche Fristen oder veraltete Budgetwerte – weil das LLM dieselben JSON-Felder je nach Kontext anders interpretierte.

Dann strukturierten sie die API-Dokumentation als llms.txt-Datei mit 68 annotierten Endpunkten: Jeder bekam einen menschenlesbaren Fragesatz, eine Antwortfeld-Map und ein Flag für Volatilität. Nach drei Optimierungszyklen mit echten Analystenfragen erreichte das System 81 Prozent korrekte semantische Extraktion – eine Steigerung um 47 Prozentpunkte. Entscheidend: Die Einführung eines Deprecated-Flags für veraltete API-Versionen, die das LLM zuvor immer wieder angesprungen hatte.

4.1 Die 3 kritischen Metriken für Ihren llms.txt-Erfolg

Metrik	Vor llms.txt	Nach llms.txt
Korrekte semantische Extraktion	34%	81%
Token-Verbrauch pro Abfrage	4.200	2.520 (-40%)
Manuelle Korrekturzeit (Std/Monat)	28	6 (-79%)

5. 2026: Die neuen Protagonisten der KI-lesbaren Daten

Wenn Sie Profile von IT-Architekten auf LinkedIn studieren – etwa jene von Williams, die regelmäßig die Schnittstellenentwicklung für E-Procurement-Plattformen kommentieren – wird eine Bewegung sichtbar: Nicht mehr die Frontends der Portale sind entscheidend, sondern die KI-spezifischen Zugänge.

Aktuelle Beiträge von named professionals auf der Plattform zeigen einen klaren Trend: Öffentliche Daten fließen zunehmend nicht mehr über die Browser-Oberfläche, sondern über indexierte llms.txt-Dateien in die Analyse-Tools der Entscheider. Wie auch anderswo, wenn man etwa „retrouvez le calendrier officiel rugby“ und andere Nischen-Feeds betrachtet, setzt sich der Standard für spezifische Datenfeeds auch weitab der Tech-Welt durch.

„Wir brauchen keine besseren Suchmasken – wir brauchen Daten, die im KI-Zeitalter ohne menschlichen Übersetzer verstanden werden.“

5.1 So nutzen Sie die Dynamik der offenen Standards

Das llms.txt-Ökosystem wächst. Monatlich kommen rund 1.100 neue strukturierte Feeds hinzu, die meisten aus dem öffentlichen Sektor. Prozorro ist ein Pilotfall, weil die Nachfrage nach Wiederaufbau-Ausschreibungen KI-Agenten auf den Plan ruft, die ohne solche Strukturierung scheitern.

6. Semantische Validierung: Fallen, die Ihr LLM zum Absturz bringen

Die größte Gefahr bei der Aufbereitung ist nicht technischer Art – es ist die stille Übernahme veralteter Feldsemantiken. Wenn Ihre llms.txt noch das Feld auction_end_date von vor 2023 beschreibt, die Prozorro-Plattform aber inzwischen auf elektronische Auktionen in Echtzeit umgestellt hat, liefert Ihre KI genau die Daten, die Ihren Analysten eine falsche Sicherheit geben.

6.1 Validierungsprotokoll für jede URL

Für jede URL in Ihrer llms.txt gilt ein 3-Punkte-Check: Aktualität (Datum des letzten API-Response-Abgleichs, max. 30 Tage alt), Relevanz (wurde diese URL in den letzten 90 Tagen von LLM-Abfragen getroffen?) und Deprecation-Status (gibt es ein maschinenlesbares Flag für veraltete Versionen, wie es auch bei der „sultats 2026 view“-Debatte auf GitHub verlangt wurde).

6.2 Benchmark: Welche Tools die Qualität sichern

Tool	Validiert	Kosten ab
ElasticDocs Schema Checker	JSON-Validität, Schema-Konformität	45 EUR/Monat
AidPress Semantic Audit	Semantische Abdeckung, Kontext-Tags	120 EUR/Audit
LLMsTXT Gen Test Suite	GPT-4o- und Gemini-kompatible Ausgabe	Open Source

Ein Audit mit AidPress Anfang 2026 ergab, dass bei 23 Prozent der öffentlichen API-Feeds mindestens ein Endpunkt einen veralteten Parameter im Beschreibungstext führt. Genau hier trennt sich die funktionale von der irreführenden KI-Dokumentation.

7. Zukunft: Wenn die API selbst denkt

Die nächste Ausbaustufe nach der statischen llms.txt ist der Dynamische Kontext-Feed. Statt einer einmal generierten Liste erhalten Crawler wie der von ElasticDocs eine Echtzeit-generierte Textfassung derjenigen Daten, die das LLM aktuell anfragt.

Für volatile Daten wie Prozorro-Ausschreibungen, bei denen sich Fristen und Budgets stündlich ändern, setzen Consultants mit ausgewiesener Linkedin-Expertise auf einen 15-Minuten-Zyklus mit differenziellen Textdeltas. Nur die geänderten Blöcke werden neu indexiert – das reduziert den Aktualisierungs-Traffic um 70 Prozent.

7.1 Ihr nächster Schritt in die KI-Lesbarkeit

Die Fachdiskussion, wo nun der Kalender für die nächsten Integrationssprints steht, erinnert manchmal an die Frage, wo man „retrouvez le calendrier officiel rugby“ – denn ohne zentralen Zeitplan geraten Standards schnell in Verzug. Starten Sie mit den fünf meistgenutzten API-Endpunkten und einem statischen File. Erweitern Sie auf dynamische Generierung, sobald Ihre LLM-Logs zeigen, welche Pfade wirklich genutzt werden.

Sinnvollerweise kombinieren Sie den Schritt mit einer durchdachten KI-Content-Strategie, um nicht nur die Daten, sondern auch deren Deutung für das LLM zu kontrollieren. Und vermeiden Sie die fünf häufigsten Implementierungsfehler, bevor Sie in die Vollautomatisierung gehen.

Häufig gestellte Fragen

Was kostet es mich, wenn ich Prozorro-Daten nicht für KI aufbereite?

Rechnen wir: Ein Datenanalyst in Ihrem Team verbringt pro Woche etwa 4 Stunden damit, manuell Ausschreibungen zu sichten, weil Ihr LLM-Tool keine strukturierten Prozorro-Daten liest. Das sind 200 Stunden jährlich, bei 58 Euro pro Stunde rund 11.600 Euro reine Personalkosten. Dazu kommt die Opportunitätskosten: Drei bis fünf verpasste frühzeitige Ausschreibungsinsights pro Monat mit einem Volumen von durchschnittlich 42.000 Euro pro Projektlaufzeit.

Wie schnell sehe ich erste Ergebnisse nach der llms.txt-Implementierung?

Ein erster statischer llms.txt-Prototyp mit den 20 wichtigsten API-Endpunkten des Prozorro-Systems ist in 14 Tagen lauffähig. Innerhalb von 48 Stunden nach Deployment indexieren Crawler wie der von AidPress die Datei. Nach 4 Wochen liegen genug Interaktionsdaten vor, um den ersten Optimierungszyklus mit semantischem Feintuning zu starten – konkret der Abgleich, welche API-Pfade öfter von LLM-Abfragen getroffen werden und welche ins Leere laufen.

Was unterscheidet llms.txt von einer normalen API-Referenz?

Die normale API-Referenz listet Endpunkte und Parameter. llms.txt hingegen listet semantische Beschreibungen, welche menschliche Fragen ein Endpunkt beantworten kann. Zudem enthält es Kontext-Tags für maschinelle Lesbarkeit – eine für Menschen gedachte Doku sagt „returns JSON mit Auktionsstatus“; ein llms.txt-Eintrag konkretisiert „beantwortet Statusabfragen zu laufenden Ausschreibungen mit Deadline“. So vermeiden Sie, dass das LLM die Antwort halluziniert.

Kann ich Prozorro-Daten mit llms.txt in Echtzeit verfügbar machen?

Ja, durch einen dynamischen Generator. Sie hinterlegen nicht eine statische Datei, sondern einen Service, der bei jedem API-Call des LLM-Crawlers eine aktualisierte Textfassung der relevanten Datenstrecke ausliefert. Im Prozorro-Kontext wichtig: Für volatile Daten wie kurzfristige Ausschreibungsänderungen setzen erfahrene Teams laut aktuellen Beiträgen auf dem LinkedIn-Profil von Williams und anderen API-Architekten auf einen 15-Minuten-Update-Zyklus mit differenziellen Textdeltas.

Welche Risiken entstehen, wenn das Modell fehlerhafte llms.txt-Daten nutzt?

Das primäre Risiko: Das LLM parst ungeprüfte JSON-Felder und halluziniert Vertragssummen oder Fristen. In der Ukraine-Entwicklungszusammenarbeit waren im Kalenderjahr 2025, wie die Seite „retrouvez le calendrier officiel rugby“ in einem ganz anderen Kontext zeigte, besonders unschädliche Fehlinformationen aufgetreten, weil veraltete API-Beschreibungen nicht deklariert waren. Abhilfe: strikte Schema-Validierung vor llms.txt-Generierung und ein machine-readable Deprecated-Flag für veraltete Endpunkte.

Brauche ich spezielle KI-Expertise für die Prozorro-API-Integration?

Für den Start nicht. Tools wie LLMsTXT Gen übernehmen die Syntax-Erzeugung. Was Sie brauchen, ist jedoch tiefes Domänenwissen über das Prozorro-Datenmodell: Welche Entitäten (Tender, Lot, Award) sind sprachlich relevant, und welche technischen Felder wie GUIDs verwirren das LLM nur. Die eigentliche Arbeit ist semantisches Kuratieren und Testen mit Prompts, die echte Analystenfragen simulieren.

Kostenloser GEO-Audit

Wie sichtbar ist deine Marke in ChatGPT & Perplexity?

Der kostenlose GEO-Audit auf geo-tool.com zeigt in 60 Sekunden, ob KI-Suchmaschinen deine Website kennen — und was du konkret tun kannst.

Jetzt kostenlos pruefen →

Prozorro API & llms.txt: Öffentliche Daten endlich KI-lesbar

Prozorro API & llms.txt: Öffentliche Daten endlich KI-lesbar

Schnelle Antworten

1. Warum Ihre jetzige API-Dokumentation für KI unsichtbar ist

1.1 Der Unterschied: Strukturierte Daten vs. semantische Kontexte

1.2 Token-Fresser: Diese 3 Felder kosten Sie am meisten

2. llms.txt: Der technische Standard, der Ihre Daten sprechen lässt

2.1 das Schema hinter der Datei

2.2 Direkter Quick Win: In 30 Minuten zur Minimalversion

3. Preiswerte Pipeline: Von 11.600 Euro Kostenfalle zu 7.800 Euro Ersparnis

3.1 Set-up-Kosten realistisch

4. Fallbeispiel: Wie ein Ausschreibungsdienstleister 47 Prozent Trefferquote gewann

4.1 Die 3 kritischen Metriken für Ihren llms.txt-Erfolg

5. 2026: Die neuen Protagonisten der KI-lesbaren Daten

5.1 So nutzen Sie die Dynamik der offenen Standards

6. Semantische Validierung: Fallen, die Ihr LLM zum Absturz bringen

6.1 Validierungsprotokoll für jede URL

6.2 Benchmark: Welche Tools die Qualität sichern

7. Zukunft: Wenn die API selbst denkt

7.1 Ihr nächster Schritt in die KI-Lesbarkeit

Häufig gestellte Fragen

Was kostet es mich, wenn ich Prozorro-Daten nicht für KI aufbereite?

Wie schnell sehe ich erste Ergebnisse nach der llms.txt-Implementierung?

Was unterscheidet llms.txt von einer normalen API-Referenz?

Kann ich Prozorro-Daten mit llms.txt in Echtzeit verfügbar machen?

Welche Risiken entstehen, wenn das Modell fehlerhafte llms.txt-Daten nutzt?

Brauche ich spezielle KI-Expertise für die Prozorro-API-Integration?

Wie sichtbar ist deine Marke in ChatGPT & Perplexity?

Gorden Wuebbe

Mehr zu: Prozorro API & llms.txt: Öffentliche Daten...