Rechtsprechung · Mila-Corpus

Kein Gedächtnis. Ein Corpus.Zitate, die tragen.

Jede Entscheidung, die Mila in einem Briefing zitiert, kommt aus einem kuratierten Corpus deutscher Rechtsprechung. Keine halluzinierten Aktenzeichen, keine erfundenen Urteile. Jede Zitation rückverfolgbar zur Quellentscheidung — einsehbar mit einem Klick.

Demo anfragen Corpus ansehen

Entscheidungen

1.317

Bundesweit, regional und lokal — BGH, OLG, LG, Amtsgericht.

BGB-§§ abgedeckt

§ 535 bis § 580a — die volle Mietrechts-Palette.

Städte

Von Berlin bis Freiburg. Bundesweite Abdeckung mit regionaler Präzision.

Halluzinationen

Strukturell unmöglich durch Post-Validation-Gate.

01 · Das Problem

Warum generische KI im Recht scheitert.KI-Systeme erfinden Aktenzeichen.

Sprachmodelle wie GPT-4 oder Claude können deutsche Rechtsprechung scheinbar flüssig zitieren — und erfinden dabei regelmäßig Aktenzeichen, Datumsangaben und Entscheidungsinhalte, die nicht existieren. Man nennt das Halluzinieren: das Modell produziert plausibel klingende Fakten, die es nie gegeben hat. Bei einer Frage nach dem Wetter harmlos, bei der Zitation eines BGH-Urteils fatal.

Das Phänomen ist dokumentiert, in den USA bereits Gegenstand anwaltsrechtlicher Disziplinarverfahren gegen Anwält:innen, die halluzinierte Urteile in Schriftsätze übernommen haben. Strukturell unvermeidbar, solange das Modell Zitate aus seinem Trainingsgedächtnis generiert — denn das Trainingsgedächtnis ist keine Datenbank, sondern ein statistisches Sprachmodell, das Urteile nicht abruft, sondern formuliert.

Für eine Plattform, deren Briefings in Anwaltsschriftsätze einfließen, ist das keine Toleranzfrage. Ein einziges halluziniertes BGH-Urteil in einem Schriftsatz ist ein berufsrechtliches Risiko. Die Lösung kann nicht sein, das Modell höflich zu bitten, keine Zitate zu erfinden — Anweisungen an das Modell sind keine Garantie, sie sind eine Bitte. Die Lösung muss strukturell sein.

Mila zitiert keine Rechtsprechung aus dem Gedächtnis. Jede Entscheidung, die in einem Briefing erscheint, wurde zuvor aus einem von Mila gepflegten Corpus abgerufen. Wenn die Entscheidung nicht im Corpus ist, existiert sie für Mila nicht. Halluzinationen werden nicht gefiltert — sie sind strukturell nicht möglich.

02 · Der Corpus

1.317 Entscheidungen, dreistufig.Die volle Mietrechts-Palette.

Milas Rechtsprechungs-Corpus deckt alle §§ des BGB-Mietrechts zwischen § 535 und § 580a ab. Kündigung, Modernisierung, Kaution, Mietminderung, Staffelmiete: jede Entscheidung, die eine Kanzlei im Mietrecht braucht, ist abrufbar. Wenn sich ein Mietpreisbremse-Fall zu einer Eigenbedarfskündigung entwickelt, greift der Corpus nahtlos weiter.

BGB-§§

Thema

Entscheidungen

§§ 573, 574

Ordentliche Kündigung · Eigenbedarf · Sozialhärte

§ 536

Mietminderung · Mängel · Gebrauchstauglichkeit

§ 543

Fristlose Kündigung aus wichtigem Grund

§ 551

Mietkaution · Höhe · Anlage · Rückgabe

§§ 555b, 559

Modernisierung · Duldungspflicht · Umlage

§§ 557a, 557b

Staffelmiete · Indexmiete

§§ 556d–556g

Mietpreisbremse · Rüge · Vormiete-Ausnahme

Gesamt

1.317

Die Zahlen spiegeln die tatsächliche Rechtsprechungsdichte. Kündigungsrecht und Mietminderung dominieren den Mietrechts-Kanon der letzten drei Jahrzehnte; die Mietpreisbremse ist von 2015 und hat bislang erst rund 70 BGH-Entscheidungen hervorgebracht. Dass Mila über §§ 556d–556g hinausgreift, ist der Grund, warum der Corpus auch dann trägt, wenn der Fall sich entwickelt — wenn der Vermieter mit Eigenbedarfskündigung reagiert, mit Modernisierungsausnahme argumentiert oder die Kaution einbehält.

Tier 1 · Federal

BGH

rund 731 Entscheidungen

Bundesgerichtshof, alle Senate mit Mietrechts-Befassung, Zeitraum 2000 bis heute. Bundesweit bindend — gilt identisch in allen 10 Mila-Städten.

Tier 2 · Regional

OLG · KG · LG

rund 389 Entscheidungen

Oberlandesgerichte und Landgerichte der 10 Mila-Regionen: KG Berlin, OLG Hamburg, München, Köln, Düsseldorf, Frankfurt, Stuttgart, Karlsruhe, Dresden. Präzisiert Mietspiegel-Fragen und regionale Verfahrensfragen.

Tier 3 · Lokal

Amtsgericht

rund 99 Entscheidungen

Amtsgerichte der Mila-Städte. Persuasiv, nicht bindend, aber indikativ für lokale Richterlinien und tatsächliche Entscheidungstendenzen vor Ort.

Quellen: bundesgerichtshof.de (primär, §-indexierte Suche), rechtsprechung-im-internet.de (sekundär, XML-strukturiert), openjur.de (Fallback und Deduplizierung), Landes-Justizportale für regionale Entscheidungen. Keine Aggregatoren, keine Zwischenhändler — Mila zieht direkt aus den autoritativen Quellen.

03 · Retrieval

Nachschlagen, nicht erinnern.Retrieval-Augmented Generation.

Statt Zitate aus dem Trainingsgedächtnis zu generieren, ruft Mila für jedes Briefing passende Entscheidungen aus dem Corpus ab — semantisch, nach §§-Übereinstimmung, nach Thema. Claude Sonnet erhält die abgerufenen Entscheidungen im Prompt und darf ausschließlich aus dieser Menge zitieren.

Retrieval-Augmented Generation — RAG — ist das Prinzip dahinter. Das Modell schreibt, aber es schreibt über eine Bibliothek, die wir kuratieren, nicht über seinen internen Trainingsstand. Der Ablauf im Detail, sieben Schritte vom eingehenden Vermieter-Schreiben bis zum geprüften Briefing:

↳ Der Retrieval-Ablauf

1landlord_contact_event · Eingehende Vermieter-Korrespondenz

→ Haiku: Klassifikation, Argumente, zitierte §§, Tonalität

Ein schnelles KI-Modell (Claude Haiku) liest die Vermieter-Antwort und extrahiert die rechtlichen Kernargumente.

2Query-Konstruktion · Vermieter-Text + extrahierte §§ + Thema

→ Embedding via BGE-M3 (1024-dim, selbstgehostet)

Der Text wird in eine mathematische Repräsentation umgewandelt — einen Vektor aus 1024 Zahlen, die die Bedeutung des Textes kodieren. Zwei ähnliche Texte haben ähnliche Vektoren. BGE-M3 ist das Modell, das diese Umwandlung macht; wir betreiben es auf eigenen Servern in Deutschland.

3pgvector HNSW · Cosine-Suche über Headnote-Chunks (top 20)

→ Feinretrieval über Begründungs-Chunks

Die Suche findet die 20 Entscheidungen, deren Leitsätze dem Suchvektor am ähnlichsten sind — nicht als Stichwort-Treffer, sondern nach Bedeutung. pgvector ist die Datenbank-Technologie dafür, HNSW der Such-Algorithmus.

4Rerank · Ähnlichkeit + §-Überlappung + Thema + Aktualität

→ Confidence-Gate: unter Schwelle → keine Zitation

Die 20 Kandidaten werden neu sortiert. Entscheidungen, die dieselben §§ betreffen wie die Vermieter-Argumentation, steigen auf. Ältere Urteile werden leicht abgewertet. Ist der beste Treffer trotzdem nicht relevant genug, zitiert Mila lieber nichts.

5Top 5–8 Entscheidungen an Sonnet · strikte Prompt-Schranke

→ Briefing-Komposition mit Zitat-Format-Vorgabe

Die fünf bis acht besten Entscheidungen gehen an das stärkere Modell (Claude Sonnet), das daraus das Briefing schreibt. Der Prompt macht klar: du darfst nur diese Entscheidungen zitieren, keine anderen, und niemals welche erfinden.

6Post-Validation · Regex-Gate prüft jede Zitation gegen Retrieval-Set

→ Unzulässige Zitation → Reject, max 2 Retries, sonst Fallback

Nach dem Schreiben scannt eine deterministische Prüfung den fertigen Text und gleicht jede Zitation mit der Liste der abgerufenen Entscheidungen ab. Taucht eine Zitation auf, die nicht abgerufen wurde, wird das Briefing verworfen und neu generiert.

7case_event_briefings · gespeichert mit ruling_ids und Citation-JSON

Das fertige, validierte Briefing landet in der Datenbank. Jede Zitation trägt einen internen Verweis auf die Entscheidung im Corpus — aus diesem Verweis entsteht im Kanzlei-Workspace der klickbare Link zum Volltext.

→ klärt Begründungserfordernis der Mietenbegrenzungsverordnung und Indexmiete-Berechnung nach §§ 556d, 556g BGB.

Jede Zitation folgt exakt diesem Format. Gericht, Aktenzeichen, Datum, kurze Relevanz-Begründung. Klick auf das Aktenzeichen öffnet die Entscheidung im Kanzlei-Workspace — volltext, mit markierter Passage.

Der entscheidende Mechanismus ist die Post-Validation in Schritt 6 — eine Art Türsteher, der nach der KI kommt. Wenn Sonnet das Briefing generiert hat, scannt eine deterministische Prüfung den Text und gleicht jede zitierte Entscheidung mit der Liste der tatsächlich abgerufenen Urteile ab. Findet sich ein Aktenzeichen, das nicht im Retrieval-Set war, gilt es als Halluzination: das Briefing wird verworfen und neu generiert. Nach zwei erfolglosen Versuchen fällt das System auf ein Briefing ohne Zitate zurück. Lieber keine Rechtsprechung als erfundene.

In der Produktion liegt die Halluzinationsrate bei 0. Das ist keine Marketing-Formulierung; es ist die strukturelle Konsequenz daraus, dass Zitate außerhalb des Corpus nicht durch den Türsteher kommen. Wir filtern Halluzinationen nicht heraus — wir machen sie strukturell unmöglich.

04 · Architektur

Originale bewahren, Kopien dürfen sich verändern.Vier Schichten. Eine Quelle der Wahrheit.

Der Corpus besteht aus vier klar getrennten Schichten. Die unterste ist immutable — jedes Urteil wird bei der Erfassung als Rohform persistiert. Alle darüberliegenden Schichten sind rekonstruierbar. Wenn sich das Embedding-Modell ändert, wird die Vektorschicht neu aufgebaut; die Rohdaten bleiben.

Layer 1

Rohdaten-ArchivSupabase Storage

Jedes Urteil genau so, wie es der Bundesgerichtshof oder das Justizportal ausliefert — als HTML oder PDF, mit allen Metadaten des Abrufs. Nichts wird verändert, nichts überschrieben. Diese Schicht ist die kanonische Quelle der Wahrheit: wenn irgendwann etwas schiefgeht, können wir von hier alles neu aufbauen.

Layer 2

Strukturierte MetadatenPostgres · rulings

Die Urteile, sauber ausgelesen: Gericht, Senat, Aktenzeichen, Datum, Leitsätze, Volltext, betroffene BGB-§§, Themen-Tags, Status. Hier wird aus dem Rohmaterial eine durchsuchbare Datenbank. Diese Schicht ist stabil — sie ändert sich nur, wenn wir den Parser verbessern.

Layer 3

Vektor-Indexpgvector · HNSW

Die Schicht, die die semantische Suche ermöglicht. Jedes Urteil wird in sinnvolle Abschnitte zerlegt — Leitsätze, Tenor, Begründungs-Abschnitte — und jeder Abschnitt bekommt seine mathematische Bedeutungs-Repräsentation. Wenn eine Anfrage reinkommt, findet diese Schicht in unter 200 Millisekunden die relevantesten Abschnitte aus dem gesamten Corpus.

Layer 4

Feedback & TagsCuration Loop

Die Schicht, die aus der Nutzung lernt. Welche Urteile werden wirklich zitiert? Welche werden von Anwält:innen gelöscht? Wo fehlt etwas im Corpus? Diese Signale fließen zurück — sie bessern das Ranking, markieren überholte Urteile, und zeigen uns, wo wir gezielt nachschauen müssen.

Grundprinzip: Die Rohquelle ist unveränderlich. Alles andere ist rekonstruierbar. Wenn sich das Embedding-Modell ändert, wird die Vektorschicht verworfen und neu aufgebaut. Wenn sich die Chunking-Strategie ändert, dasselbe. Es ist die gleiche Idee, mit der jedes seriöse Archiv arbeitet: die Originale bewahren, die Kopien dürfen sich verändern.

05 · Kuration

Mietrechts-Expertise im Review, nicht nur im Training.Praktiker:innen-kuratiert.

Scraping, Parsing und Auto-Tagging bringen den Corpus in eine funktionale Grundform. Die tatsächliche Qualität entsteht im Review durch praktizierende Mietrechts-Anwält:innen — an definierten Zeitpunkten und als laufender Rückkanal aus den Briefings selbst.

Vor Ship

Initial Spot-Check

Vor Freigabe: 50 zufällig gezogene Entscheidungen werden von einer Mietrechts-Anwält:in auf Metadaten-Korrektheit, Textvollständigkeit und Tag-Sinnhaftigkeit geprüft. Fehlerquote > 5 % blockiert die Freigabe — Parser wird korrigiert, Corpus neu aufgebaut.

2 Wochen nach Ship

Feedback-Loop

Nach Produktivgang: Review der Nutzungssignale. Welche Entscheidungen werden oft abgerufen? Welche zitiert? Welche editieren Anwält:innen heraus? Korrekturen fließen in die Themen-Tags und Deprecation-Listen zurück.

Quartalsweise

Deprecation-Sweep

Nicht jede Entscheidung bleibt maßgeblich. Später aufgehobene Urteile, durch neuere Rechtsprechung überholte Tendenzen, inhaltlich abgelöste Sachverhalte — werden als superseded markiert und aus dem Retrieval ausgeblendet. Der Status des Corpus bleibt aktuell.

Wöchentlich automatisch

Automatisierter Nachlauf

Wöchentlicher Cron: neue BGH-Entscheidungen seit letztem Lauf werden automatisch eingelesen, klassifiziert, eingebettet und in den Corpus aufgenommen. Review-Queue im Admin, non-blocking — neue Entscheidungen sind sofort live. Qualitätsprobleme werden rückwirkend korrigiert.

06 · Transparenz

Kein Black-Box-KI-Tool.Jede Zitation rückverfolgbar.

Im Kanzlei-Workspace ist jede Zitation in einem Briefing klickbar. Ein Klick auf BGH VIII ZR 94/21 öffnet die vollständige Entscheidung: Leitsätze, Tenor, Begründung, mit der retrievten Passage farblich hervorgehoben. Die prüfende Anwält:in kann in Sekunden verifizieren, was Mila behauptet. Kein Black-Box-KI-Tool, kein Vertrauen auf die Tapferkeit des Sprachmodells.

Bei jeder Zitation wird zusätzlich der Retrieval-Score mitgespeichert — transparent, nicht kosmetisch. Wenn der Score niedrig ist, erscheint die Zitation gar nicht erst; wenn sie erscheint, weiß die Anwält:in, dass die Relevanz durch das System bewertet wurde, nicht durch den Textgenerator.

Das ist der Punkt, an dem Mila sich von generischen KI-Tools unterscheidet: nicht an der Oberfläche der Konversation, sondern in der strukturellen Garantie, dass der zitierte Rechtssatz existiert und nachlesbar ist.

Mehr Tiefe

Wir zeigen den Corpus. Wir zeigen die Pipeline.Kein Pitch-Deck. Eine Architektur-Review.

Die vollständige technische Spezifikation — Scraping-Infrastruktur, Chunking-Strategie, Retrieval-Benchmarks, Failure-Modes — ist Teil des Kanzlei-Partnerschafts-Onboardings. Wir zeigen den Corpus, wir zeigen die Pipeline, wir zeigen die Betriebskennzahlen.

Demo anfragen Zum Corpus