Kein Gedächtnis. Ein Corpus.Zitate, die tragen.
Jede Entscheidung, die Mila in einem Briefing zitiert, kommt aus einem kuratierten Corpus deutscher Rechtsprechung. Keine halluzinierten Aktenzeichen, keine erfundenen Urteile. Jede Zitation rückverfolgbar zur Quellentscheidung — einsehbar mit einem Klick.
Warum generische KI im Recht scheitert.KI-Systeme erfinden Aktenzeichen.
Sprachmodelle wie GPT-4 oder Claude können deutsche Rechtsprechung scheinbar flüssig zitieren — und erfinden dabei regelmäßig Aktenzeichen, Datumsangaben und Entscheidungsinhalte, die nicht existieren. Man nennt das Halluzinieren: das Modell produziert plausibel klingende Fakten, die es nie gegeben hat. Bei einer Frage nach dem Wetter harmlos, bei der Zitation eines BGH-Urteils fatal.
Das Phänomen ist dokumentiert, in den USA bereits Gegenstand anwaltsrechtlicher Disziplinarverfahren gegen Anwält:innen, die halluzinierte Urteile in Schriftsätze übernommen haben. Strukturell unvermeidbar, solange das Modell Zitate aus seinem Trainingsgedächtnis generiert — denn das Trainingsgedächtnis ist keine Datenbank, sondern ein statistisches Sprachmodell, das Urteile nicht abruft, sondern formuliert.
Für eine Plattform, deren Briefings in Anwaltsschriftsätze einfließen, ist das keine Toleranzfrage. Ein einziges halluziniertes BGH-Urteil in einem Schriftsatz ist ein berufsrechtliches Risiko. Die Lösung kann nicht sein, das Modell höflich zu bitten, keine Zitate zu erfinden — Anweisungen an das Modell sind keine Garantie, sie sind eine Bitte. Die Lösung muss strukturell sein.
Mila zitiert keine Rechtsprechung aus dem Gedächtnis. Jede Entscheidung, die in einem Briefing erscheint, wurde zuvor aus einem von Mila gepflegten Corpus abgerufen. Wenn die Entscheidung nicht im Corpus ist, existiert sie für Mila nicht. Halluzinationen werden nicht gefiltert — sie sind strukturell nicht möglich.
6.630 Entscheidungen, dreistufig.Die volle Mietrechts-Palette.
Milas Rechtsprechungs-Corpus deckt alle §§ des BGB-Mietrechts zwischen § 535 und § 580a ab. Kündigung, Modernisierung, Kaution, Mietminderung, Staffelmiete: jede Entscheidung, die eine Kanzlei im Mietrecht braucht, ist abrufbar. Wenn sich ein Mietpreisbremse-Fall zu einer Eigenbedarfskündigung entwickelt, greift der Corpus nahtlos weiter.
Die Zahlen spiegeln die tatsächliche Rechtsprechungsdichte. Kündigungsrecht und Mietminderung dominieren den Mietrechts-Kanon der letzten drei Jahrzehnte; die Mietpreisbremse ist von 2015 und hat bislang erst rund 70 BGH-Entscheidungen hervorgebracht. Dass Mila über §§ 556d–556g hinausgreift, ist der Grund, warum der Corpus auch dann trägt, wenn der Fall sich entwickelt — wenn der Vermieter mit Eigenbedarfskündigung reagiert, mit Modernisierungsausnahme argumentiert oder die Kaution einbehält.
Quellen: bundesgerichtshof.de (primär, §-indexierte Suche), rechtsprechung-im-internet.de (sekundär, XML-strukturiert), openjur.de (Fallback und Deduplizierung), Landes-Justizportale für regionale Entscheidungen. Keine Aggregatoren, keine Zwischenhändler — Mila zieht direkt aus den autoritativen Quellen.
Nachschlagen, nicht erinnern.Retrieval-Augmented Generation.
Statt Zitate aus dem Trainingsgedächtnis zu generieren, ruft Mila für jedes Briefing passende Entscheidungen aus dem Corpus ab — semantisch, nach §§-Übereinstimmung, nach Thema. Claude Sonnet erhält die abgerufenen Entscheidungen im Prompt und darf ausschließlich aus dieser Menge zitieren.
Retrieval-Augmented Generation — RAG — ist das Prinzip dahinter. Das Modell schreibt, aber es schreibt über eine Bibliothek, die wir kuratieren, nicht über seinen internen Trainingsstand. Der Ablauf im Detail, sieben Schritte vom eingehenden Vermieter-Schreiben bis zum geprüften Briefing:
Der entscheidende Mechanismus ist die Post-Validation in Schritt 6 — eine Art Türsteher, der nach der KI kommt. Wenn Sonnet das Briefing generiert hat, scannt eine deterministische Prüfung den Text und gleicht jede zitierte Entscheidung mit der Liste der tatsächlich abgerufenen Urteile ab. Findet sich ein Aktenzeichen, das nicht im Retrieval-Set war, gilt es als Halluzination: das Briefing wird verworfen und neu generiert. Nach zwei erfolglosen Versuchen fällt das System auf ein Briefing ohne Zitate zurück. Lieber keine Rechtsprechung als erfundene.
In der Produktion liegt die Halluzinationsrate bei 0. Das ist keine Marketing-Formulierung; es ist die strukturelle Konsequenz daraus, dass Zitate außerhalb des Corpus nicht durch den Türsteher kommen. Wir filtern Halluzinationen nicht heraus — wir machen sie strukturell unmöglich.
Originale bewahren, Kopien dürfen sich verändern.Vier Schichten. Eine Quelle der Wahrheit.
Der Corpus besteht aus vier klar getrennten Schichten. Die unterste ist immutable — jedes Urteil wird bei der Erfassung als Rohform persistiert. Alle darüberliegenden Schichten sind rekonstruierbar. Wenn sich das Embedding-Modell ändert, wird die Vektorschicht neu aufgebaut; die Rohdaten bleiben.
Mietrechts-Expertise im Review, nicht nur im Training.Praktiker:innen-kuratiert.
Scraping, Parsing und Auto-Tagging bringen den Corpus in eine funktionale Grundform. Die tatsächliche Qualität entsteht im Review durch praktizierende Mietrechts-Anwält:innen — an definierten Zeitpunkten und als laufender Rückkanal aus den Briefings selbst.
Kein Black-Box-KI-Tool.Jede Zitation rückverfolgbar.
Im Kanzlei-Workspace ist jede Zitation in einem Briefing klickbar. Ein Klick auf BGH VIII ZR 94/21 öffnet die vollständige Entscheidung: Leitsätze, Tenor, Begründung, mit der retrievten Passage farblich hervorgehoben. Die prüfende Anwält:in kann in Sekunden verifizieren, was Mila behauptet. Kein Black-Box-KI-Tool, kein Vertrauen auf die Tapferkeit des Sprachmodells.
Bei jeder Zitation wird zusätzlich der Retrieval-Score mitgespeichert — transparent, nicht kosmetisch. Wenn der Score niedrig ist, erscheint die Zitation gar nicht erst; wenn sie erscheint, weiß die Anwält:in, dass die Relevanz durch das System bewertet wurde, nicht durch den Textgenerator.
Das ist der Punkt, an dem Mila sich von generischen KI-Tools unterscheidet: nicht an der Oberfläche der Konversation, sondern in der strukturellen Garantie, dass der zitierte Rechtssatz existiert und nachlesbar ist.
Wir zeigen den Corpus. Wir zeigen die Pipeline.Kein Pitch-Deck. Eine Architektur-Review.
Die vollständige technische Spezifikation — Scraping-Infrastruktur, Chunking-Strategie, Retrieval-Benchmarks, Failure-Modes — ist Teil des Kanzlei-Partnerschafts-Onboardings. Wir zeigen den Corpus, wir zeigen die Pipeline, wir zeigen die Betriebskennzahlen.