Zum Inhalt

Kontext-bezogene Gutachtenunterstützung mit Active RAG & Wissensgraph

Gewinnerlösung
Aktuelle Phase:
Bekanntgabe der Gewinner
  1. Aufruf und Einreichungen abgeschlossen am 05.02.2024
  2. Rückfragen abgeschlossen am 14.02.2024
  3. Jury-Bewertung abgeschlossen am 04.03.2024
  4. Gewinner bekannt gegeben ab 05.03.2024
Challenge beendet

Kontext-bezogene Gutachtenunterstützung mit Active RAG & Wissensgraph

Unser integrierter Ansatz für die KI-basierte Erstellung raumordnungsfachlicher Gutachten kombiniert die generative Logik des Active Retrieval Generation (ARAG) mit semantischer Suche in Vektor- und Graphendatenbanken.
Zunächst werden die vorhandenen Daten von einem Dateiserver oder aus einer Datenbank mit einer OCR-Pipeline geladen. Im Anschluss erfolgt die Aufbereitung in kleine semantische Bausteine mittels Chunking mit vordefinierten Logiken, die auf Prüfinhalten, Widmungsänderungstypen und anderen charakteristischen Dokumenteneigenschaften basieren. Zusätzlich werden Metadaten und Beziehungen extrahiert. Dadurch wird unter Bewahrung des Zusammenhangs von Dateien & Dokumenten eine strukturierte Aufteilung der Daten erreicht.
Für die Beziehungsdarstellung zwischen den Datenpunkten nutzen wir ein Graphennetzwerk. Auch Dokumente ohne offensichtliche Beziehungen werden durch semantische Ähnlichkeit berücksichtigt.Dadurch werden relevante Zusammenhänge erfasst und verschiedene Versionen können erfolgreich abgebildet werden. Die dynamische Datenhaltung kann durch eine Schnittstellenanbindung und regelmäßige Delta Loads oder direkte Datenabfrage integriert werden.
Nach der strukturierten Datenaufbereitung erfolgt die Integration des Large Language Models (LLM) und der Retriever-Logik. Eine Ähnlichkeits- und Metadatensuche ermöglicht das Filtern früherer Einreichunterlagen, die der aktuellen Anfrage ähneln, und lassen bereits erstellte Inhalte einfließen. Durch die Verwendung dieser Datenpunkte in Verbindung mit einer vom LLM generierten Graph Query werden dem LLM nur für den Kontext relevante Inhalte zugespielt, um neue Gutachtentextbausteine zu generieren. Active Retrieval Generation (ARAG) und Few-Shot Prompting ermöglichen die effektive Nutzung des Sprachmodells ohne aufwendigen Feinabstimmungsprozess, insbesondere in einem Proof-of-Concept (PoC). Flexible Hosting-Optionen für das LLM umfassen den Azure OpenAI Service oder Open-Source LLMs wie Mistral oder LLama, die auch on premise gehostet werden können.
In einem Ausbauschritt kann auf einen multimodalen Ansatz erweitert werden, um zusätzlich Bild- und Objekterkennung einzuführen und die Daten weiter anzureichern. Die Umsetzung der Logik erfolgt in einer Test-Webanwendung, die einen Upload-Bereich für Unterlagen zur Verfügung stellt und ein Chat-Interface für die Generierung gewünschter Textelemente bietet. In Zusammenarbeit mit unserem UI/UX-Team kann für ein optimales Benutzererlebnis im Folgeprojekt ein UI/UX-Konzept erarbeitet werden.
Für das geplante Vorhaben können wir Erfahrungen aus erfolgreichen KI Projekten im juristischen Bereich (BMJ, Projekt “Entscheidungsanonymisierung”), in der UX bei der Bearbeitung von Inhalten die sich auf Gesetzestexte beziehen (MANZ Verlag, Bundesanzeiger), im Bereich fachlicher Textgenerierung mittels KI und Nutzung von LLMs auf Unternehmensdaten, sowie Expertise als Implementierungspartner der vorgeschlagenen Technologien einbringen.

Mehrwert

Unsere Methode für die KI-gestützte Gutachtenerstellung bringt deutlichen Mehrwert im Vergleich zu herkömmlichen LLM-/RAG-Ansätzen. Der Einsatz von ARAG in Kombination mit Vektor- und Graphdatenbank eliminiert die Notwendigkeit für aufwändiges Modelltraining. Dabei werden Abhängigkeiten zwischen den Inhalten transparent dargestellt. Die generierten Antworten gehen über die bloße Momentaufnahme der aktuellen Useranfrage hinaus, denn sie beinhalten mögliche Abhängigkeiten zu Folgethemen. Dadurch können die Ergebnisse z.B. in Bezug zur jeweils gültigen Rechtsfassung gesetzt und Gesetzesnovellen berücksichtigt werden.
Die Graphdatenbank ermöglicht eine umfassende Darstellung von Beziehungen zwischen verschiedenen Dokumententypen wie Gutachten, Prüfprotokollen und Gesetzestexten. Abhängigkeiten sowie Metadaten (z.B. Prüfinhalte, Prüfer und Widmungsänderungstypen) können erfasst werden. Diese Struktur erlaubt eine effektive Berücksichtigung der zeitlichen Komponente gesetzlicher Entwicklungen und bietet tiefere Einblicke in Datenabhängigkeiten im Vergleich zu herkömmlichen Modellen (explainable AI). Die Vektordatenbank optimiert die Informationssuche und erleichtert den Zugriff auf relevante Einreichunterlagen.
Die Kombination beider Datenmodelle zu einem ARAG-Ansatz ermöglicht die Entwicklung eines zukunftsweisenden KI-Systems, das nicht nur die aktuelle User-Frage isoliert betrachtet, sondern auch bereits eingefügte Inhalte und deren Abhängigkeiten berücksichtigt.

Dateien & Infos

Rückfragen & Kommentare

Bitte melden Sie sich an, wenn Sie ein Feedback hinterlassen möchten.

Bereits eingereichte Lösungen

Hinter der IÖB-Servicestelle stehen starke Partner

Eine Initiative von:

In Kooperation mit:

Cookies

Wir verwenden Cookies, um sicherzustellen, dass wir Ihnen das beste Erlebnis auf unserer Website bieten.

Erfahren Sie mehr unter "Erhebung von Zugriffsdaten, Logfiles und Cookies" in unserer Datenschutzerklärung.

Zur Hauptnavigation