Under the hood - Wie gelangt Cavell von Sprache zu einer Notiz?

23. Januar 2026

—

5 Minuten Lesezeit

Cavell wurde von Anfang an als generische KI-Engine entwickelt, die in verschiedenen Versorgungssettings einsetzbar ist. Hausärzte, ambulante Pflegekräfte und Fachärzte arbeiten jeweils auf ihre eigene Weise, mit anderen Workflows und anderen Erwartungen an ihre Akte. Dennoch basieren alle diese Anwendungen auf demselben technologischen Kern. Technisch betrachtet ist Cavell eine Sprache-zu-Text-zu-Code-Engine. Die Komponenten, die Sprache in Text und Text anschließend in einen codierten Bericht umwandeln, sind verallgemeinerte Bausteine. Diese architektonische Entscheidung wurde bewusst getroffen: Verbesserungen an der Cavell-Engine wirken sich automatisch auf alle Anwendungen aus, sorgen für Skalenvorteile und ermöglichen es, schnell neue Anwendungsfälle zu unterstützen, ohne jedes Mal von vorne beginnen zu müssen.

Anthony, Mitgründer von Cavell und Product Lead, blickte kürzlich unter die Motorhaube des CareConnect AI Assistant während eines Podcasts von Corilus. Aus diesem Anlass möchten wir gerne tiefer in die verschiedenen Bausteine eintauchen, aus denen diese Cavell-Engine besteht, und zeigen, wie diese Bausteine je nach Versorgungssetting unterschiedlich eingesetzt werden. Die Bausteine bleiben dieselben, aber ihre Konfiguration wird auf die Realität jedes Versorgungssettings abgestimmt.

Schritt 1: Erfassung der Sprache

Alles beginnt mit der Erfassung gesprochener Informationen. Wie diese Informationen bereitgestellt werden, unterscheidet sich stark je nach Kontext. Ambulante Pflegekräfte arbeiten oft mit kurzen Sprachnotizen von zwanzig bis dreißig Sekunden, meist nach Abschluss eines Hausbesuchs. In einer solchen Notiz diktieren sie alle relevanten Beobachtungen und Handlungen. Da es sich um einen einzelnen Sprecher handelt und das Diktat bewusst erfolgt, reicht das Mikrofon eines Smartphones vollkommen aus. Bei Konsultationen liegt die Sache anders. Während einer Konsultation bei Hausärzten, Fachärzten oder Psychologen werden wichtige Informationen nicht nur vom Gesundheitsdienstleister, sondern auch vom Patienten ausgesprochen, oft verteilt über das gesamte Gespräch. Um diese Informationen zuverlässig festzuhalten, muss die Audioerfassung breiter und konsistenter sein. Deshalb empfehlen wir in diesen Settings die Verwendung eines externen Mikrofons. Im Podcast erläuterte Anthony die Bedeutung des externen Mikrofons näher.

Um eine gute Balance zwischen Audioqualität, Reichweite und Preis zu bieten, haben wir dieses externe Mikrofon maßanfertigen lassen. Das aktuelle Mikrofon wird über USB an den Computer angeschlossen und liefert Audio in ausreichender Qualität, um mehrere Sprecher korrekt zu erfassen, ohne den Workflow in der Praxis zu stören.

Schritt 2: Transkription

Das Audio bildet die Eingabe für den nächsten Schritt: die Transkription. In dieser Phase wird gesprochene Sprache über cloudbasierte Verarbeitung in Text umgewandelt, was notwendig ist, um Geschwindigkeit und Skalierbarkeit zu gewährleisten. Während des Podcasts erläuterte Anthony, warum dieser Schritt nicht lokal auf dem Computer oder Smartphone des Gesundheitsdienstleisters erfolgen kann.

Ein wichtiger Faktor bei Konsultationen ist die Sprechererkennung (Speaker Diarization). Bei Konsultationen beim Hausarzt oder Facharzt kommt oft eine Begleitperson mit, und es ist essenziell, unterscheiden zu können, was vom Patienten gesagt wurde, was von einer Begleitperson und was vom Arzt. Diese Trennung ist entscheidend für die korrekte Interpretation der Konsultation. Bei ambulanten Pflegekräften, bei denen meist eine einzelne Person diktiert, ist die Sprechererkennung weit weniger relevant und die Pipeline kann einfacher gehalten werden.

Schritt 3: Von der Transkription zum codierten Bericht

Die Transkription ist kein Endpunkt. Im dritten Schritt wird der Text in einen codierten Bericht umgewandelt, abgestimmt auf das Versorgungssetting und auf die Art und Weise, wie die elektronische Patientenakte (EPA) Informationen erwartet. Ein solcher codierter Bericht besteht aus einer Kombination von Freitext, Diagnosecodes und strukturierten, codierten Parametern.

Für ambulante Pflegekräfte extrahiert Cavell neben einem begrenzten Freitextfeld etwa vierzig Parameter, die speziell für pflegerische Beobachtungen und Wundversorgung relevant sind. Für Hausärzte generiert Cavell einen Bericht im SOAP-Format mit einer klaren Trennung zwischen dem, was der Patient subjektiv angibt, was objektiv beobachtet oder gemessen werden kann, dem codierten Assessment und dem Plan für die weitere Nachsorge. Auch hier werden etwa vierzig Parameter automatisch erkannt und strukturiert, von Blutdruck und Gewicht bis hin zu spezialisierten Parametern, beispielsweise im Rahmen von Diabetes-Konsultationen. Bei Fachärzten ist das spezifische Format des Berichts noch wichtiger. Jedes Fachgebiet hat seinen eigenen Fokus, seine eigene Terminologie und Berichtsstruktur. Deshalb enthält Cavell Templates für mehr als fünfundzwanzig Fachgebiete und Subspezialitäten, von Endokrinologie und Kardiologie bis hin zu Orthopädie und Psychiatrie.

Um Cavell so gut wie möglich an all diese Versorgungssettings anzupassen, wurde von unserem Team aus KI-Ingenieuren ein Set zusammenarbeitender KI-Modelle aufgebaut. Diese Modelle sorgen dafür, dass codierte Berichte nicht nur schnell generiert werden, sondern auch inhaltlich akkurat und relevant sind innerhalb jedes spezifischen Versorgungskontexts. Während des Podcasts erläuterte Anthony näher, wie diese KI-Modelle konkret für Hausärzte funktionieren.

Am Ende dieses Prozesses steht der codierte Bericht in der elektronischen Patientenakte zur Verfügung.

Cavell wurde also als eine generische KI-Engine gebaut, die sich an den Kontext anpasst, in dem sie eingesetzt wird. Ob es sich um eine kurze Sprachnotiz einer ambulanten Pflegekraft handelt, eine Konsultation beim Hausarzt oder einen Facharztbericht – jedes Mal durchläuft Cavell dieselben grundlegenden Schritte: Sprache erfassen, Transkription und Umwandlung in einen codierten Bericht. Was sich unterscheidet, ist die Konfiguration dieser Schritte, abgestimmt auf den Workflow, den Inhalt und die Anforderungen des Versorgungssettings. Durch die Arbeit mit wiederverwendbaren Bausteinen kombinieren wir Qualität, Geschwindigkeit und Skalierbarkeit, ohne an Spezifität einzubüßen. Das macht Cavell heute breit einsetzbar in der Gesundheitsversorgung und gleichzeitig bereit, sich mit neuen Anwendungsfällen und Versorgungsmodellen weiterzuentwickeln.

Möchten Sie noch mehr darüber erfahren, was Under the hood bei Cavell steckt? Hören Sie sich gerne den vollständigen Podcast über folgenden Link an.

MENÜ

KONTAKT

info@cavell.ai

Polaris Health BV
Lammerstraat 13
9000 Gent

BTW: BE 1008.259.372

SOCIAL

RECHTLICHES

ISO 27001

DSGVO-konform

EU AI Act konform

Keine Datenspeicherung