Quick Check
Ausgangssituation
Bei der Erstellung von Zulassungsunterlagen (Core Dossiers) müssen spezifische Informationen aus medizinischen Studien zusammengestellt werden. Zu diesen Informationen gehören das Studiendesign, der Zweck der Studie, die Indikation, die benutzten Medikamente, die Größe der Teilnehmergruppe, die Studienergebnisse und das Fazit.
In den medizinischen Studien werden verschiedene Begriffe und Formulierungen verwendet. Deshalb erfordert die Extraktion dieser Informationen aus den Dokumenten Expertenwissen im pharmazeutischen Bereich und benötigt viel Zeit. Werkzeuge, die den Extraktionsprozess unterstützen und ihn vereinfachen und beschleunigen können, sind wünschenswert.
Lösungsidee
Im Quick Check wurde zunächst ein gemeinsames Verständnis der Dokumente und der darin enthaltenen Informationen erarbeitet.
Anhand von Testdokumenten wurden die Extraktionsmerkmale betrachtet und Formulierungen identifiziert, die Hinweise auf bestimmte Merkmalswerte geben. Es wurde auch darauf geachtet, inwieweit die Dokumentstruktur genutzt werden kann, um die besten Kandidaten für Merkmalswerte zu bestimmen.
Weiterhin wurde diskutiert, wie die Extraktionsfunktionen den Benutzenden zur Verfügung gestellt werden können und wie die extrahierten Informationen zu speichern sind, um den größtmöglichen Nutzen zu erzielen.
Nutzen
Die im Quick Check erreichten Ergebnisse zeigen, dass es mit den verfügbaren KI-Ansätzen möglich ist, die gewünschten Informationen aus den Dokumenten zu extrahieren, um die Medical Writer bei ihren Aufgaben zu unterstützen. Das Nutzenpotenzial sollte anhand einer größeren Dokumentenmenge noch genauer evaluiert werden.
Im ersten Schritt sollte keine vollautomatische Extraktion der benötigten Merkmale angestrebt werden. Vielmehr sollte eine Assistenzfunktion mit Korrekturmöglichkeit implementiert werden. Die Korrekturdate können später genutzt werden, die KI weiter zu trainieren und bessere Ergebnisse zu erzielen.
Umsetzung der KI-Applikation
Die bestehenden Methoden zur Merkmalsextraktion wurden evaluiert und für jedes Merkmal wurden die am besten geeigneten Methoden ausgewählt.
Für die Merkmale Studiendesgin, Medikation und Indikation wurden KI-Modelle erstellt, anhand von frei verfügbaren Sprachmodellen angepasst und für erste Tests im bestehenden Software-Framework Thorpedo des Fraunhofer IAO verfügbar gemacht. Die KI-Modelle wurden mit regelbasierten Ansätzen (z.B. Schlagwort-Listen) zu einem hybriden Ansatz kombiniert, um die jeweils relevanten Abschnitte und Sätze für die einzelnen Merkmale zu identifizieren.