Dtsch Arztebl 2004; 101(11): [12]
Schlüsseltechnologien des Internets: Recherchieren in verteilten Ressourcen
Supplement: Praxis Computer
![]() Leben im Informationszeitalter löst häufig dort Frustration aus, wo zwar in immer größerem Umfang Produkte, Dienstleistungen, Fachinformationen und Wissensbestände vorhanden sind, diese aber selbst von Experten nur ansatzweise erschlossen werden können. Ganz zu schweigen vom einfachen Bürger, der zum Beispiel online seinen Personalausweis verlängern möchte, die entsprechende Einstiegsseite aber im Seiten-Dschungel der E-Government-Lösung seiner Heimatstadt nicht auffinden kann und dem auch die Suche über Google mit rund 2 000 Treffern nicht weiterhilft. Viele dieser Szenarien gibt es auch dort, wo die Recherche in Büchern, Fachartikeln oder Zeitungen schrittweise durch elektronische Hilfsmittel abgelöst wird: in Medizin, Rechtswissenschaften oder Publizistik. Die Integration von tagesaktuellen, komplexen Informationen gilt dort als zwingend. Die Leistungsfähigkeit und Produktivität der Beteiligten ist vielfach direkt abhängig von der Effizienz der Erschließung elektronischer Quellen. Das Internet als ein fast omnipräsentes Werkzeug zur Veröffentlichung und Einsichtnahme in Informationsinhalte ist als ein Printerzeugnisse ergänzendes Hilfsmittel anzusehen, das einen wachsenden Einfluss auf die Patientenversorgung, Forschung und Lehre ausübt. Mittel- und langfristig geht es nicht allein um den Umfang und die Qualität der bereitgestellten Informationen, sondern um deren Zugänglichkeit und Anwendbarkeit. Hier bietet die elektronische Datenhaltung entscheidende Vorteile gegenüber Printerzeugnissen. Für die effiziente Verwirklichung dieser Aufgaben bietet es sich an, auf Datenstandards zurückzugreifen. In den vergangenen Jahren hat sich international für verschiedene Anwendungsgebiete die eXtensible Markup Language (XML) etabliert und als Format zur Übertragung (teil-)strukturierter Dokumente, basierend auf Technologien des Internets, durchgesetzt. Im Gegensatz zu den gängigen Internet-Seiten werden hier nicht primär Informationen zur Darstellung eines Dokumentes hinterlegt, sondern die Textinhalte können bezeichnet (Patientenname, Geburtsdatum, Hauptdiagnose, Nebendiagnose und andere), hierarchisch strukturiert und untereinander verknüpft sein, sodass ein gezieltes Auffinden und Darstellen (zum Beispiel als Tabelle von Patienten mit bestimmten Haupt- und Nebendiagnosen nach Alter geordnet) ermöglicht wird. Das Ablegen von Information beruht dabei auf einem dokumentenorientierten Ansatz, der sich im Vergleich zu einer Datenbank durch seine Flexibilität bei der Verarbeitung von strukturierten (zum Beispiel Tabellenwerk der ICD-10 Band 1, Medikamentenlisten) und teilstrukturierten Informationen (etwa Fachartikel) hervorhebt. Jedoch müssen die Bedeutung dieser Inhalte und deren Beziehungen zueinander festgelegt und teilweise standardisiert werden. Dies erfordert einen Mehraufwand bei der Erstellung dieser Informationsressourcen. Metainformation und semantische Auszeichnung Dabei müssen die strukturierte Erfassung und redaktionelle Arbeit an derartigen Dokumenten den Erfordernissen der neuen Technologien angepasst werden. Dies heißt für wissenschaftliche Publikationen beispielsweise, dass durch den Autor, Gutachter beziehungsweise Fachexperten selbst Struktur und Metainformation hinterlegt werden, die für die spätere elektronische Recherche Ansatzpunkte bieten. Derartige Informationen, die standardisiert und teilweise auch in kodierter Form (MeSH-Terms, ICD-Kodes, Erstelldaten, Urheberinformation und andere) erfasst werden können, ermöglichen ein weitaus besseres Katalogisieren, Klassifizieren und späteres Auffinden der Inhalte. Solche dynamischen Informationsdokumente gewinnen zusätzlich dadurch an Mehrwert, dass sie nach semantischen Gesichtspunkten ausgezeichnet werden können. Diese Auszeichnung ermöglicht es, je nach fachlicher Domäne einzelnen Textabschnitten eine inhaltliche Bedeutung zu hinterlegen, die beispielsweise von Recherchesystemen innerhalb von Bibliotheken oder von speziellen Internet-Suchmaschinen genutzt werden kann. Wissensquellen in der Medizin ![]() Die Homepage www.lumrix.de
Die Suchmaschine ist eine offene, plattformunabhängig skalierbare Software, die semantische Web-Technologien mit Grid-Computertechniken (Methoden für verteiltes Rechnen innerhalb von Netzwerken) verbindet. Im Kern werden konventionelle und statistische Suchverfahren mit einem neuartigen Suchalgorithmus kombiniert, der als Konzeptreduktion verstanden wird. Dabei werden nicht einzelne Begriffsatome mit einzelnen Dokumenten verbunden, sondern sinnvolle Begriffsmoleküle (Konzepte). Diese Begriffszusammenhänge ergeben sich aus den zugrunde liegenden Dokumenten (deren inhärenter Struktur und Semantik) oder können gesondert für definierte Suchräume (zum Beispiel Leitlinien, Medikamentenkataloge, Tarifwerke) festgelegt werden. Mit der Suchmaschine kann der Anwender sowohl die Struktur dieser Dokumente als auch deren zuvor definierte inhaltlichen Bedeutungen verarbeiten und zielgerecht einsetzen (www.lumrix.net). Mit dieser Technik lässt sich die Treffsicherheit bei Suchanfragen (im medizinischen Sprachgebrauch der „Spezifität“ eines diagnostischen Tests gleichzusetzen) deutlich über das bekannte Maß hinaus verbessern. Aus der Menge verfügbarer Informationen wird die für die Fragestellung relevante herausgezogen. Anwendungsbeispiel ICD-10-Kodierung Die Vorteile dieser Ressourcen zeigen sich zum Beispiel an der ICD-10-GM-Version 2004. Hier war beabsichtigt, eine Infrastruktur zu schaffen, die die Inhalte der ICD-10 sowohl für Web-Applikationen als auch für eine effiziente Integration in vorhandene Software bereitstellt. Die Inhalte können gleichzeitig weiterhin in gewohnter Form gepflegt werden. Diese „Rohdaten“ werden entsprechend einer Dokumentenbeschreibung (Strukturdefinition) in XML-Dateien verpackt. Mit der XML-Suchmaschine Lumrix kann der Anwender kontextsensitiv auf die Inhalte dieser Dokumente zugreifen, das heißt, er kann gezielt im Kontext von Kodes, Kodetiteln oder Inklusiva nach einzelnen oder mehreren Begriffen suchen. Die Suchanfrage wird mit einer strukturierten Ausgabe beantwortet, die es ermöglicht, gewünschte Informationen direkt in ein elektronisches Zielsystem (Kodiertool oder Krankenhausinformationssystem) einzulesen. Darüber hinaus lässt sich eine solche Lösung direkt in Web-Applikationen integrieren. Eine vollständig funktionsfähige Anwendung ist kostenfrei unter www.lumrix.de abrufbar. Diese erlaubt derzeit neben einer Volltextsuche im Systematischen Verzeichnis der ICD-10 eine gezielte Suche: - in Kodetitel und Inklusiva, - in dreistelligen Kodes und - über einen Diagnosenthesaurus. Eine Beschreibung der Funktionalitäten enthält die Website. Die Suche über den Thesaurus ist insbesondere geeignet, wenn der exakte Diagnosenbegriff nicht bekannt ist und infolgedessen mit mehreren unscharfen Suchbegriffen gearbeitet werden muss. ![]() Suchbeispiel in Lumrix
Gesucht wird der Kode für maligne Schilddrüsentumoren. Bösartige Neubildungen können in den ICD-10-Titeln sehr unterschiedlich bezeichnet werden, zum Beispiel als Karzinom, Tumor, Neoplasie, Neubildung. Die Suche über den Thesaurus, etwa mit einer Eingabe der Suchbegriffe „karz schild“ oder „neubild schild“ (Wortteile sind ausreichend) erbringt unter anderem den relevanten ICD-10-Kode C73. Gleichzeitig werden auch verschiedene Formen von Abkürzungen unterstützt. Um den Übergang von der ICD-Kodierung zur DRG-Kodierung zu erleichtern, wurde ein Suchdienst entwickelt, der zu einer umgangssprachlich formulierten Hauptdiagnose die zutreffenden ICD-Kodes und DRG-Fallgruppen findet. Der Suchdienst wird fortlaufend verbessert (wachsender Wortschatz) und um weitere Informationsquellen wie Kodierrichtlinien und OPS-Kodes ergänzt. Neue Krankheitsbegriffe wie SARS können schnell eingepflegt und auf vorhandene Diagnoseschlüssel abgebildet werden. Der Suchdienst ist im Internet verfügbar und wird an der Uni Tübingen für die Aus- und Weiterbildung von Ärzten genutzt. Mit täglich bis zu 1 000 Suchanfragen werden die Dienste regelmäßig in Anspruch genommen. Entsprechend dem Google-Ranking ist dieses Suchportal eines der am häufigsten zitierten Web-Nachschlagewerke im deutschen Gesundheitswesen. Anwendungsbeispiel Arzneimittellisten Im klinischen Netz des Universitätsklinikums Gießen werden seit einiger Zeit diese neuen Internet-Technologien für die Strukturierung, Suche und Verknüpfung von Arzneimittelinformationen genutzt (http://sepia0.informatik.med.uni-giessen.de/de/hl.php). Durch die Kennzeichnung von Wirkstoffen, Arzneimitteln, Indikationen und anderen Themen werden beschreibende Texte (Arzneimittel-Hausliste, Ergebnisse der Arzneimittelkommission, Rote Liste, Keim-Antibiotika-Beziehungen und andere) sinnvoll und maschinenlesbar miteinander verbunden. Der klinische Nutzer formuliert seine Suchanfrage mit ein oder zwei Stichworten, und eine Suchmaschine findet quellenübergreifend und zielgenau die gewünschte Information. Die Suchanfrage „telefon apo“ führt präzise zum Telefonverzeichnis der Apotheke, und die Suchanfrage „lasix“ liefert sämtliche relevanten Informationen aus Haus- und Rote Liste. Besonders gut aufgenommen wurde die hohe Suchqualität (Präzision, Vollständigkeit, Toleranz und Geschwindigkeit der Suche), die durch die neuen Technologien überhaupt erst möglich wird und die den klinischen Nutzern sehr viel Zeit bei der Recherche spart. Die Kennzeichnung und Verbindung von Themen ermöglichen, dass die Suchmaschine nicht nur Quellen, sondern einzelne Themen in den Quellen identifizieren kann. Die Kennzeichnung der Inhalte mittels XML-Standards schafft aber auch völlig neue Anwendungen. So wird in den nächsten Wochen ein elektronischer Warenkorb realisiert, der klinikindividuelle Arzneimittellisten verwaltet und die Arzneimittelanforderung bei der Klinikumsapotheke erheblich vereinfacht. Darüber hinaus soll eine elektronische Verbindung zwischen der Apotheke und dem Warenwirtschaftssystem eingerichtet werden. Diese Beispiele verdeutlichen, dass neue Internet-Technologien die Vorteile von hoch strukturierten, zentralen Datenbanken und schwach strukturierten, verteilten Texten vereinen. Die Achillesferse dieser Technologien war bisher immer noch die Strukturierung und Aktualisierung der Daten, die nur die Fachexperten (Apotheker, Arzt und andere) leisten können. Die Aufgabe an dieser Stelle ist es, die Hintergrundtechnologie zu verbergen und den Autor in seiner Dokumentationsfreiheit nicht zu beschränken. Hierfür wurde ein Pflegesystem entwickelt, das in der Apotheke genutzt wird und das wie das Suchsystem auch auf andere Anwendungsbereiche übertragbar ist. Anwendungsbeispiel klinische Leitlinien Am Universitätsklinikum Gießen entwickeln Ärzte und Informatiker gemeinsam klinische Leitlinien zum Thema „Multiple Sklerose“. Mit den genannten anwendungsnahen Werkzeugen stand den Ärzten sofort ein Redaktionssystem zur Verfügung, das die strukturierte Erfassung der Leitlinien ermöglicht. Durch die Strukturierung können Diagnosestellungen, Therapien und Handlungsanweisungen gezielt aus den Leitlinien herausgegriffen werden – dies spart dem Arzt viel Lesearbeit. Neue Internet-Technologien ermöglichen somit den effizienten Zugang zu relevanten Informationen selbst in umfassenden Leitlinien und versprechen eine hohe Akzeptanz durch den klinischen Nutzer. Zwar ist die Integration der Leitlinien in klinische Anwendungen ein zentrales Thema. Was nutzt es aber, wenn man eine 200 Seiten starke Leitlinie per Knopfdruck abrufen kann? Viel wichtiger ist die Präzision der Information, die dem Arzt das lästige Selektieren zwischen wichtig und unwichtig erspart. Semantisches Web Diese Ansätze sind erste Schritte auf dem Weg zu einem „semantischen Web“, das Beziehungswissen zwischen verschiedenen Datenbeständen maschinenlesbar bereitstellen kann. Das Konzept, verschiedene Ressourcen (wie Dokumente, Bilder, Personen, Konzepte) semantisch zu verknüpfen, ist bei komplexen und verteilt gelagerten Informationsressourcen besonders hilfreich. So ist es möglich, auf der Basis einfacher Hyperlinks ein Netz an Dokumenten aufzubauen, das die Beziehungen zwischen einzelnen Dokumenten beziehungsweise Textbausteinen dieser Dokumente herstellen kann. Solche Beziehungen können zum Beispiel sein: „ist Autor von“, „hat zum Thema“, „tritt in Interaktion mit“, „bezieht sich auf“. So erreicht man eine effizientere Informationsintegration beziehungsweise -verwaltung für neue, automatisierbare Dienstleistungen. Vor allem die Dienstleistungen werden im Umfeld der Medizin von unschätzbarem Nutzen: Sie ermöglichen ein rascheres und präziseres Auffinden von verteilten Informationsquellen, die Beurteilung der Qualität der Ressourcen und somit deren Integration in die eigene Arbeit. Das Internet kann auf diesem Weg zur interaktiven Wissensplattform reifen, deren Mehrwert in vielen Bereichen die Grenzen zwischen etablierten Informationsanbietern und dem akademischen Non-profit-Bereich verschwimmen lassen wird. Simon Hölzer, Ralf Schweiger, Jörg Rieger, Dirk Rudolf Anschrift für die Verfasser: Priv.-Doz. Dr. med. Simon Hölzer, Fährstraße 30, CH-3004 Bern, Schweiz, Telefon: +41 76 4 03 55 36, E-Mail: simon.hoelzer@uni-giessen.de
|
Merkliste
In Ihrer Merkliste können Sie News und Artikel speichern und später wieder aufrufen. Registrieren Sie sich, können Sie Ihre Merkliste dauerhaft speichern.
|