Broad problem / Allgemeineres Problem
Artificial intelligence (AI) is having a growing influence on healthcare, showing positive results in various medical fields. Its potential to revolutionise healthcare delivery by refining diagnostic accuracy, treatment planning, patient monitoring, and general healthcare outcomes is profound. AI algorithms have been created to examine multifaceted medical data, including medical images, genomic data, and electronic health records, with substantial accuracy and efficiency [1]. In radiology, AI has been utilised for image interpretation, supporting radiologists in identifying and diagnosing illnesses from medical images [2]. Moreover, AI has been employed in pathology, dermatology, and ophthalmology, demonstrating significant potential to enhance disease diagnosis and management [3]. Additionally, AI has the capability to aid personalised medicine by scrutinising individual patient data and presenting tailored treatment plans [4]. It has been utilised to anticipate disease outcomes, recognise high-risk patients, and optimise treatment strategies [5]. AI can also advance precision cardiovascular medicine by improving the precision of diagnosis, prognosis, and risk prediction in cardiovascular diseases [5]. However, it is essential to note that while AI has demonstrated encouraging outcomes, numerous practical applications are still at their outset and require additional exploration and development [6]. Additionally, ethical considerations and regulatory standards must be addressed to ensure the safe and responsible use of AI in medicine [7]. Nevertheless, the incorporation of AI in medicine harbours immense potential for enhancing healthcare outcomes and revolutionising the practice of medicine.
Künstliche Intelligenz (KI) hat einen wachsenden Einfluss auf das Gesundheitswesen und zeigt positive Ergebnisse in verschiedenen medizinischen Bereichen. Sie hat das Potenzial, die Gesundheitsversorgung zu revolutionieren, indem sie die Diagnosegenauigkeit, die Behandlungsplanung, die Patientenüberwachung und die allgemeinen Ergebnisse der Gesundheitsversorgung verfeinert. KI-Algorithmen wurden entwickelt, um vielfältige medizinische Daten, einschließlich medizinischer Bilder, genomischer Daten und elektronischer Gesundheitsakten, mit hoher Genauigkeit und Effizienz zu untersuchen [1]. In der Radiologie wurde KI für die Bildinterpretation eingesetzt, um Radiologen bei der Erkennung und Diagnose von Krankheiten anhand medizinischer Bilder zu unterstützen [2]. Darüber hinaus wurde KI in der Pathologie, Dermatologie und Augenheilkunde eingesetzt, wo sie ein erhebliches Potenzial zur Verbesserung von Krankheitsdiagnose und -management aufweist [3]. Darüber hinaus kann KI die personalisierte Medizin unterstützen, indem sie individuelle Patientendaten prüft und maßgeschneiderte Behandlungspläne vorlegt [4]. Sie wurde eingesetzt, um Krankheitsverläufe vorherzusehen, Hochrisikopatienten zu erkennen und Behandlungsstrategien zu optimieren [5]. KI kann auch die kardiovaskuläre Präzisionsmedizin voranbringen, indem sie die Genauigkeit der Diagnose, Prognose und Risikovorhersage bei Herz-Kreislauf-Erkrankungen verbessert [5]. Es ist jedoch zu beachten, dass KI zwar vielversprechende Ergebnisse gezeigt hat, zahlreiche praktische Anwendungen jedoch noch in den Kinderschuhen stecken und weitere Erforschung und Entwicklung erfordern [6]. Darüber hinaus müssen ethische Überlegungen und regulatorische Standards berücksichtigt werden, um den sicheren und verantwortungsvollen Einsatz von KI in der Medizin zu gewährleisten [7]. Nichtsdestotrotz birgt die Einbindung von KI in die Medizin ein immenses Potenzial für die Verbesserung der Gesundheitsversorgung und die Revolutionierung der medizinischen Praxis.
The field of medical education, in particular, is demonstrating fast and robust growth. The Chat Generative Pretrained Transformer (ChatGPT; OpenAI, San Francisco, CA) model is one of the most promising entities in this area. It is a natural language processing-based model with the ability to generate conversational responses (SOURCE). ChatGPT’s usefulness in medicine extends to various areas: education, research, clinical practice, and decision-making. In terms of healthcare education and research, ChatGPT has demonstrated the ability to improve scientific writing, increase research fairness, and help personalize pedagogical methods [8]. It has played a significant role in creating case scenarios and exam questions, thereby enhancing educational content and pedagogical adaptability [9]. In the clinical field, ChatGPT shows potential for simplifying administrative workflows, thus promoting cost-effectiveness and better health literacy [8]. Its implementation in emergency departments has exhibited promise in enhancing triage procedures, therefore optimising resource allocation and patient outcomes [10]. In specific settings such as dentistry, ChatGPT assists in identifying dental irregularities and enabling dental restorations [11]. Additionally, the algorithm contributes to quicker literature reviews, drug discovery processes, and data analytics in healthcare research [8]. Particularly, its function in medical specialty exams underscores its ability to assess medical knowledge [12].
Insbesondere im Bereich der medizinischen Ausbildung ist ein schnelles und starkes Wachstum zu verzeichnen. Das Chat-Generative-Pretrained-Transformer(ChatGPT)-Modell ist eine der vielversprechendsten Entwicklungen in diesem Bereich. Es handelt sich um ein Modell, das auf der Verarbeitung natürlicher Sprache basiert und in der Lage ist, Gesprächsantworten zu generieren (SOURCE). Der Nutzen von ChatGPT in der Medizin erstreckt sich auf verschiedene Bereiche: Ausbildung, Forschung, klinische Praxis und Entscheidungsfindung. In der Ausbildung und Forschung im Gesundheitswesen hat ChatGPT die Fähigkeit bewiesen, das wissenschaftliche Schreiben zu verbessern, die Fairness in der Forschung zu erhöhen und die pädagogischen Methoden zu personalisieren [8]. ChatGPT hat eine wichtige Rolle bei der Erstellung von Fallszenarien und Prüfungsfragen gespielt und dadurch den Lehrinhalt und die pädagogische Anpassungsfähigkeit verbessert [9]. Im klinischen Bereich hat ChatGPT das Potenzial, administrative Arbeitsabläufe zu vereinfachen und so die Kosteneffizienz und die Gesundheitskompetenz zu verbessern [8]. Der Einsatz in Notaufnahmen hat sich als vielversprechend erwiesen, um die Triageverfahren zu verbessern und damit die Ressourcenzuweisung und die Patientenergebnisse zu optimieren [10]. In bestimmten Bereichen wie der Zahnmedizin hilft ChatGPT bei der Erkennung von Zahnunregelmäßigkeiten und ermöglicht Zahnrestaurationen [11]. Darüber hinaus trägt der Algorithmus zu einer schnelleren Literaturrecherche, Arzneimittelentdeckung und Datenanalyse in der Gesundheitsforschung bei [8]. Insbesondere seine Funktion in medizinischen Fachprüfungen unterstreicht seine Fähigkeit, medizinisches Wissen zu bewerten [12].
However, the implementation of ChatGPT in healthcare presents certain challenges and limitations. Ethical considerations, copyright issues, and concerns regarding transparency and legality require caution [8]. Furthermore, there is a potential for bias, plagiarism, and misinformation [8]. The inclusion of cybersecurity and the risk of infodemics further complicates the issue [8]. Additionally, the technology’s performance metrics vary across medical specialties and have not yet reached a point where they can fully replace traditional diagnostic methods [13]. The quality and safety of ChatGPT responses raise concerns, which require further improvement before responsible implementation [14]. In conclusion, although ChatGPT displays diverse usefulness in healthcare education, research, and clinical practice, it is crucial to approach its correlated ethical and practical limitations with caution. Future efforts are necessary to enhance it and responsibly incorporate it into healthcare systems.
Die Umsetzung von ChatGPT im Gesundheitswesen ist jedoch mit gewissen Herausforderungen und Einschränkungen verbunden. Ethische Erwägungen, Urheberrechtsfragen und Bedenken hinsichtlich Transparenz und Legalität erfordern Vorsicht [8]. Darüber hinaus besteht die Gefahr von Verzerrungen, Plagiaten und Fehlinformationen [8]. Die Einbeziehung der Cybersicherheit und das Risiko der Infodemie verkomplizieren das Problem zusätzlich [8]. Darüber hinaus variieren die Leistungskennzahlen der Technologie je nach medizinischem Fachgebiet und haben noch nicht den Punkt erreicht, an dem sie traditionelle Diagnosemethoden vollständig ersetzen können [13]. Die Qualität und Sicherheit der ChatGPT-Antworten geben Anlass zu Bedenken, die vor einer verantwortungsvollen Implementierung weiter verbessert werden müssen [14]. Zusammenfassend lässt sich sagen, dass ChatGPT trotz seiner vielfältigen Nützlichkeit für die Ausbildung, Forschung und klinische Praxis im Gesundheitswesen mit den damit verbundenen ethischen und praktischen Einschränkungen vorsichtig umgehen muss. Zukünftige Anstrengungen sind notwendig, um es zu verbessern und verantwortungsvoll in die Gesundheitssysteme einzubinden.
There is limited research specifically looking at the performance of artificial intelligence (AI) in medical licensing examinations. Nevertheless, AI has been the subject of extensive study in relation to medical education and healthcare. A systematic review [7] found that AI is mainly used in medical education to support learning, assess student learning and review the curriculum. AI’s potential to provide feedback and a guided learning pathway, as well as decrease costs, constitutes the main reasons for its utilisation in medical education. When ChatGPT 3.5 (???) was tested on United States Medical Licensing Examination (USMLE) Step 1 and Step 2 questions, it achieved 44% and 42% accuracy on the AMBOSS sets, and 64.4% and 57.8% accuracy on the National Board of Medical Examiners (NBME) Free-Step1 and Free-Step2 questionnaires, respectively [15]. According to another study, the performance of ChatGPT on all three USMLE exams was assessed, and the model was found to meet or almost meet the pass mark without any special training or reinforcement [16].
Es gibt nur wenige Untersuchungen, die sich speziell mit der Leistung von künstlicher Intelligenz (KI) bei medizinischen Zulassungsprüfungen befassen. Dennoch ist KI Gegenstand umfangreicher Studien im Zusammenhang mit der medizinischen Ausbildung und dem Gesundheitswesen. Eine systematische Übersichtsarbeit [7] ergab, dass KI in der medizinischen Ausbildung hauptsächlich zur Unterstützung des Lernens, zur Bewertung des Lernens der Studierenden und zur Überprüfung des Lehrplans eingesetzt wird. Die Hauptgründe für den Einsatz von KI in der medizinischen Ausbildung sind das Potenzial, Feedback und einen geführten Lernpfad zu bieten sowie die Kosten zu senken. Als ChatGPT 3.5 (???) an Fragen der United States Medical Licensing Examination (USMLE) Step 1 und Step 2 getestet wurde, erreichte es eine Genauigkeit von 44 % bzw. 42 % bei den AMBOSS-Sets und eine Genauigkeit von 64,4 % bzw. 57,8 % bei den Fragebögen des National Board of Medical Examiners (NBME) Free-Step1 und Free-Step2 [15]. In einer anderen Studie wurde die Leistung von ChatGPT bei allen drei USMLE-Prüfungen bewertet, und es wurde festgestellt, dass das Modell ohne spezielles Training oder Verstärkung die Bestehensgrenze erreicht oder fast erreicht [16].
Nach einem Bericht im Ärzteblatt über einen Nature-Artikel: “Auswertungen ergaben, dass Med-PaLM von Google Research zwar um 17 % besser war, als andere aktuelle Sprachmodelle, aber teilweise immer noch nicht an die Qualität der Antworten von medizinischem Fachpersonal heranreichte. So entsprachen 92,6 % der ausführlichen Antworten von Med-PaLM dem wissenschaftlichen Konsens, was einem ähnlich hohen Niveau entsprach, wie die Antworten von Klinikern (92,9 %). 5,8 % der Antworten von Med-PaLM wurden als potenziell schädlich beurteilt, was ebenfalls vergleichbar war mit prekären Antworten von Medizinern (6,5 %). Stark Ausbaufähig ist das Modell aber noch hinsichtlich inkorrekter oder unpassender Inhalte, die mit einem Anteil von 18,7 % viel häufiger auftraten, als unter den Antworten von Fachpersonal (1,4 %). Das derzeitige Modell (Med-PaLM) zeigt einen ermutigenden Trend, bleibt aber den Klinikern unterlegen, schlussfolgern die Studienautoren.” [17]
Künstliche Intelligenz (KI) hat einen immer größeren Einfluss auf das Gesundheitswesen. Insbesondere im Bereich der medizinischen Ausbildung ist ein schnelles und starkes Wachstum zu verzeichnen. Das Modell Chat Generative Pretrained Transformer (ChatGPT) ist eine der vielversprechendsten Entwicklungen in diesem Bereich. Es ist ein auf natürlicher Sprachverarbeitung basierendes Modell mit der Fähigkeit, Gesprächsantworten zu generieren (SOURCE).
Als ChatGPT 3.5 (???) mit Fragen der United States Medical Licensing Examination (USMLE) Step 1 und Step 2 getestet wurde, erreichte es eine Genauigkeit von 44 % bzw. 42 % bei den AMBOSS-Sets und eine Genauigkeit von 64,4 % bzw. 57,8 % bei den Fragebögen des National Board of Medical Examiners (NBME) Free-Step1 und Free-Step2 [15]. In einer anderen Studie wurde die Leistung von ChatGPT bei allen drei USMLE-Prüfungen bewertet, und es wurde festgestellt, dass das Modell ohne spezielles Training oder Verstärkung die Bestehensgrenze erreicht oder fast erreicht [16]
AI models also have the ability to function effectively not only in English but in other languages as well. A study examined if ChatGPT could pass the M1 and M2 written medical state exams and answer complex medical questions in German. The results indicate that ChatGPT passed the exams after excluding image question [18]. Our research group was able to demonstrate a similar outcome. ChatGPT was able to answer 66% of all multiple-choice questions in a Progress Test, which is equivalent to the level of a state exam. These preliminary outcomes depict the efficacy of ChatGPT in answering intricate medical queries, and state medical exams are used as a model case [18]. Employing the latest models, GPT-3.5 and GPT-4, resulted in a significant surge in performance in the context of the Japanese Medical Licensure Examination (JMLE), as noted by Takagi et al. (2023). GPT-4 attained the qualifying score in the JMLE, signifying its dependability for medical knowledge and clinical reasoning in non-English languages, as mentioned by Takagi et al. (2023).
KI-Modelle sind auch in der Lage, nicht nur auf Englisch, sondern auch in anderen Sprachen effektiv zu arbeiten. In einer Studie wurde untersucht, ob ChatGPT die schriftlichen medizinischen Staatsexamina M1 und M2 bestehen und komplexe medizinische Fragen auf Deutsch beantworten kann. Die Ergebnisse zeigen, dass ChatGPT die Prüfungen nach Ausschluss der Bildfrage bestanden hat [18]. Unsere Forschungsgruppe konnte ein ähnliches Ergebnis nachweisen. ChatGPT war in der Lage, 66% aller Multiple-Choice-Fragen in einem Progress Test zu beantworten, was dem Niveau eines Staatsexamens entspricht. Diese vorläufigen Ergebnisse zeigen die Wirksamkeit von ChatGPT bei der Beantwortung komplizierter medizinischer Fragen, und staatliche medizinische Prüfungen werden als Modellfall verwendet [18]. Der Einsatz der neuesten Modelle, GPT-3.5 und GPT-4, führte zu einem signifikanten Leistungssprung im Rahmen der Japanese Medical Licensure Examination (JMLE), wie von Takagi et al. (2023) festgestellt. GPT-4 erreichte die qualifizierende Punktzahl in der JMLE, was laut Takagi et al. (2023) seine Zuverlässigkeit in Bezug auf medizinisches Wissen und Clinical Reasoning in nicht-englischen Sprachen unterstreicht.
Theoretical and/or empirical focus of the problem / Theoretische und/oder empirische Fokussierung des Problems
Information Literacy:
The ability to recognize when information is needed and to locate, evaluate, and use the needed information effectively.
Health Literacy:
Degree to which individuals have the capacity to obtain, process, and understand basic health information and services needed to make appropriate health decisions.
The importance of health literacy, defined as the degree to which individuals have the capacity to obtain, process, and understand basic health information and services needed to make appropriate health decisions, is evident in several areas of health behaviour and quality of life. Zheng et al. emphasize that low health literacy often correlates with adverse health outcomes, leading to decreased quality of life (QOL), where a pooled correlation coefficient between health literacy and QOL of 0.35 is reported [19]. Miller et al. emphasised the advantageous correlation between health literacy and medical treatment adherence in both chronic and acute ailments. Health literacy interventions elevated both health literacy (r=0.22) and adherence (r=0.16), notably in susceptible patient groups [20]. A systematic review by Kim et al. found a moderate association between eHealth literacy and health-related behaviour, using validated measures such as the eHealth Literacy Scale (eHEALS), with an overall correlation of 0.31 [21]. In summary, these studies emphasise the crucial role of health literacy as a mediator of health-promoting behaviours, treatment adherence and quality of life, and stress the requirement to integrate health literacy within health interventions and strategies.
Die Bedeutung der Gesundheitskompetenz, definiert als das Ausmaß, in dem der/die Einzelne in der Lage ist, grundlegende Gesundheitsinformationen und -dienste zu erhalten, zu verarbeiten und zu verstehen, um angemessene Gesundheitsentscheidungen zu treffen, zeigt sich in verschiedenen Bereichen des Gesundheitsverhaltens und der Lebensqualität. Zheng et al. betonen, dass eine geringe Gesundheitskompetenz häufig mit negativen gesundheitlichen Ergebnissen korreliert, was zu einer verminderten Lebensqualität (QOL) führt, wobei ein gepoolter Korrelationskoeffizient zwischen Gesundheitskompetenz und QOL von 0,35 berichtet wird [19]. Miller et al. betonten den vorteilhaften Zusammenhang zwischen Gesundheitskompetenz und medizinischer Behandlungsadhärenz sowohl bei chronischen als auch bei akuten Erkrankungen. Interventionen zur Förderung der Gesundheitskompetenz erhöhten sowohl die Gesundheitskompetenz (r=0,22) als auch die Therapietreue (r=0,16), insbesondere bei anfälligen Patientengruppen [20]. In einer systematischen Übersichtsarbeit von Kim et al. wurde ein moderater Zusammenhang zwischen elektronischer Gesundheitskompetenz und gesundheitsbezogenem Verhalten festgestellt, wobei validierte Messinstrumente wie die eHealth Literacy Scale (eHEALS) verwendet wurden, mit einer Gesamtkorrelation von 0,31 [21]. Zusammenfassend unterstreichen diese Studien die entscheidende Rolle der Gesundheitskompetenz als Vermittler von gesundheitsfördernden Verhaltensweisen, Therapietreue und Lebensqualität und betonen die Notwendigkeit, Gesundheitskompetenz in Gesundheitsmaßnahmen und -strategien zu integrieren.
Studienlage zu ChatGPT 3.5 [22] NICHT in PubMed; Letter to the editor [23] NICHT in PubMed, spanisches Journal [15] √ [24] NICHT in PubMed; Preprint [25] NICHT in PubMed; Preprint [16] √ [26] √ [27] √ [28] √
Progress tests are widely used in education because they measure learning progress at the individual, cohort, and institutional levels [29]. Also, they have a beneficial impact on learning [30]. In medical education, performance on Progress Tests correlates with performance on state exams in this respect [29].
Studienlage zu ChatGPT 4 [31] [25] [26]
Progress-Tests sind im Bildungswesen weit verbreitet, weil sie den Lernfortschritt auf individueller, kohortenbezogener und institutioneller Ebene messen [29]. Außerdem haben sie selbst einen positiven Einfluss auf das Lernen [30]. In der medizinischen Ausbildung korreliert die Leistung in den Progress Tests sogar mit dem Abschneiden in den Staatsexamina [29].