Damian Popilowski 14.05.2026 13:28

Plaga halucynacji AI w literaturze medycznej. Tysiące fikcyjnych cytatów

Plaga halucynacji AI w literaturze medycznej, fot.Canva

W ramach audytu przeprowadzonego przy pomocy sztucznej inteligencji przez Szkołę Pielęgniarstwa Uniwersytetu Columbia stwierdzono, że prawie 3000 recenzowanych artykułów medycznych zawiera sfabrykowane cytaty, których nie ma w naukowych bazach danych. Od połowy 2024 roku odsetek ten gwałtownie wzrósł wraz z rosnącą popularnością narzędzi do pisania opartych na sztucznej inteligencji. Ta niepokojąca tendencja zagraża rzetelności badań naukowych i opiece nad pacjentami, co skłoniło wydawców do weryfikacji odniesień oraz wdrożenia systemów służących do śledzenia i korygowania fałszywych cytatów.

Przeanalizowano 2,5 miliona publikacji, w których sztuczna inteligencja zidentyfikowała 4046 fałszywych cytowań obecnych w 2810 artykułach badawczych
Skala zjawiska wykazuje drastyczną tendencję rosnącą – zanotowano dwunastokrotny wzrost występowania sfabrykowanych źródeł od początku 2023 roku do początku roku 2026
Problem najsilniej dotyka artykułów przeglądowych, w których wskaźnik fabrykacji danych jest o 57% wyższy w porównaniu do standardowych prac empirycznych

Skala zjawiska i rosnący udział sztucznej inteligencji

Zespół badawczy pod kierownictwem Maxima Topaza z Instytutu Danych Naukowych Uniwersytetu Columbia zaprojektował zautomatyzowany system weryfikacji. Narzędzie przeanalizowało wyselekcjonowany zbiór w standardzie Open Access z bazy PubMed Central, badając artykuły dodane do archiwum w okresie od 1 stycznia 2023 roku do 18 lutego 2026 roku. Głównym celem operacji było strukturalne sprawdzenie wiarygodności literatury wykorzystywanej do uwiarygodniania tez medycznych.

Ostateczne wyniki weryfikacji opublikowane na łamach prestiżowego czasopisma The Lancet wykazują, że spośród 97,1 miliona skatalogowanych odniesień, ponad cztery tysiące okazało się czystą halucynacją. Odkrycie to jest szczególnie trudne do wychwycenia, ponieważ wygenerowane cytaty poprawnie formatują nazwiska prawdziwych naukowców operujących w danej dziedzinie i przypisują im wysoce wiarygodne tytuły w autentycznych czasopismach. Mimo nienagannego wyglądu ostateczna kompilacja tych danych kreuje całkowicie nieistniejący twór, którego nie da się zlokalizować w jakiejkolwiek ewidencji literatury.

Zestawienie czasowe incydentów wskazuje na silną zbieżność między upowszechnieniem dużych modeli językowych a erozją tekstów akademickich. Przez cały rok 2023 współczynnik włączeń utrzymywał się w stałych proporcjach, charakteryzując się jednym sfabrykowanym źródłem przypadającym na 2828 prac badawczych. Rok 2025 przyniósł skok do jednej na 458 publikacji, natomiast w pierwszych siedmiu tygodniach 2026 roku problem eskalował, obejmując jedno na 277 wydanych badań.

Struktura fabrykacji skupia się głównie na pojedynczych przeoczeniach autorskich. Zdecydowana większość, opisywana jako 91% zakażonych tekstów, miała wpisane od jednego do dwóch zmyślonych adresów bibliograficznych. Oprogramowanie analityczne wyodrębniło zarazem 246 artykułów cechujących się co najmniej trzema takimi rekordami. Skrajny przypadek wyłapany przez naukowców ze Szkoły Pielęgniarstwa Uniwersytetu Columbia dotyczył tekstu badawczego, w którym aż 18 z 30 zastosowanych cytowań powstało bez jakiegokolwiek pokrycia w dorobku naukowym.

Zagrożenie dla praktyki klinicznej i integralności dowodów

Zanieczyszczenie archiwów literatury medycznej implikuje wysoce wymierne i niebezpieczne skutki dla systemu zdrowia publicznego, burząc paradygmat medycyny opartej na dowodach. Zgodnie z konkluzjami międzynarodowej grupy audytorów, w tym ekspertów merytorycznych z Uniwersytetu Wschodniej Finlandii, najcięższe naruszenia gromadzą się wokół obszernych artykułów przeglądowych. To właśnie one stanowią podwaliny pod definiowanie reguł postępowania w lecznictwie.

Rozsiane we wczesnych fazach fałszywe odnośniki są bezrefleksyjnie przenoszone przez kolejnych autorów do powiązanych tematycznie przeglądów systematycznych. Tego typu prace podsumowujące są następnie wykorzystywane przez państwowe organy jako twarda podstawa do zatwierdzania rygorystycznych wytycznych klinicznych. Przerwanie logicznego łańcucha weryfikacji prowadzi do ryzyka, że czynni lekarze opierają kluczowe wybory na temat zdrowia i życia obywateli na wynikach nieistniejących prób badawczych.

– Pracownik medyczny lub twórca wytycznych klinicznych nie ma możliwości zorientowania się, że dowody, na których się opiera, nie istnieją.

Oceniając horyzont zagrożeń, Mohammad Hosseini, ekspert ds. etyki badawczej i recenzent cytowany przez analityczny portal Retraction Watch, określił rezultaty audytu jako wyłowienie najprostszego problemu. Z jego perspektywy ewidentne, całkowicie zmyślone halucynacje są tylko preludium do uszkodzeń nauki. Uznaje on za równie destrukcyjne posiłkowanie się programami, które nie kreują zupełnej fikcji, lecz włączają do obiegu dane tendencyjne, niekompletne statystyki lub manipulacje kontekstem pod egidą prawdziwych nazwisk.

Reakcja wydawnictw i konieczność wprowadzenia procedur weryfikacyjnych

Zestawienie bezprecedensowego wskaźnika fałszerstw z pasywną reakcją infrastruktury wydawniczej ujawniło lukę w zabezpieczeniach nadzoru akademickiego. Po podsumowaniu skanowania przez zespół Maxima Topaza w lutym 2026 roku, potwierdzono, że do tamtej pory blisko 98,4% zmanipulowanych artykułów było nadal nienaruszonych. Redakcje i wydawnictwa zarządzające czasopismami powstrzymały się zarówno od wprowadzania niezbędnych korekt, jak i od retrakcji zdyskredytowanych manuskryptów.

Aby zneutralizować ekspansję fałszywych tez, autorzy badania wzywają korporacje wydawnicze oraz operatorów indeksujących do wdrożenia bezwzględnych standardów technicznych przy procedowaniu nowych manuskryptów. Pakiet fundamentalnych modyfikacji zaplecza analitycznego wymusza między innymi:

systemową kontrolę każdego przypisu literaturowego przy użyciu zautomatyzowanych bramek anty-halucynacyjnych na poziomie wgrywania pliku,
bezwzględne obligatoryjne ujęcie ustrukturyzowanych metadanych do dokumentacji, gwarantujące jawną i powszechną sprawdzalność,
wykreowanie wydzielonej grupy tematycznej dla sfabrykowanych referencji operujących w ramach rejestrów dbających o poprawność metodologiczną.

Autorzy audytu apelują o podjęcie wielkoskalowego, wstecznego skanowania całych dotychczasowych archiwów naukowych. W sytuacji, w której wykazano bezpośredni wpływ sfabrykowanej bazy referencyjnej na ogłoszone rozstrzygnięcia medyczne opisanego eksperymentu, wydawnictwo ma obowiązek wycofać materiał ze skutkiem natychmiastowym celem uchronienia środowiska przed asymilacją błędów.

– Szkody zostały już wyrządzone. Skażenie ponad czterema tysiącami sfabrykowanych cytowań, które znalazł nasz zespół, nie znika, gdy sztuczna inteligencja staje się lepsza.

Źródło: Pacjenci.pl

Tagi: Badania lekarskie badania genetyczne badania krwi