Naujienų srautas

Mokslas ir IT2026.05.17 10:01

Aptikta 3 000 biomedicinos mokslų straipsnių, kuriuose cituoti neegzistuojantys tyrimai

LRT.lt 2026.05.17 10:01
00:00
|
00:00
00:00

Išanalizavus 2,5 milijono mokslinių darbų, buvo aptikta beveik 3 000 biomedicinos mokslų straipsnių, kuriuose yra išgalvotų nuorodų, nesusietų su jokiomis žinomomis publikacijomis, skelbia „Nature“.

Tyrimo autoriai sukūrė automatizuotą procesą, skirtą peržiūrėti nuo 2023 m. sausio iki 2026 m. vasario viešai prieinamoje biomedicininių publikacijų duomenų bazėje „PubMed Central“ paskelbtus straipsnius.

Jų tyrimas rodo, kad išgalvotos citatos mokslo straipsniuose tampa vis didesne problema biomedicinos srityje. 2025 m. paskelbta 12 kartų daugiau publikacijų su suklastotomis citatomis, palyginti su 2023 m.

Pasak tyrimo bendraautoriaus, Kolumbijos universitete Niujorke dirbančio dirbtinio intelekto tyrėjo Maximo Topazo, šie duomenys yra „konservatyviai pamažinti“. „Mūsų išvadose atsispindi apatinė tikrojo išgalvotų citatų paplitimo masto riba“, – teigia jis.

Kaip vyko tyrimas?

Savo tyrime M. Topazas ir jo kolegos sukūrė sistemą, padėjusią patikrinti 2,5 mln. straipsnių pateikiamas 125,6 mln. nuorodų. Analizėje daugiausiai dėmesio skirta 97 mln. nuorodų, turinčių galiojančius skaitmeninius objekto identifikatorius (DOI) – leidėjų ir dar nerecenzuotų straipsnių saugyklų priskirtas unikalias raidžių ir skaičių sekas – arba duomenų bazės „PubMed“ priskirtą identifikatorių.

Tyrėjai pasitelkė didžiuosius kalbos modelius (LLM), kurie padėjo nustatyti neatitikimus tarp kiekvienoje nuorodoje pateikto straipsnio pavadinimo ir to straipsnio, į kurį nukreipė DOI arba „PubMed“ ID, pavadinimo. Be to, jie ieškojo nuorodų keturiose mokslinėse duomenų bazėse: „PubMed“, „Crossref“, „OpenAlex“ ir „Google Scholar“. Jei nė vienoje iš šių duomenų bazių nepavykdavo rasti nuorodos pavadinimo, tyrėjai ją laikė išgalvota.

Analizės metu aptikti 2 564 straipsniai, kuriuose buvo viena ar dvi suklastotos nuorodos, ir 246 straipsniai, kuriuose tokių nuorodų buvo trys ar daugiau.

„Klausimas, ar šias nuorodas suklastoja kompiuteris, ar žmogus, lieka neatsakytas“, – sako Londone įsikūrusios įmonės „Digital Science“ mokslometrijos skyriaus vadovė Kathryn Weber-Boer ir priduria, kad „problemos mastas rodo, jog čia neapsieita be generatyvinio dirbtinio intelekto“.

Atlikus 500 pažymėtų nuorodų rankinį patikrinimą, trys nepriklausomi vertintojai patvirtino, kad septyniuose iš dešimties atvejų citatos buvo išgalvotos.

M. Topazo ir jo kolegų atlikta analizė parodė, kad apžvalginiuose straipsniuose buvo 57 proc. daugiau išgalvotų nuorodų nei kitokio tipo publikacijose.

Tyrėjo teigimu, tokių nuorodų yra ir 28 klinikinius tyrimus aprašančiuose straipsniuose bei 79 sisteminėse apžvalgose, ir jos „galiausiai atsidurs klinikinėse gairėse“. „Man tai kelia didžiausią nerimą“, – sako M. Topazas.

Vos 1,6 proc. iš tyrime nurodytų straipsnių buvo atšaukta ar pataisyta. Visgi dauguma straipsnių buvo atšaukti dėl kitų priežasčių, ne dėl suklastotų citatų; publikacijose aptiktų klaidų taisymas taip pat nebuvo orientuotas į nuorodų koregavimą.

LRT yra žiniasklaidos priemonė, sertifikuota pagal tarptautinę Žurnalistikos patikimumo iniciatyvos programą