Nie ufaj „ChatBotom” w kwestiach zdrowia: wielu użytkowników wciąż pokłada w sztucznej inteligencji złudne nadzieje.

Drodzy stali Czytelnicy a także Goście naszego portalu, nasz projekt funkcjonuje przede wszystkim dzięki Waszemu wsparciu i zaufaniu.

W teście wzięło udział 21 głównych modeli językowych, w tym systemy od OpenAI, Anthropica, Google’a, xAI oraz DeepSeeka. Wyniki były alarmujące. Powyżej 80% błędów – taki wynik odnotowały wszystkie modele w sytuacjach wymagających diagnostyki różnicowej (czyli sporządzenia listy możliwych schorzeń przy niepełnych danych). Poniżej 40% błędów – do tego poziomu spadła awaryjność dopiero po dostarczeniu kompletnych informacji. W fazie ostatecznej diagnozy najlepsze modele osiągnęły skuteczność przekraczającą 90%.

Michael Peel z Financial Times ostrzega: „Nie polegaj na swoim ulubionym chatbocie AI w sprawach dotyczących zdrowia. Jeśli system nie potrafi dostarczyć precyzyjnych informacji, nie oczekuj od niego trafnej diagnozy. Mimo ostrzeżeń wyświetlanych przez wszystkie modele AI, by konsultować się z lekarzem, wielu użytkowników wciąż pokłada w sztucznej inteligencji złudne nadzieje”.

Chatboty AI zawodzą w obszarze diagnoz medycznych, zwłaszcza gdy dysponują niepełnymi informacjami. Potwierdza to nowe badanie, które podkreśla ryzyko traktowania algorytmów jako „cyfrowych lekarzy”. Z analizy wynika, że wiodące duże modele językowe (LLM) mają trudności z opracowaniem szerokiego spektrum możliwych diagnoz w sytuacjach, gdy dane pacjenta są ograniczone. W takich przypadkach sztuczna inteligencja zbyt szybko skłania się ku jednej, często błędnej odpowiedzi.

Wyniki te wskazują na fundamentalne ograniczenie technologii: choć chatboty świetnie radzą sobie z identyfikacją chorób przy pełnym opisie przypadku, stają się skrajnie zawodne na wczesnych, niepewnych etapach podejmowania decyzji klinicznych. Poleganie wyłącznie na AI przy niejasnych lub niekompletnych danych wprowadzanych przez użytkownika jest po prostu niebezpieczne.

„Modele te doskonale radzą sobie z postawieniem ostatecznej diagnozy, gdy wszystkie dane są już na stole. zawodzą jednak na samym początku sprawy, gdy dostępnych informacji jest niewiele.”

Wyjaśnia Arya Rao, główna autorka badania i badaczka w systemie opieki zdrowotnej Mass General Brigham w Massachusetts.

Badanie, opublikowane w poniedziałek w czasopiśmie „JAMA Network Open”, polegało na przetestowaniu sztucznej inteligencji na 29 studiach przypadków klinicznych, opartych na standardowych podręcznikach medycznych. Eksperyment polegał na stopniowym ujawnianiu danych: od historii choroby, przez wyniki badań fizykalnych, aż po testy laboratoryjne. Naukowcy mierzyli wskaźnik błędów, rozumiany jako odsetek odpowiedzi, które nie były w pełni poprawne.

W teście wzięło udział 21 głównych modeli językowych, w tym systemy od OpenAI, Anthropica, Google’a, xAI oraz DeepSeeka. Wyniki były alarmujące. Powyżej 80% błędów – taki wynik odnotowały wszystkie modele w sytuacjach wymagających diagnostyki różnicowej (czyli sporządzenia listy możliwych schorzeń przy niepełnych danych). Poniżej 40% błędów – do tego poziomu spadła awaryjność dopiero po dostarczeniu kompletnych informacji. W fazie ostatecznej diagnozy najlepsze modele osiągnęły skuteczność przekraczającą 90%.

Twórcy modeli odpierają zarzuty, wskazując na wbudowane zabezpieczenia. Anthropic wyjaśnia, że „Claude” jest szkolony tak, by kierować użytkowników do specjalistów. Google deklaruje, że „Gemini” zawiera wyraźne komunikaty zachęcające do weryfikacji informacji, a OpenAI w swoich wytycznych wprost zakazuje wykorzystywania ich usług do udzielania profesjonalnych porad medycznych bez udziału licencjonowanego lekarza. Przedstawiciele xAI oraz DeepSeeka nie skomentowali wyników.

Równolegle firmy rozwijają wyspecjalizowane modele medyczne, takie jak „AMIE” (Google) czy „MedFound”. Choć wstępne wyniki tych projektów są obiecujące, eksperci pozostają sceptyczni co do pełnego zastąpienia lekarzy. Sanjay Kinra, epidemiolog kliniczny z London School of Hygiene & Tropical Medicine, podkreśla, że ocena medyczna w dużej mierze opiera się na bezpośrednim kontakcie, wyglądzie i ogólnym stanie pacjenta – aspektach, których AI nie jest w stanie w pełni ocenić. „Mimo to technologia ta może odegrać ważną rolę w regionach o ograniczonym dostępie do opieki zdrowotnej” – dodaje Kinra. „Właśnie dlatego pilnie potrzebujemy dalszych badań z udziałem prawdziwych pacjentów w takich środowiskach”.

Autor: Aurelia

Na podstawie: UncutNews.ch

Fot. Pixabay.com / BrianPenny

Źródło: WolneMedia.net

Tags: medycyna, sztuczna inteligencja

Nie ufaj „ChatBotom” w kwestiach zdrowia: wielu użytkowników wciąż pokłada w sztucznej inteligencji złudne nadzieje.

Oś oporu kontra Zachodni dyktat: prawdziwe oblicze konfliktu w Cieśninie Ormuz i walka o suwerenny Bliski Wschód.

„Wielki Brat” i „Nowy Porządek Świata”, czyli technologia i manipulacja edukacją jako realizacja Proroctw Apokalipsy.

Próba generalna nadchodzącego systemu uwielbienia: złote pomniki i paszporty z wizerunkiem przywódcy to „zapowiedź”.

Dodaj komentarz Anuluj pisanie odpowiedzi

„Pride Land” nad Morzem Martwym: Izrael organizuje festiwal LGBTQ+ w miejscu biblijnej kary za grzech Sodomy.

W cieniu góry Ararat: odkrycie Arki Noego to jedno z ostatnich ostrzeżeń dla współczesnego świata.

Dlaczego D. Trump i S. Spielberg prowadzą nas ku granicy między Prawdą Biblijną a technologicznym okultyzmem?

Globalny mechanizm kontroli: „Prawa Noachickie” stanowią fundament pod zapowiadaną w proroctwach jedną światową religię.

Oś oporu kontra Zachodni dyktat: prawdziwe oblicze konfliktu w Cieśninie Ormuz i walka o suwerenny Bliski Wschód.

„Wielki Brat” i „Nowy Porządek Świata”, czyli technologia i manipulacja edukacją jako realizacja Proroctw Apokalipsy.

Próba generalna nadchodzącego systemu uwielbienia: złote pomniki i paszporty z wizerunkiem przywódcy to „zapowiedź”.

Analiza raportów CDC i HHS: zarzuty o systematyczne bagatelizowanie sygnałów ostrzegawczych dotyczących „szczepionek” mRNA.

Większe straty, niż przyznaje Waszyngton: raport NBC ujawnia prawdziwy bilans irańskich ataków na bazy USA.

Oś oporu kontra Zachodni dyktat: prawdziwe oblicze konfliktu w Cieśninie Ormuz i walka o suwerenny Bliski Wschód.

„Wielki Brat” i „Nowy Porządek Świata”, czyli technologia i manipulacja edukacją jako realizacja Proroctw Apokalipsy.

Architekci „Cienia” w Masonerii: metafizyczna hierarchia „Niewidzialnych Zwierzchników” i tajemnica „Ciała Węża”.

Próba generalna nadchodzącego systemu uwielbienia: złote pomniki i paszporty z wizerunkiem przywódcy to „zapowiedź”.

Analiza raportów CDC i HHS: zarzuty o systematyczne bagatelizowanie sygnałów ostrzegawczych dotyczących „szczepionek” mRNA.

Więcej publikacji z tej kategorii:

Dodaj komentarz Anuluj pisanie odpowiedzi

Publikacje, które mogłeś przeoczyć!