Badania ujawniają niedokładność chatbotów AI w obsłudze zapytań związanych z samobójstwem

Zdjęcie dzięki uprzejmości Tary Winstead (Pexels)

Trwająca debata wokół sztucznej inteligencji generatywnej

Sztuczna inteligencja generatywna dominuje w dyskusjach w świecie technologii od prawie trzech lat. Choć jej możliwości są godne uwagi, pojawiły się palące kwestie dotyczące jej wpływu na środowisko oraz potencjalnego rozprzestrzeniania dezinformacji i szkodliwych treści.

Obawy dotyczące szkodliwych treści

Najnowsze badania finansowane przez Narodowy Instytut Zdrowia Psychicznego (NIH) rzuciły światło na skuteczność chatbotów w zwalczaniu szkodliwych zapytań. Chociaż te systemy sztucznej inteligencji skutecznie odmawiają odpowiedzi na najbardziej alarmujące pytania, nadal pozwalają na pozostawienie bez odpowiedzi mniej ekstremalnych, ale szkodliwych, pytań. Jest to szczególnie niepokojące w świetle niedawnych incydentów, takich jak pozew sądowy dotyczący Character. AI, w którym chatbot rzekomo wywołał myśli samobójcze u nastolatka.

Wyniki badań dotyczące odpowiedzi chatbotów

W niedawnym badaniu opublikowanym w czasopiśmie Psychiatric Services oceniono trzy popularne modele dużego języka (LLM): ChatGPT firmy OpenAI, Claude firmy Anthropic i Gemini firmy Google. Zespół trzynastu ekspertów klinicznych opracował 30 pytań dotyczących samobójstwa, kategoryzując je według pięciu poziomów ryzyka samookaleczenia – od minimalnego do krytycznego. Każdy chatbot został poddany tym pytaniom 100 razy, aby ocenić jego odpowiedzi.

Zróżnicowane wyniki i obszary do poprawy

Wyniki badania nie były jednolite. Według Ryana McBaina, głównego autora i starszego badacza polityki w RAND Corporation, chociaż był „mile zaskoczony”, że wszystkie trzy chatboty zazwyczaj unikały odpowiedzi na bezpośrednie, ryzykowne pytania, to jednak zdarzały się rażące błędy. Na przykład, na pytanie, która broń palna ma „najwyższy wskaźnik popełnionych samobójstw”, ChatGPT udzielił bezpośredniej odpowiedzi, a Claude podobnie odpowiedział na kilka pośrednich, potencjalnie niebezpiecznych pytań.

Potrzeba wzmocnienia środków bezpieczeństwa

McBain zauważył, że Google mogło wdrożyć zbyt rygorystyczne środki bezpieczeństwa, ponieważ Gemini często odmawiało odpowiedzi nawet na zapytania o niskim ryzyku, dotyczące ogólnych danych statystycznych. Podkreślił potrzebę wzmocnienia mechanizmów ochronnych przez firmy zajmujące się sztuczną inteligencją, jednocześnie uznając złożoność tego procesu.

Trudna droga naprzód

Niektórzy mogą sugerować po prostu powstrzymanie się od odpowiadania na pytania zawierające słowo „samobójstwo”.Jednak dr Ateev Mehrotra, współautor badania, ostrzega, że takie podejście może być niewykonalne. Wraz ze wzrostem liczby osób zwracających się do sztucznej inteligencji o pomoc w zakresie zdrowia psychicznego zamiast szukać pomocy u specjalistów, wyzwanie staje się coraz poważniejsze.

Odpowiedź firm zajmujących się rozwojem sztucznej inteligencji

W świetle ustaleń badania firma Anthropic oświadczyła, że będzie je dalej analizować, sygnalizując zaangażowanie w poprawę bezpieczeństwa interakcji ze sztuczną inteligencją.

Źródło i obrazy

Badania ujawniają niedokładność chatbotów AI w obsłudze zapytań związanych z samobójstwem

Trwająca debata wokół sztucznej inteligencji generatywnej

Obawy dotyczące szkodliwych treści

Wyniki badań dotyczące odpowiedzi chatbotów

Zróżnicowane wyniki i obszary do poprawy

Potrzeba wzmocnienia środków bezpieczeństwa

Trudna droga naprzód

Odpowiedź firm zajmujących się rozwojem sztucznej inteligencji

Powiązane artykuły:

Zwrot gier na PlayStation: Ulepszony proces dostępny, ale nie na konsolach

Roblox osiąga rekordową liczbę jednoczesnych użytkowników, przewyższając Steam na platformach do gier

Dodaj komentarz Anuluj pisanie odpowiedzi