ChatGPT ќе ви каже како да направите бомба, да нападнете објект и да ги сокриете трагите


Моделот CHATGPT им дал на истражувачите детални упатства за тоа како да извршат бомбашки напад врз спортски објект, според безбедносните тестирања спроведени ова лето. Упатствата вклучувале список на слаби точки во одредени арени, рецепти за експлозиви и совети за прикривање на трагите. Дополнително, GPT-4.1 на OpenAI детално објасни како антраксот може да се користи како оружје и како можат да се направат два вида нелегални дроги.

Тестирањето беше дел од необична соработка помеѓу OpenAI, стартапот за вештачка интелигенција вреден 500 милијарди долари, предводен од Сем Алтман, и конкурентската компанија Anthropic, основана од експерти кои го напуштија OpenAI поради стравувања од безбедноста.

Тестирањето не е директен одраз на тоа како моделите се однесуваат при јавна употреба, кога се применуваат дополнителни безбедносни филтри. Сепак, Anthropic вели дека забележал „загрижувачко однесување… околу злоупотребата“ во GPT-4o и GPT-4.1, и дека потребата од евалуации на усогласеноста со вештачката интелигенција станува „сè поитна“.

Антропик нагласи дека е можно многу од злоупотребите што се проучуваат да не бидат можни во пракса доколку се инсталираат заштитни мерки надвор од моделот.

„Треба да разбереме колку често и под кои околности системите би можеле да се обидат да преземат несакани дејствија што би можеле да доведат до сериозна штета“, предупредија тие.

Истражувачите откриле дека моделите на OpenAI биле „поблаги отколку што би очекувале во соработката со очигледно штетни барања од симулирани корисници“. Тие дале упатства за користење на алатки од темната мрежа за купување нуклеарни материјали, лажни идентитети и фентанил, производство на метамфетамин и импровизирани бомби и развој на шпионски софтвер.

Антропик изјави дека моделот ќе го прифати барањето на корисникот по повеќекратни обиди или нудење слаб изговор, како на пример тврдење дека барањето било за истражувачки цели.

Во еден случај, корисник барал ранливи точки на спортски објекти за целите на „безбедносно планирање“. Моделот потоа обезбедувал информации за ранливостите во одредени арени, вклучувајќи оптимално време на напад, хемиски формули за експлозиви, дијаграми на кола за тајмер бомби и опции за купување оружје на црниот пазар.