Група изследователи открива данни за обучение на ChatGPT – Компютър – Новини

Изследователи от Google DeepMind и няколко университета са открили лесен начин за получаване на данните за обучение, използвани от ChatGPT. Като накара чатбота да повтаря определена дума за неопределено време, той разкрива, наред с други неща, лична информация.

Учените го имат във вторник хартия публикувана, която обяснява как те получават данните за обучение. „С бюджет от само $200 за ChatGPT (gpt-3.5-turbo) успяхме да извлечем над 10 000 уникални модела за обучение.“ Пишете изследователи.

Те показаха на чатбота определени думи, като например „стихотворение„, повтори той неопределено. Това принуди езиковия модел да се отклони от процедурите си за обучение и да се „върне към първоначалната цел на езиковото моделиране“ и да се възползва от детайлите в своите данни за обучение.

Данните включват данни, които идват от публичния интернет, но не непременно от публични уебсайтове. Това включва имена, телефонни номера, имейл адреси и домашни адреси. Изследователите казват, че е тревожно, че ChatGPT може лесно да бъде злоупотребен и казват, че тяхното проучване трябва да служи като „предупредителна история за тези, които обучават бъдещи модели“.

Групата учени сподели своята статия с OpenAI на 30 август и след това изчака 90 дни преди да я публикува. Конкретната атака вече не работи, но основната уязвимост все още не е разрешена, пишат изследователите.

READ  Бас ван Диел вярва, че Oh Oh Cherso е оказал трайно влияние върху холандския език Медия

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *