![cover_sfi19.png](/media/images/cover_sfi19.max-1920x600.format-jpeg.jpegquality-70.jpg)
19 edycja
Studenckiego Festiwalu Informatycznego
![cover_sfi19.png](/media/images/cover_sfi19.max-1920x600.format-jpeg.jpegquality-70.jpg)
19 edycja
2024
Exploiting Novel GPT-4 APIs, czyli jak zaatakować GPT-4
Edycja: 19. Studencki Festiwal Informatyczny
Data: 5 kwietnia 2024 21:00
Typ: Lightning Talki
Kategoria: SI
![cover_sfi19.png](/media/images/cover_s.2e16d0ba.fill-350x350.format-jpeg.jpegquality-70.jpg)
Prelegent
Abstrakt
Duże modele językowe takie jak GPT-4 są podatne na włamania (tzw. jailbreaks), które zmuszają je do odpowiedzi w niebezpieczny, kontrowersyjny lub toksyczny sposób. Opowiem o projekcie, gdzie wykorzystaliśmy niestandardowe API modeli językowych, takie jak np. fine-tuning, by znaleźć kolejne podatności tych modeli. Zmusiliśmy je m. in. do tworzenia teorii spiskowych i ujawniania adresów e-mail prawdziwych osób.
Czas trwania
30 min