![cover_sfi19.png](/media/images/cover_sfi19.max-1920x600.format-jpeg.jpegquality-70.jpg)
19 edycja
Studenckiego Festiwalu Informatycznego
![cover_sfi19.png](/media/images/cover_sfi19.max-1920x600.format-jpeg.jpegquality-70.jpg)
19 edycja
2024
Czy modele językowe potrafią knuć?
Edycja: 19. Studencki Festiwal Informatyczny
Data: 5 kwietnia 2024 20:30
Typ: Lightning Talki
Kategoria: SI
![cover_sfi19.png](/media/images/cover_s.2e16d0ba.fill-350x350.format-jpeg.jpegquality-70.jpg)
Prelegent
Abstrakt
Zaprezentuję eksperymenty, gdzie modele językowe o różnych architekturach mają rozwiązać zadanie zajmujące wiele kroków, lecz muszą te kroki wykonać w pamięci, bez zapisywania ich. Rekurentne architektury pozwalają na takie ukryte rozumowanie, co jest ryzykowne, bo oznacza, że nie zawsze mamy wgląd w "myśli" modelu. Za to transformery (np. GPT) są zmuszone zapisywać pośrednie kroki co zwykle zapewnia nam w nie wgląd (lecz nie zawsze).
Czas trwania
30 min