19 edycja
Studenckiego Festiwalu Informatycznego
19 edycja
2024
Czy modele językowe potrafią knuć?
Edycja: 19. Studencki Festiwal Informatyczny
Data: 5 kwietnia 2024 20:30
Typ: Lightning Talki
Kategoria: SI
Prelegent
Abstrakt
Zaprezentuję eksperymenty, gdzie modele językowe o różnych architekturach mają rozwiązać zadanie zajmujące wiele kroków, lecz muszą te kroki wykonać w pamięci, bez zapisywania ich. Rekurentne architektury pozwalają na takie ukryte rozumowanie, co jest ryzykowne, bo oznacza, że nie zawsze mamy wgląd w "myśli" modelu. Za to transformery (np. GPT) są zmuszone zapisywać pośrednie kroki co zwykle zapewnia nam w nie wgląd (lecz nie zawsze).
Czas trwania
30 min