cover_sfi19.png

19 edycja

Studenckiego Festiwalu Informatycznego

cover_sfi19.png

19 edycja

2024

Następny wyraz na wagę złota, czyli o tym, jak działają modele językowe i jak zbudować własne ChatGPT

Edycja: 18. Studencki Festiwal Informatyczny

Data: 30 marca 2023 15:30

Typ: Wykłady

Kategoria: AI & data

Język: Polski

kwadrat1.png
Abstrakt

Celem wykładu jest zaprezentowanie najważniejszych metod i modeli wykorzystywanych do trenowania dużych modeli językowych. Wykład rozpocznie się od przedstawienia kluczowego mechanizmu wykorzystywanego przez sieci neuronowe posiadające zdolność analizy i syntezy tekstu, tj. modelowania języka w wersji kauzalnej i maskowanej. Następnie przedstawiony zostanie najistotniejszy mechanizm sieci neuronowych typu transformer, czyli mechanizm atencji. Zostanie on porównany z innymi architekturami neuronalnymi, w szczególności sieciami rekurencyjnymi. W kolejnej części wykładu autor przedstawi działanie mechanizmu RLHF, stojącego za spektakularnym sukcesem narzędzia ChatGPT. Autor wskaże również najistotniejsze przeszkody związane z „chałupniczym” tworzeniem modeli językowych. Wykład zostanie zakończony rozważaniami dotyczącymi kwestii prawnych związanych z tworzeniem sztucznej inteligencji, w tym w szczególności ochroną praw autorskich.

Czas trwania
60 min