20:30 – Tréning veľkých jazykových modelov v čase chaosu dát a názorov

Téma: Technológie a inžinierstvo

Miesto konania: Stará tržnica
Čas: o 20:30 hod.
Trvanie: 30 minút

Pre koho je prednáška určená: dospelá neodborná verejnosť

*Prednáška je súčasťou bloku Architektúra chaosu*

Prednášajúci: Michal Valko, Stealth AI Startup & Inria & ENS, Chief Models Officer

Michal je Chief Models Officer v stealth startupe, držiteľ trvalého výskumného miesta v Inria a prednášajúci v magisterskom programe MVA na ENS Paris-Saclay. Michala najviac zaujíma navrhovanie algoritmov, ktoré si vyžadujú čo najmenej ľudského dohľadu. Preto sa venuje metódam a prostrediam, ktoré dokážu fungovať s minimálnou spätnou väzbou, ako sú hlboké posilňovacie učenie (deep reinforcement learning), banditné algoritmy, samo-učenie (self-supervised learning) alebo samohraní (self-play). V poslednej dobe pracoval na učení reprezentácií, modeloch sveta (world models) a hlbokých (posilňovacích) algoritmoch s teoretickým základom. V minulosti sa venoval aj sekvenčným algoritmom so štruktúrovanými rozhodnutiami, kde využitie tejto štruktúry vedie k preukázateľne rýchlejšiemu učeniu. V súčasnosti sa Michal venuje veľkým jazykovým modelom (LLMs), konkrétne návrhu algoritmických riešení pre ich škálovateľné doladenie a zosúladenie s ľudskými preferenciami. Doktorát získal v roku 2011 na University of Pittsburgh, v roku 2012 nastúpil do Inria ako trvalý výskumník a v roku 2018 spolu s Rémim Munosom založil pobočku Google DeepMind Paris. V roku 2024 sa stal hlavným inžinierom pre Llama v spoločnosti Meta, kde vybudoval online reinforcement learning infraštruktúru a výskum ktorými sa trénovala Llama 3.

 

Informácie

Michal Valko sa bude zaoberať chaosom dát a názorov, ktorý obklopuje trénovanie veľkých jazykových modelov (LLM). V prednáške ukáže nový spôsob, ako sa vysporiadať s týmto chaosom pomocou metódy Nash learning from human feedback (NLHF), ktorá hľadá rovnováhu v spleti ľudských preferencií. Prednáška priblíži, ako teória a nové algoritmy dokážu zvládnuť chaos v procesoch ladenia modelov a posunúť ich na vyššiu úroveň. Táto prednáška je pre každého, kto chce pochopiť, ako sa dá usporiadať chaos v umelej inteligencii a naučiť ju lepšie reagovať na ľudské potreby. Každý si z nej určite niečo odnesie — chaos nemusí byť prekážkou, ale výzvou, ktorú dokážeme zvládnuť.

Category: