![]() ![]() |
Register | Login |
![]() |
habr_ru | 14h |
LLM на прокачку: практический гайд по Alignment http://habr.com/ru/companies/tochka/articles/933380 #llm #reinforcement-learning #alignment | ||
![]() |
habr_ru | Aug 10 |
GSPO (Qwen RL Algorithm by Alibaba Cloud) http://habr.com/ru/articles/935800 #Qwen #Alibaba #GSPO #GRPO #reinforcement-learning | ||
![]() |
habr_ru | Dec 28, 2024 |
Контекстные бандиты в ценообразовании http://habr.com/ru/companies/X5Tech/articles/870012 #reinforcement-learning #machine-learning | ||
![]() |
habr_ru | Oct 21, 2024 |
Мультимодальные приложения на Llama 3.2 и Llama Stack http://habr.com/ru/articles/852168 #mlops #нейронные_сети #reinforcement-learning |