Twister Icon Hanein Icon Register | Login
habr_ru 14h
LLM на прокачку: практический гайд по Alignment http://habr.com/ru/companies/tochka/articles/933380 #llm #reinforcement-learning #alignment
habr_ru Aug 10
GSPO (Qwen RL Algorithm by Alibaba Cloud) http://habr.com/ru/articles/935800 #Qwen #Alibaba #GSPO #GRPO #reinforcement-learning
habr_ru Dec 28, 2024
Контекстные бандиты в ценообразовании http://habr.com/ru/companies/X5Tech/articles/870012 #reinforcement-learning #machine-learning
habr_ru Oct 21, 2024
Мультимодальные приложения на Llama 3.2 и Llama Stack http://habr.com/ru/articles/852168 #mlops #нейронные_сети #reinforcement-learning