Российские ученые создали новый алгоритм обучения искусственного интеллекта (ИИ) под названием ReBRAC, который работает в четыре раза быстрее и на 40% качественнее по сравнению с существующими аналогами. Об этом сообщают Известия.
Эксперименты с алгоритмом проводились на робототехнических симуляторах. Результаты показали, что ReBRAC не только ускоряет процесс обучения ИИ, но также эффективно решает проблему его дообучения, что особенно важно, так как искусственный интеллект часто медленно адаптируется к новым условиям.
Примером преимущества ReBRAC Колесников привел ситуацию с роботом, обученным передвигаться по траве. При перемещении на лед он обычно теряет устойчивость, но благодаря новому алгоритму, ИИ способен лучше учиться на ходу и адаптироваться к изменяющимся условиям.
Алгоритм ReBRAC был разработан командой ученых лаборатории Tinkoff Research. Они выявили четыре компонента, которые ранее рассматривались как второстепенные и не подвергались подробному анализу: глубина нейронных сетей, регуляризация актора и критика, увеличение эффективного горизонта планирования и использование нормализации слоев (LayerNorm).
Результаты исследования были представлены на конференции по машинному обучению NeurIPS в Новом Орлеане, США, с 10 по 16 декабря. Кроме алгоритма ReBRAC, российские ученые представили две открытые библиотеки в области офлайн-обучения с подкреплением (Offline RL, ORL), которые облегчают специалистам по ИИ воспроизводить результаты научных работ.