Российский алгоритм CatBoost от «Яндекса» оказался одним из самых популярных инструментов машинного обучения. Американское издание Marktechpost проанализировало пять тысяч научных статей из семейства британского журнала Nature и подготовило отчет.
CatBoost изначально разрабатывали для улучшения результатов поисковой выдачи «Яндекса», сейчас компания применяет его и в других сервисах, например в «Музыке», «Погоде» и «Маркете». В общий доступ он был выложен в 2017 году.
Подобные CatBoost алгоритмы применяются для решения различного рода задач. Среди прочего это анализ массивов данных, который нужен для проведения качественной научной работы. Разработка от «Яндекса» применялась в различных областях: от социальных и прикладных наук до медицинских тем. Например, как следует из отчета, ученые из Сербии использовали российский алгоритм, чтобы спрогнозировать свойства керамической плитки на этапе обжига, в Польше рассчитывали риск преждевременных родов, а в США с его помощью проводили диагностику болезни Альцгеймера.
Российские разработки и раньше признавались одними из лучших, отмечает сооснователь и директор по развитию компании по производству роботов Promobot Олег Кивокурцев:
Олег Кивокурцев сооснователь и директор по развитию компании по производству роботов Promobot «У разных разработчиков в разных странах разные подходы и инструменты для анализа данных. В математике, которая является основополагающей наукой в машинном обучении, существует множество способов решить одну и ту же задачу. И в некоторых случаях «Яндекс» действительно способен конкурировать, а в некоторых случаях даже делать лучше, чем иностранные решения. И это всегда было так: и пять, и шесть, и десять лет назад инструменты «Яндекса» участвовали в подборках лучших решений в области machine learning и таковыми продолжают оставаться».
Однако все же лидерами в области машинного обучения остаются Соединенные Штаты, так как большинство научных работ используют американские разработки, и Китай, на долю которого приходится наибольшее количество публикаций на тему машинного обучения. Список неамериканских алгоритмов, широко использующихся в науке, довольно небольшой. Помимо российского CatBoost, в него вошли разработки из Германии, Франции, Великобритании и Канады.
То, что российский алгоритм вполне конкурентоспособен на фоне санкций, — это отличный показатель, считает генеральный директор «А-Я эксперт», старший преподаватель кафедры «Кибернетика» НИЯУ МИФИ Роман Душкин:
Роман Душкин генеральный директор «А-Я эксперт», старший преподаватель кафедры «Кибернетика» НИЯУ МИФИ «Финансы, конечно, решают. Но второй аспект, который решает, — это, естественно, школа и мозги. «Яндекс» пользуется российской инженерной школой, научной школой. Я это могу сказать на 100%, потому что «Яндекс» пылесосит рынок, как никто другой. У меня, образно говоря, есть 180 студентов, это второкурсники и первокурсники, из этих 180 студентов 50% второкурсников уже на стажировке в «Яндексе». Естественно, это ожидаемый результат. То, что мы не отстаем, работаем на уровне мировой науки, особенно в условиях санкционного давления и попыток западной стороны отгораживаться, показывает, что мы молодцы».
Всего российский CatBoost в своих работах в 2025 году использовали ученые из 51 страны. Среди авторов представители престижных учебных заведений, в том числе Стэнфорда, Гарварда и MIT.