Ученые из Лаборатории исследований искусственного интеллекта Tinkoff Research совершили открытие в области рекомендательных систем в онлайн-торговле — они разработали новый алгоритм TAIW (Time-Aware Item-based Weighting) для более точного прогнозирования потребительских покупок в интернете с учетом времени покупок и их периодичности.
Новый метод позволит пользователям сэкономить время, затрачиваемое на составление конкретной корзины, а также напомнит купить товар, про который пользователь мог забыть.
Бизнесу использование разработанного учеными Тинькофф алгоритма поможет повысить удовлетворенность клиентов, увеличить конверсию в покупку и простимулировать рост среднего чека.
Как устроен алгоритм TAIW: модули «Повторная покупка» и «Соседство»
Разработка получила признание мирового сообщества: результаты исследования были представлены на главной конференции по рекомендательным системам ACM RecSys[2], которая входит в число лучших научных конференций в мире. В этом году она прошла в 17-й раз и состоялась в Сингапуре. Ее организатором выступает Ассоциация вычислительной техники — крупнейшее в мире образовательное и научное компьютерное сообщество.
Суть открытия
Алгоритм TAIW более точно предсказывает, какие товары клиенту потребуются в ближайшем будущем с учетом точного момента покупки. Он учитывает не только состав предыдущих покупок конкретного человека и схожих по профилю пользователей — он также анализирует точное время приобретения конкретных товаров в прошлом и периодичность покупок, выявляет взаимосвязи между приобретением товаров из разных категорий. Это помогает сделать рекомендации максимально персонализированными, что особенно важно в случае нетипичных паттернов поведения отдельных клиентов.
Человек может покупать какой-то товар с уникальной частотой: например, устраивать себе читмил с определенным продуктом в субботу каждой третьей недели месяца. В остальное время рекомендации этого продукта или схожих товаров не актуальны для пользователя, несмотря на то что он неоднократно покупал их раньше. Ранее эти данные редко учитывались рекомендательными системами.
Исследователи провели эксперименты на реальных данных: в частности, использовали датасет онлайн-площадки Taobao, которая входит в Alibaba Group. В результате экспериментов TAIW стал самым эффективным методом среди аналогов в задаче next basket recommendation (NBR) за счет более точного ранжирования товаров на основе их актуальности в конкретный момент времени. Согласно результатам экспериментов, алгоритм повышает точность рекомендательной системы до 8%.
Это позволяет пользователям получать более персонализированные рекомендации, тратить меньше времени на контроль домашних запасов и выбор новых товаров. TAIW заранее знает, через какое время у пользователя закончатся продукты, и предложит ему купить их в нужный момент.
Чем алгоритм отличается от других методов
Специалисты в области искусственного интеллекта уже долгое время работают над улучшением рекомендаций для интернет-торговли. Чтобы предсказать повторные покупки, ученые часто используют такие методы, как цепи Маркова (математическая модель, которая помогает предсказывать будущие события на основе прошлых событий) и рекуррентные нейронные сети (модели машинного обучения, которые анализируют последовательность действий пользователя).
Однако эти инструменты не всегда позволяют корректно учесть при прогнозировании частоту покупки — которая не только различается у разных товаров, но также бывает индивидуальна для разных пользователей. Например, один человек может покупать кондиционер для белья каждые три недели, а другой — раз в полгода.
Алгоритм TAIW, в свою очередь, состоит из двух модулей: «Повторная покупка» и «Соседство». Модуль «Повторная покупка» работает на основе процесса Хоукса — статистической модели, которая позволяет понять временные закономерности и зависимости между событиями. Так алгоритм определяет, какие товары покупал пользователь, как часто и когда была совершена последняя покупка. Этот модуль помогает определить, когда конкретные товары будут наиболее актуальными для конкретного покупателя.
Модуль «Соседство» помогает описать привычки пользователей с похожими предпочтениями. Эти данные используются, чтобы обеспечить более разнообразные рекомендации для конкретного человека.
Зачем нужны рекомендательные системы
Мировой рынок онлайн-торговли растет ускоренными темпами с начала пандемии COVID-19. По данным eMarketer, в 2023 году объем глобального e-commerce приблизился к 6 трлн долларов, а в 2027 году превысит 8 трлн. Это одно из самых динамично развивающихся направлений экономики, где разворачивается серьезная конкуренция как между технологическими гигантами, которые выступают площадками, так и между отдельными небольшими продавцами (например, по данным на 2022 год, более 60% продаж на Amazon делают независимые селлеры). Также растет и ассортимент — к примеру, на маркетплейсах могут быть представлены миллионы или даже миллиарды товаров.
Технологии, в частности рекомендательные алгоритмы, — одно из главных направлений, где уже разворачивается конкурентная борьба, которая будет становиться все более серьезной в ближайшие годы. Для пользователей растет число похожих вариантов для покупки, а процесс выбора становится все более затруднительным.
Для продавцов также все сложнее становится привлечь и удержать внимание покупателей. Когда пользователи сталкиваются с огромным выбором товаров, алгоритмы рекомендаций становятся персональными помощниками, предлагая подходящие варианты и сокращая временные затраты на поиск.
Например, в онлайн-магазинах часто решается задача next basket recommendation (NBR)[3], во время которой требуется предугадать состав следующей корзины пользователя в соответствии с его потребностями.
Лаборатория исследований ИИ Tinkoff Research
Tinkoff Research — это одна из немногих российских исследовательских групп, которая занимается научными исследованиями внутри компании, а не на базе некоммерческой организации.
Ученые из Tinkoff Research исследуют наиболее перспективные области ИИ: обработку естественного языка (NLP), компьютерное зрение (CV), обучение с подкреплением (RL) и рекомендательные системы (RecSys). По результатам экспериментов они пишут научные статьи для наиболее авторитетных научных конференций: NeurIPS, ICML, ACL, CVPR и других.
За два года существования команды 20 статей были приняты на крупнейшие конференции и воркшопы в области ИИ. Научные работы Tinkoff Research цитируются учеными из университетов Беркли и Стэнфорда, а также исследовательского проекта Google по изучению искусственного интеллекта Google DeepMind.
Команда курирует исследовательскую лабораторию Тинькофф на базе МФТИ и помогает талантливым студентам совершать научные открытия.
[1] Time-Aware Item Weighting (TAIW) — рекомендации с учетом периодичности покупок товаров
[2] Association for Computing Machinery Conference on Recommender Systems (ACM RecSys) — конференция Ассоциации вычислительной техники по рекомендательным системам.
[3] Next basket recommendation (NBR) — рекомендация следующей корзины.