SWYOO 블로그

LLMs for User Interest Exploration in Large-scale Recommendation Systems

E-commerce에서 LLM 을 활용하는것에 대한 효과

google deepmind 논문 https://arxiv.org/abs/2405.16363 리뷰해보자.

다음의 LLM을 사용한 두가지 전략이 있음.

exploration-oriented: user clustering + Reinforcement Learning
exploitation-oriented: Two-tower Approach

이 논문에서는 exploration-oriented 방법에 집중하였고, user clustering을 LLM(general knowledge)을 통해 유저 관심사를 잘 catch해서 reinforcement learning에 긍정적인 효과를 낼 수있도록 한것으로 보임.

Last updated on June 15, 2024, 10:51 a.m.

LLMs for User Interest Exploration in Large-scale Recommendation Systems

E-commerce에서 LLM 을 활용하는것에 대한 효과

LEAVE A COMMENT

[RecSys'22] Off-Policy Actor-critic for Recommender Systems

[SIGIR'24] SeRALM:Enhancing Sequential Recommenders with Augmented Knowledge from Aligned Large Language Model

알고리즘 모의고사 데일리

알고리즘 데일리

[SIGIR'24] PO4ISR: Large Language Models for Intent-Driven Session Recommendations

FinRL 리뷰 - 주식 데이터 전처리

RL기반 LLM Alignment tuning 방법론 중 하나인 DPO Loss 유도과정을 이해

Duplicated Image를 찾는 기본 방법

[WWW'19] EASE: Embarrassingly Shallow Autoencoders for Sparse Data

[Arxiv'18] FOMAML: On First-Order Meta-Learning Algorithm

[SIGIR'23] PersonalTM: Transformer Memory for Personalized Retrieval