SWYOO 블로그

| reinforcement-learning

FinRL 리뷰 - 주식 데이터 전처리

June 25, 2023, 11:24 a.m.

주식 데이터 전처리 방법

최근 주식 관련 강화학습 논문들을 리뷰하고 싶은 욕구가 생겼다. 천천히 리뷰를 진행…

[RecSys'22] Off-Policy Actor-critic for Recommender Systems

March 9, 2024, 9:38 p.m.

추천시스템에 강화학습 모델인 actor critic을 적용시킨 논문

오랜만에 논문리뷰

LLMs for User Interest Exploration in Large-scale Recommendation Systems

June 14, 2024, 1:44 p.m.

E-commerce에서 LLM 을 활용하는것에 대한 효과

google deepmind 논문

GAE 목적함수에서 TRPO 목적함수로의 유도과정과 개념적 이해

March 24, 2025, 4:22 p.m.

TRPO는 VPG 의 목적함수에 대해 이전 정책의 분포에 대한 식으로 치환하고, policy 변화에 제약을 건 방법

강화학습 TRPO 알고리즘에 유도과정을 복습하기 좋도록 ChatGPT 답변을 생성해…