SWYOO 블로그

All | All

Neovim 셋업 툴 LazyVim 소개

March 29, 2025, 4:28 p.m.

vim-plug에서 Lua 기반 플러그인 매니저로 바꾸자

그동안 neovim 에서 vim-plug 으로 각 종 플러그인들을 설치해 사용하고 …

GAE 목적함수에서 TRPO 목적함수로의 유도과정과 개념적 이해

March 24, 2025, 4:22 p.m.

TRPO는 VPG 의 목적함수에 대해 이전 정책의 분포에 대한 식으로 치환하고, policy 변화에 제약을 건 방법

강화학습 TRPO 알고리즘에 유도과정을 복습하기 좋도록 ChatGPT 답변을 생성해…

RL기반 LLM Alignment tuning 방법론 중 하나인 DPO Loss 유도과정을 이해

March 17, 2025, 6:45 p.m.

DPO는 별도 보상모델 없이 정책모델의 확률분포 자체로 인간의 선호를 직접 학습

[SIGIR'21] Contrastive Learning for Sequential Recommendation

Feb. 18, 2025, 8:01 p.m.

세션기반 추천 모델에 contrastive learning loss 도입 하여 성능 향상을 이룬 논문

주어진 Session 에 대한 Representation 을 구할 때 유사한 ses…

[EMNLP'21] SimCSE: Simple Contrastive Learning of Sentence Embeddings

Feb. 8, 2025, 10:30 p.m.

Sentence Embedding 을 Contrastive learning으로 학습하고자 한 시도

논문링크:

←
1
2
…
8
→