theory |

MSE 와 Cross Entropy의 유도

Aug. 6, 2023, 10:52 p.m.
확률 분포의 가정에 따른 손실함수 정의 유도

어떤 모델로 실제 레이블을 예측하는 것이 머신러닝이 하는 일이다.

머신러…


GAE 목적함수에서 TRPO 목적함수로의 유도과정과 개념적 이해

March 24, 2025, 4:22 p.m.
TRPO는 VPG 의 목적함수에 대해 이전 정책의 분포에 대한 식으로 치환하고, policy 변화에 제약을 건 방법

강화학습 TRPO 알고리즘에 유도과정을 복습하기 좋도록 ChatGPT 답변을 생성해…