Ordered Boosting (1) 썸네일형 리스트형 CatBoost 기존 Gradient Boosting 기법들의 문제점 1. Prediction Shift Training data에 대한 Conditional distribution 과 Test data에 대한 Conditional distribution 이 서로 다르다. (즉, 낮은 Generalization ability를 보인다.) 2. Target Leakage Target Statistic (TS) 를 활용해서 Numerical Feature 를 Categorical Feature 로 바꿔줄 때, Target인 y 값이 Feature value인 x 값을 정의하는데 이미 한 번 사용된다. 그러면 Conditional Shift 가 발생할 수 있다. 즉, Train과 Test set에서 y에 대한 x의 분포가 달.. 이전 1 다음