Cross validation으로 샘플을 나눠서 lasso regression을 수행한 결과.
x축: 페널티값으로 값이 클수록 페널티가 강해지고 더 많은 변수들의 계수가 0으로 축소된다.
y축: 모델의 예측 오차를 나타낸다. 값이 작을수록 모델의 성능이 좋다.
오차막대: k-fold를 진행하면서 해당 람다 값에서 오차에 대한 표준 편차. 막대가 작을수록 높은 신뢰도를 의미한다.
상단 숫자: 각 람다값에서 선택된 변수들의 수
왼쪽 점선: 최소 binomial deviance를 달성하는 람다값의 위치
오른쪽 점선: 람다값이 증가해도 모델 성능에 큰 변화가 없는 가장 단순한 모델을 선택한 람다 값.