오늘 오후 3시까지는 그 전까지의 실습의 연장선이라 위클리 페이퍼를 작성해서 블로그에 업로드를 완료했다... 앞으로 3일 정도 배울 내용인데 예습한다는 생각으로, 지도학습/비지도학습, 손실함수, 편향/분산, 교차검증을 봤는데 오랜만에 보니까 거의 처음보는 것처럼 새로웠고 새로 배워간다는 생각으로 유튜브도 찾아가며 겨우겨우 작성을 완료했다...
오늘 헷갈렸던 것/배웠던 것

- 경사하강법을 적용하는 과정에서 미분을 통해서 손실함수의 다음 기울기를 구하는 것 까지는 어느정도 기억이 나서 이해를 했는데, w가 행렬일 경우에 미분을 전치행렬을 통해서 수행하는 미분 과정을 이해하지 못했다,, 수업때는 휙 지나가서 일단 넘어갔지만 선형대수의 행렬 미분을 따로 공부해야겠다.
- 선형회귀에서의 다중공선성 문제를 방지하기 위해서 : Lasso 회귀, Ridge 회귀 사용 가능 (규제 추가) -> 결과값이 들쑥날쑥할수록(하나의 특성이 가중치의 차이가 너무 나버린다면) 규제를 주는게 좋다. alpha 값이 클수록 규제가 강해짐
- 분류 문제에서 재현율이랑 정밀도가 헷갈린다.. 정밀도 - 모델이 A라고 예측한것 중 실제 A의 비율, 재현율 : 실제 A중 모델이 A라고 맞춘 확률 !! 다시 메모장이랑 이곳에 쓰다보니 어느정도 이해되는 것 같기도 하다. 분류에 대한 평가인 정확도, 정밀도, 민감도, F1스코어 에 대해 조금 더 보는게 좋을 것 같다.
- df.hist()를 사용하면 수치형 데이터만 골라서 히스토그램을 보여주므로 데이터 구조를 파악하기 좋다 !
- 범주형 데이터를 정수인코딩 하거나 원-핫 인코딩할 때, 어떤 범주가 어떤 숫자로 매핑되었는지 확인하기 위해서는 어떻게 하면 되는지 강사님께 질문을 했는데, 인코더 모듈의 categories_ 변수를 사용하면 된다고 알려주셨다. scikit-learn.org를 보면 내부 이용할 수 있는 정보들이 많아 찾아보기 좋을 것 같다.
느낀점
- 다른 사람들의 코드를 리뷰하는 시간을 가졌었는데, 단지 EDA를 잘하는 것 뿐만 아니라 처음 보는 사람이 봐도 알 수 있을 정도로 정리가 중요하다고 느꼈다.
'TIL' 카테고리의 다른 글
| [TIL] #6 2026-03-10 (0) | 2026.03.10 |
|---|---|
| [TIL] #5 2026-03-06 (1) | 2026.03.06 |
| [TIL] #4 2026-03-05 (1) | 2026.03.05 |
| [TIL] #3 2026-03-04 (1) | 2026.03.05 |
| [TIL] 2026-02-27 TIL#2 (1) | 2026.02.27 |
