머신러닝 재학습을 위한 최소 기초 지도
이미 한 번 끝까지 학습한 개발자를 위한 ML 재학습 로드맵과 스킵 우선순위 정리
Posted
By okorion
머신러닝 재학습을 위한 최소 기초 지도
이 글은 머신러닝을 이미 한 번 끝까지 경험한 개발자가
재학습을 시작하기 전에 머릿속 개념을 다시 정렬하기 위한 지도다.
목표는 지식 추가가 아니라,
- 무엇을 이미 알고 있는지
- 무엇을 지금 다시 볼 필요가 없는지 를 빠르게 확정하는 것이다.
AI vs ML vs DL (실무 관점)
정의 요약
| 구분 | 요약 정의 |
|---|---|
| AI | 문제를 “지능적으로” 해결하는 시스템 전체 개념 |
| ML | 데이터로부터 규칙을 학습하는 방법 |
| DL | 신경망을 깊게 쌓아 표현력을 확대한 ML 방식 |
언제 구분이 의미 있는가
| 상황 | 구분 필요 여부 | 이유 |
|---|---|---|
| 기술 스택 선택 | 필요 | 인프라·데이터 요구사항이 달라짐 |
| 문제 유형 논의 | 필요 | 해결 접근이 달라짐 |
| 실무 구현 단계 | 거의 불필요 | 결국은 데이터→모델→평가 |
언제 구분할 필요가 없는가
- 프로젝트 단위 작업
- 모델을 “도구”로 쓰는 상황
- “AI냐 ML이냐”가 의사결정에 영향 주지 않을 때
👉 실무에서는 ML ⊂ AI, DL ⊂ ML 정도로만 기억하면 충분하다.
ML에서 신경망이 등장한 이유
기존 ML의 한계
- 특징(feature)을 사람이 직접 설계해야 함
- 데이터 구조가 복잡해질수록 한계가 명확
- 규칙이 늘어날수록 유지 비용 증가
신경망이 해결한 지점
- 특징을 사람이 아닌 모델이 학습
- 비선형·고차원 패턴 처리 가능
- 동일 구조로 다양한 문제에 적용 가능
직관적 비유
기존 ML이 “공구 세트”라면,
신경망은 공구를 스스로 만들어 쓰는 공장에 가깝다.
Anaconda / Jupyter를 계속 쓰는 이유
단순히 편해서가 아니다. 구조적으로 이득이 있다.
실험 관점
- 패키지 의존성 고립
- 환경 차이로 인한 실험 실패 최소화
재현 관점
- 동일 환경 재구성 가능
- 과거 실험 결과 재검증 용이
공유 관점
- 코드 + 설명 + 결과를 한 단위로 관리
- “왜 이렇게 했는지” 맥락 보존
| 도구 | 핵심 역할 |
|---|---|
| Anaconda | 실험 환경 스냅샷 |
| Jupyter | 사고 과정 기록 |
👉 ML에서 환경은 코드의 일부다.
이 파트에서 더 이상 파고들 필요 없는 개념
재학습 관점에서 지금은 스킵해도 되는 것들이다.
| 개념 | 스킵 가능한 이유 |
|---|---|
| 경사하강법 수식 | 구현 단계에서 직접 만질 일 없음 |
| 활성화 함수 수학적 성질 | 선택 기준만 알면 충분 |
| 확률 분포 이론 | 결과 해석에만 부분적으로 필요 |
| 최적화 이론 | 라이브러리가 대부분 처리 |
기준
- 모델을 직접 설계·개선할 때 다시 보면 된다
- 지금은 “언제 쓰는가”만 기억하면 충분하다
이 글의 역할은 끝났다.
이제부터는 문제 유형별 지도(ANN, CNN, 시계열, NLP, 추천)로 바로 들어가면 된다.
This post is licensed under CC BY 4.0 by the author.
