Post

머신러닝 재학습을 위한 최소 기초 지도

이미 한 번 끝까지 학습한 개발자를 위한 ML 재학습 로드맵과 스킵 우선순위 정리

머신러닝 재학습을 위한 최소 기초 지도

이 글은 머신러닝을 이미 한 번 끝까지 경험한 개발자
재학습을 시작하기 전에 머릿속 개념을 다시 정렬하기 위한 지도다.

목표는 지식 추가가 아니라,

  • 무엇을 이미 알고 있는지
  • 무엇을 지금 다시 볼 필요가 없는지 를 빠르게 확정하는 것이다.

AI vs ML vs DL (실무 관점)

정의 요약

구분요약 정의
AI문제를 “지능적으로” 해결하는 시스템 전체 개념
ML데이터로부터 규칙을 학습하는 방법
DL신경망을 깊게 쌓아 표현력을 확대한 ML 방식

언제 구분이 의미 있는가

상황구분 필요 여부이유
기술 스택 선택필요인프라·데이터 요구사항이 달라짐
문제 유형 논의필요해결 접근이 달라짐
실무 구현 단계거의 불필요결국은 데이터→모델→평가

언제 구분할 필요가 없는가

  • 프로젝트 단위 작업
  • 모델을 “도구”로 쓰는 상황
  • “AI냐 ML이냐”가 의사결정에 영향 주지 않을 때

👉 실무에서는 ML ⊂ AI, DL ⊂ ML 정도로만 기억하면 충분하다.


ML에서 신경망이 등장한 이유

기존 ML의 한계

  • 특징(feature)을 사람이 직접 설계해야 함
  • 데이터 구조가 복잡해질수록 한계가 명확
  • 규칙이 늘어날수록 유지 비용 증가

신경망이 해결한 지점

  • 특징을 사람이 아닌 모델이 학습
  • 비선형·고차원 패턴 처리 가능
  • 동일 구조로 다양한 문제에 적용 가능

직관적 비유

기존 ML이 “공구 세트”라면,
신경망은 공구를 스스로 만들어 쓰는 공장에 가깝다.


Anaconda / Jupyter를 계속 쓰는 이유

단순히 편해서가 아니다. 구조적으로 이득이 있다.

실험 관점

  • 패키지 의존성 고립
  • 환경 차이로 인한 실험 실패 최소화

재현 관점

  • 동일 환경 재구성 가능
  • 과거 실험 결과 재검증 용이

공유 관점

  • 코드 + 설명 + 결과를 한 단위로 관리
  • “왜 이렇게 했는지” 맥락 보존
도구핵심 역할
Anaconda실험 환경 스냅샷
Jupyter사고 과정 기록

👉 ML에서 환경은 코드의 일부다.


이 파트에서 더 이상 파고들 필요 없는 개념

재학습 관점에서 지금은 스킵해도 되는 것들이다.

개념스킵 가능한 이유
경사하강법 수식구현 단계에서 직접 만질 일 없음
활성화 함수 수학적 성질선택 기준만 알면 충분
확률 분포 이론결과 해석에만 부분적으로 필요
최적화 이론라이브러리가 대부분 처리

기준

  • 모델을 직접 설계·개선할 때 다시 보면 된다
  • 지금은 “언제 쓰는가”만 기억하면 충분하다

이 글의 역할은 끝났다.
이제부터는 문제 유형별 지도(ANN, CNN, 시계열, NLP, 추천)로 바로 들어가면 된다.


This post is licensed under CC BY 4.0 by the author.