Post

ANN 회귀 문제 한 장 요약

회귀 문제에서 ANN을 적용할 때 데이터 정리부터 모델 평가까지 흐름을 한 장에 압축

ANN 회귀 문제 한 장 요약

이 프로젝트는 “수치 예측 문제에서 신경망을 언제, 어떻게 쓰는가”를 한 번에 정리해주는 표준 예시다.
자동차 판매 예측이라는 도메인은 중요하지 않고, 회귀 문제에 ANN을 적용하는 전형적인 흐름이 핵심이다.


문제 유형 정의

왜 회귀 문제인가

  • 예측 대상이 연속적인 수치 값
  • 정답 공간이 미리 정해진 클래스 집합이 아님
  • “얼마나 맞았는가”가 아니라 “얼마나 가까운가”가 중요

분류와의 경계

구분회귀분류
출력연속값이산 클래스
오차 개념거리일치/불일치
결과 해석크기 차이범주 판단

👉 출력이 숫자라도 의미가 순서·크기라면 회귀다.


전체 파이프라인

한 줄 요약

데이터를 숫자로 정리 → 신경망으로 근사 → 오차로 판단

텍스트 다이어그램

1
2
3
4
5
6
7
8
9
10
11
[원본 데이터]
↓
[수치형/범주형 정리]
↓
[스케일링]
↓
[ANN 모델]
↓
[연속값 예측]
↓
[오차 기반 평가]

각 단계의 역할

단계역할
데이터예측 가능한 정보만 남김
전처리신경망이 학습 가능한 형태로 변환
모델비선형 관계 근사
평가예측이 “쓸 만한지” 판단

신경망 구조를 이렇게 잡은 이유

레이어 수

  • 입력 → 은닉 1~2층 → 출력
  • 얕은 구조로도 충분한 문제
  • 목적은 표현력 실험이 아니라 회귀 패턴 학습

활성화 함수 선택 논리

위치선택 기준
은닉층비선형성 부여
출력층연속값 그대로 출력

직관적 비유

이 구조는 곡선을 부드럽게 그리는 자동 회귀자에 가깝다.
복잡한 사고보다, 데이터 모양을 따라가는 역할이다.


과적합 여부를 판단하는 기준

수치보다 봐야 할 신호

  • 학습 손실은 내려가는데
  • 검증 손실은 멈추거나 올라간다

학습 곡선 관점

상황신호
정상 학습두 곡선이 함께 완만히 감소
과적합학습↓ / 검증↑
과소적합둘 다 높게 유지

👉 특정 수치보다 곡선의 방향과 간격이 중요하다.


이 프로젝트의 재사용 포인트

다른 회귀 문제로 그대로 옮길 수 있는 것들이다.

그대로 재사용 가능

  • 전체 파이프라인 구조
  • 전처리 → 스케일링 → ANN 흐름
  • 과적합 판단 기준

바꿔야 하는 것

  • 입력 특성 정의
  • 출력 해석 방식
  • 오차 허용 범위

최소 의사코드 구조

1
2
3
4
5
load_data()
preprocess()
build_ann()
train()
evaluate()

이 틀만 기억하면,
도메인이 바뀌어도 ANN 회귀 문제는 바로 다시 짤 수 있다.


This post is licensed under CC BY 4.0 by the author.