ANN 회귀 문제 한 장 요약
회귀 문제에서 ANN을 적용할 때 데이터 정리부터 모델 평가까지 흐름을 한 장에 압축
Posted
By okorion
ANN 회귀 문제 한 장 요약
이 프로젝트는 “수치 예측 문제에서 신경망을 언제, 어떻게 쓰는가”를 한 번에 정리해주는 표준 예시다.
자동차 판매 예측이라는 도메인은 중요하지 않고, 회귀 문제에 ANN을 적용하는 전형적인 흐름이 핵심이다.
문제 유형 정의
왜 회귀 문제인가
- 예측 대상이 연속적인 수치 값
- 정답 공간이 미리 정해진 클래스 집합이 아님
- “얼마나 맞았는가”가 아니라 “얼마나 가까운가”가 중요
분류와의 경계
| 구분 | 회귀 | 분류 |
|---|---|---|
| 출력 | 연속값 | 이산 클래스 |
| 오차 개념 | 거리 | 일치/불일치 |
| 결과 해석 | 크기 차이 | 범주 판단 |
👉 출력이 숫자라도 의미가 순서·크기라면 회귀다.
전체 파이프라인
한 줄 요약
데이터를 숫자로 정리 → 신경망으로 근사 → 오차로 판단
텍스트 다이어그램
1
2
3
4
5
6
7
8
9
10
11
[원본 데이터]
↓
[수치형/범주형 정리]
↓
[스케일링]
↓
[ANN 모델]
↓
[연속값 예측]
↓
[오차 기반 평가]
각 단계의 역할
| 단계 | 역할 |
|---|---|
| 데이터 | 예측 가능한 정보만 남김 |
| 전처리 | 신경망이 학습 가능한 형태로 변환 |
| 모델 | 비선형 관계 근사 |
| 평가 | 예측이 “쓸 만한지” 판단 |
신경망 구조를 이렇게 잡은 이유
레이어 수
- 입력 → 은닉 1~2층 → 출력
- 얕은 구조로도 충분한 문제
- 목적은 표현력 실험이 아니라 회귀 패턴 학습
활성화 함수 선택 논리
| 위치 | 선택 기준 |
|---|---|
| 은닉층 | 비선형성 부여 |
| 출력층 | 연속값 그대로 출력 |
직관적 비유
이 구조는 곡선을 부드럽게 그리는 자동 회귀자에 가깝다.
복잡한 사고보다, 데이터 모양을 따라가는 역할이다.
과적합 여부를 판단하는 기준
수치보다 봐야 할 신호
- 학습 손실은 내려가는데
- 검증 손실은 멈추거나 올라간다
학습 곡선 관점
| 상황 | 신호 |
|---|---|
| 정상 학습 | 두 곡선이 함께 완만히 감소 |
| 과적합 | 학습↓ / 검증↑ |
| 과소적합 | 둘 다 높게 유지 |
👉 특정 수치보다 곡선의 방향과 간격이 중요하다.
이 프로젝트의 재사용 포인트
다른 회귀 문제로 그대로 옮길 수 있는 것들이다.
그대로 재사용 가능
- 전체 파이프라인 구조
- 전처리 → 스케일링 → ANN 흐름
- 과적합 판단 기준
바꿔야 하는 것
- 입력 특성 정의
- 출력 해석 방식
- 오차 허용 범위
최소 의사코드 구조
1
2
3
4
5
load_data()
preprocess()
build_ann()
train()
evaluate()
이 틀만 기억하면,
도메인이 바뀌어도 ANN 회귀 문제는 바로 다시 짤 수 있다.
This post is licensed under CC BY 4.0 by the author.
