☆ To Do List ☆
- AI진단퀴즈
- 머신러닝 심화 챕터 3, 4수강
- 개인과제 라이브세션 19:30~
- 면접준비
- TIL작성 및 제출
🤖 에이타니
아 아침에 잠이 덜 깻나,, 선형그래프를 막대그래프라고 착각하고 문제를 풀었어요,,
그냥 A번 보고 완전 맞는말이네~ 하고 골랐는데.. 틀렸어요..

선형 그래프는 시간의 흐름에 따른 데이터의 변화와 추세를 파악하는 데 가장 적합한 시각화 방법으로 'B'가 정답입니다..~
🖥️ 머신러닝
머신러닝 종류
머신러닝은 크게 지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning)으로 나뉜다.
● 지도학습(Supervised Learning)
지도학습은 입력 데이터(X)와 정답(Y)이 함께 주어진 상태에서 학습하는 방법이다. 학습한 모델을 이용해 새로운 데이터의 결과를 예측한다.
대표적인 예시로는 '회귀'와 '분류'가 있다.
● 비지도학습(Unsupervised Learning)
비지도학습은 정답(Y) 없이 데이터의 특성이나 유사성을 기반으로 그룹을 찾는 방법이다.
대표적인 활용 예시로는 '고객 세분화', '구매 패턴 분석', '이상 데이터 탐지'가 있다.
K-Means Clustering
K-Means는 가장 대표적인 군집화(Clustering) 알고리즘이다.
비슷한 특성을 가진 데이터를 K개의 그룹으로 나누며, 각 군집의 중심(Centroid)을 반복적으로 이동시키면서 최적의 군집을 만든다.
▶ K-Means 수행 과정
- 군집 개수(K) 설정
- 초기 중심점 선택
- 가장 가까운 중심으로 데이터 할당
- 새로운 중심점 계산
- 중심이 변하지 않을 때까지 반복
▶ 장점
- 구현이 쉽고 직관적
- 군집화 속도가 빠름
- 다양한 분야에서 활용 가능
▶ 단점
- K값을 직접 지정해야 함
- 이상치에 민감
- 거리 기반 알고리즘이라 차원이 많아질수록 성능이 저하될 수 있음
군집 평가 - 실루엣 계수(Silhouette Score)
비지도학습은 정답이 없기 때문에 실루엣 계수(Silhouette Score)를 이용해 군집화 품질을 평가한다.
▶ 해석
- 1에 가까울수록 군집이 잘 분리됨
- 0에 가까울수록 군집 간 경계가 모호함
- -1에 가까울수록 잘못 군집화됨
좋은 군집화일수록 같은 군집은 가깝고 다른 군집은 멀리 떨어져 있다.
고객 세그멘테이션(Customer Segmentation)
고객의 구매 패턴이나 특성을 기반으로 고객을 여러 그룹으로 나누는 기법이다.
대표적으로 RFM 분석이 많이 사용된다.
- Recency(R) : 최근 구매일
- Frequency(F) : 구매 횟수
- Monetary(M) : 총 구매 금액
이를 활용해 고객 맞춤형 마케팅 전략을 수립할 수 있다.
머신러닝과 딥러닝의 차이
딥러닝은 머신러닝의 한 분야로, 인공신경망(Artificial Neural Network)을 이용하여 복잡한 패턴을 학습하는 기술이다.
| 머신러닝 | 딥러닝 |
| 통계적 패턴 학습 | 인공신경망 기반 학습 |
| 비교적 적은 데이터로 학습 가능 | 많은 데이터가 필요 |
| 특징(Feature)을 직접 추출 | 특징을 자동으로 학습 |
| 해석이 쉬운 편 | 해석이 어려움 |
인공신경망(Artificial Neural Network)
인공신경망은 인간의 신경세포 구조를 모방한 모델이다.
기본 구조는 다음과 같다.
입력층(Input Layer) → 은닉층(Hidden Layer) → 출력층(Output Layer)
은닉층이 많아질수록 복잡한 패턴을 학습할 수 있으며, 이것이 딥러닝의 핵심이다.
경사하강법(Gradient Descent)
경사하강법은 손실 함수(Loss Function)를 최소화하도록 가중치를 반복적으로 업데이트하는 최적화 알고리즘이다.
쉽게 말해 오차가 가장 작은 방향으로 가중치를 계속 수정하면서 최적의 모델을 찾는 과정이다.
활성화 함수(Activation Function)
활성화 함수는 신경망에 비선형성(Non-linearity)을 추가하여 복잡한 문제를 해결할 수 있도록 만든 함수이다.
대표적인 활성화 함수
- Sigmoid
- ReLU
- Softmax
Epoch · Batch · Iteration
딥러닝에서 자주 사용하는 용어이다.
- Epoch : 전체 데이터를 한 번 학습하는 과정
- Batch : 데이터를 일정 크기로 나눈 묶음
- Iteration : 하나의 Batch를 학습하는 횟수
TensorFlow와 Keras
TensorFlow는 대표적인 딥러닝 프레임워크이며, Keras는 TensorFlow에서 제공하는 고수준 API이다.
▶ 주요 함수
- Sequential() : 모델 생성
- Dense() : 완전 연결층 추가
- compile() : 손실 함수 및 최적화 방법 설정
- fit() : 모델 학습
- evaluate() : 모델 평가
- predict() : 새로운 데이터 예측
딥러닝 활용 분야
▶ 자연어 처리(NLP)
텍스트 데이터를 이해하고 생성하는 기술이다.
- ChatGPT
- 번역
- 감정 분석
- 문서 요약
▶ 이미지 처리(CNN)
이미지의 특징을 자동으로 학습하여 분류하거나 생성하는 기술이다.
- 얼굴 인식
- 의료 영상 분석
- 자율주행
- 이미지 생성
< 머신러닝 핵심 정리 >
- 지도학습 : 정답(Y)이 있는 데이터를 학습
- 비지도학습 : 정답 없이 데이터의 패턴을 학습
- K-Means : 대표적인 군집화 알고리즘
- 실루엣 계수 : 군집화 성능 평가 지표
- 딥러닝 : 인공신경망 기반의 머신러닝
- 경사하강법 : 손실 함수를 최소화하는 최적화 방법
- 활성화 함수 : 신경망에 비선형성을 부여
- TensorFlow/Keras : 대표적인 딥러닝 프레임워크
- 딥러닝 활용 분야 : 자연어 처리(NLP), 이미지 처리(CNN), 생성형 AI 등
'내일배움 본캠프' 카테고리의 다른 글
| [내일배움 본캠프]개인과제 시작. (1) | 2026.06.30 |
|---|---|
| [내일배움 본캠프]머신러닝 알고리즘 종류와 특징 (0) | 2026.06.26 |
| [내일배움 본캠프] 과적합이란? (0) | 2026.06.25 |
| [내일배움 본캠프]EDA와 데이터 전처리 (0) | 2026.06.24 |
| [내일배움 본캠프] 통계에서 재현성의 중요성 (0) | 2026.06.23 |