전체 글 46

[내일배움 본캠프]K-Means 군집화란? 비지도학습 핵심 개념 정리!

☆ To Do List ☆AI진단퀴즈머신러닝 심화 챕터 3, 4수강개인과제 라이브세션 19:30~면접준비TIL작성 및 제출🤖 에이타니아 아침에 잠이 덜 깻나,, 선형그래프를 막대그래프라고 착각하고 문제를 풀었어요,,그냥 A번 보고 완전 맞는말이네~ 하고 골랐는데.. 틀렸어요.. 선형 그래프는 시간의 흐름에 따른 데이터의 변화와 추세를 파악하는 데 가장 적합한 시각화 방법으로 'B'가 정답입니다..~🖥️ 머신러닝머신러닝 종류머신러닝은 크게 지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning)으로 나뉜다. ● 지도학습(Supervised Learning)지도학습은 입력 데이터(X)와 정답(Y)이 함께 주어진 상태에서 학습하는 방법이다. 학습한 모델을 이용해 ..

[내일배움 본캠프]머신러닝 알고리즘 종류와 특징

☆ To Do List ☆AI진단퀴즈머신러닝 심화 챕터 2수강자소서 작성TIL 작성 및 제출🤖 에이타니F-statistic과 p-value ● F-statisticF-statistic은 회귀모형 전체가 통계적으로 유의한지 평가하는 지표이다. 즉, 독립변수들이 종속변수를 설명하는 데 의미가 있는지를 확인하는 역할을 한다.일반적으로 F-statistic 값이 클수록 모델의 설명력이 높을 가능성이 크며, 함께 제공되는 p-value를 통해 최종적으로 유의성을 판단한다. ● p-valuep-value는 귀무가설이 참이라는 가정하에 현재와 같거나 더 극단적인 결과가 나타날 확률을 의미한다.일반적으로 다음과 같이 해석한다.p-value : 통계적으로 유의하며, 귀무가설을 기각한다.p-value ≥ 0.05 :..

[내일배움 본캠프] 과적합이란?

☆ To Do List ☆AI 진단퀴즈머신러닝 심화 챕터 1 완강자소서 작성TIL 작성 및 제출🤖 에이타니● F-statisticF-statistic은 회귀모형 전체가 통계적으로 유의한지를 평가하는 지표이고, 독립변수들이 종속변수를 설명하는 데 의미가 있는지 확인하는 방법이다.일반적으로 F-statistic이 클수록 모델의 설명력이 높을 가능성이 크며, 함께 제공되는 p-value를 통해 최종적으로 유의성을 판단한다. ● p-valuep-value는 귀무가설이 참이라는 가정하에 현재와 같은 결과가 우연히 관측될 확률이다.일반적으로 p-value 이면 통계적으로 유의하다고 판단하여 귀무가설을 기각하고, p-value ≥ 0.05이면 귀무가설을 기각하지 않는다.🖥️ 머신러닝1. 과적합(Overfittin..

[내일배움 본캠프]EDA와 데이터 전처리

☆ To Do List ☆AI 진단퀴즈머신러닝 심화 1-7 수강자소서 작성하기라이브세션(19:30)아티클 스터디TIL 작성 및 제출🤖 에이타니● Feature Engineering란? 원본 데이터로부터 새로운 특성을 생성하거나 기존 특성을 변환하는 과정이다.모델의 예측 성능을 향상시키기 위한 핵심적인 데이터 전처리 기법이다.적절한 Feature Engineering을 통해 단순한 모델로도 높은 성능을 달성할 수 있다.도메인 지식과 데이터에 대한 이해가 매우 중요한 과정이다.🖥️ 머신러닝■ 데이터 분석에서 전처리가 중요한 이유데이터 분석은 단순히 모델을 만드는 과정이 아니라, 실제 업무에서는 데이터를 수집하고, 이해하고, 정제하는 과정이 대부분의 시간을 차지한다. 특히 데이터 전처리는 전체 분석 과정의..

[내일배움 본캠프] 통계에서 재현성의 중요성

☆ To Do List ☆AI 진단퀴즈기초통계 완강하기라이브세션(19:30)자소서 작성하기TIL 작성 및 제출🤖 에이타니● MSE (Mean Squared Error)오차를 제곱하여 평균을 내는 지표오차를 제곱하기 때문에 오차가 1보다 큰 경우 그 값이 기하급수적으로 증가하게 되어, 큰 오차를 발생시키는 예측에 더 큰 페널티를 줄 수 있음 ● MAE (Mean Absolute Error)오차의 절대값(Absolute Value)을 평균낸 지표오차를 제곱하지 않고 절대값으로 계산하기 때문에 모든 오차를 동일한 비중으로 반영함이상치(Outlier)의 영향이 MSE보다 적으며, 실제 예측값이 평균적으로 얼마나 벗어났는지를 직관적으로 해석할 수 있음 ● MAPE (Mean Absolute Percentage ..

[내일배움 본캠프] 통계를 이용한 데이터 분석

☆ To Do List ☆AI 진단퀴즈라이브세션 수강(11:00, 19:30)기초 통계 챕터 5수강머신러닝 기초 완강하기자소서 작성TIL 작성 및 제출🤖 에이타니● RMSE(Root Mean Squared Error)MSE의 제곱근(square root)을 취한 값을 말한다.MSE와 달리 원래 데이터와 동일한 단위를 가지므로 해석이 더 직관적이다.파이썬 코드 : np.sqrt(mse)📊기초통계1. 데이터 분석의 전체 흐름 2. 모수검정과 비모수검정구분모수검정비모수검정전제 조건정규성 만족정규성 불필요비교 기준평균순위(Rank), 중앙값대표 검정t-test, ANOVAMann-Whitney, Wilcoxon, Kruskal-Wallis사용 상황연속형 데이터순위형, 비정규 데이터 ☞ 비모수 검정검정명비교 ..

[내일배움 본캠프] 가설검증(통계)

☆ To Do List ☆AI에이타니통계학 기초 챕터 3, 4 수강머신러닝 기초 1-13까지 수강하기라이브세션(11:00, 19:30)공고 찾아보기TIL 작성 및 제출🤖 에이타니 Q. Python에서 시계열 분해(Time Series Decomposition)를 수행하는 코드, 가법 모델을 사용하여 시계열을 Trend + Seasonality + Residual로 분해하고자 할 때, 빈칸에 들어갈 값은?from statsmodels.tsa.seasonal import seasonal_decomposeimport pandas as pd# 시계열 데이터 생성data = pd.Series([100, 120, 130, 110, 105, 125, 135, 115], index=pd..

[내일배움 본캠프] 기술통계

☆ To Do List ☆AI진단퀴즈통계학 기초 챕터 2 수강머신러닝 기초 1-10까지 수강아티클 스터디라이브 세션(11:00, 19:30)TIL 작성 및 제출🤖 에이타니● 시계열 데이터 분해와 패턴 해석원본 데이터 : 전반적으로 상승하는 패턴을 보이며, 매년 여름에 높고 겨울에 낮은 규칙적 변동이 관찰됨추세 성분 : 완만하게 상승하는 곡선 형태계절성 성분 : 12개월 주기로 동일한 패턴이 반복됨잔차 성분 : 0을 중심으로 불규칙하게 분포하나, 특정 시점에 큰 음수 값이 관찰됨○ 위 데이터 해석원본 데이터에서 상승하는 패턴을 보임을 알 수 있고, 추세 성분이 완만하게 상승하는 곡선 형태임을 봤을 때 해당 데이터는 장기적으로 증가 추세를 보인다라고 볼 수 있다.계절성 성분이 12개월 주기로 동일한 패턴이..

[내일배움 본캠프] 기초통계와 머신러닝

☆ To Do List ☆라이브세션 수강(11시, 7:30)AI 진단퀴즈코드카타통계학 기초 1챕터머신러닝 기초 수강자소서 작성TIL 작성 및 제출🤖 에이타니에이타니로 "시계열 데이터 분해와 패턴 해석" 부분의 새로운 퀴즈를 풀려고 도전했다가, 하나도 모르겠어서 바로 나와버렸다. 그래서 그 전에 오답률이 높았던 회귀분석 리뷰를 하기로 했다. 다중선형회귀- 기울기(계수, coefficient0 각 '독립변수 가 종속변수에 얼마나 큰 영향을 미치는가"를 보여주는 값이다. 다중 회귀에서는 하나의 스칼라 값으로 저장되지 않고, 독립변수가 3개이면 기울기도 3개다. 이들을 배열 형태로 저장된다.계수(기울기) --> 각 독립변수의 영향력 (독립변수 개수만큼)절편 --> 기준점 1개성능 지표 --> 모델이 얼마나 잘..

[내일배움 본캠프] 커리어데이

커리어데이를 맞아 자소서 작성 방법 면접을 보는 방법에 대해 인사이트를 얻을 수 있는 시간이었다.포트폴리오를 작성하는 법도 배울 수 있었다.포트폴리오는 작성해본 경험이 없었는데, 이번 기회에 들으면서 포트폴리오를 잘 준비해서 지원할 때 이용해봐야 겠다라고 생각하게되었다. 자소서 >- 이력서 300자 이하면 부제목 안 쓰는게 좋음!