Python 8

[내일배움 본캠프]데이터 전처리&시각화 Last day..

☆ To do list ☆AI 진단퀴즈 5문제 풀기코드카타 2문제 풀기아티클 스터디이력서 작성하기개인과제 진행하기(~lever 3)TIL 작성 및 제출🤖 에이타니 구분단순선형회귀다중회귀독립변수 개수1개2개 이상목적하나의 변수로 종속변수 예측여러 변수로 종속변수 예측회귀식y = β0 + β1x + εy = β0 + β1x1 + β2x2 +⋯+ βnxn + ε시각화2차원 직선으로 표현 가능3개 이상 변수부터는 시각화 어려움해석비교적 쉬움변수 간 영향력을 함께 고려해야 함 🔐 CodeKata● 자연수를 뒤집어 배열로 만들기# 자연수를 뒤집어 배열로 만들기def solution(n): answer = [] for i in str(n): answer.append(int(i)) # n을 ..

[내일배움 본캠프]Seaborn 라이브러리

☆ To do list ☆AI 진단퀴즈 5문제 풀기코드카타 1문제 풀기이력서 작성하기개인과제 진행하기(~lever 2)TIL 작성 및 제출🤖 에이타니 ● info() : 데이터의 전체 구조(행/열 개수, 데이터 타입, 결측치 등)를 파악하는 경우 사용한다.import pandas as pddf = pd.DataFrame({'A': [1, 2, None, 4], 'B': ['a', 'b', 'c', 'd']})result = df.info()# 컬럼 A는 3 non-null, 컬럼 B는 4 non-null로 표시되고 데이터 타입 정보가 출력된다.● describe() : 수치형 데이터의 통계적 분포(평균, 표준편차, 분위수 등)를 확인하는 경우 사용한다.🔐 CodeKata ● x만큼 간격이 있는 n개의..

[내일배움 본캠프] 데이터 시각화 그래프, 선형회귀1

☆ To do list ☆AI진단퀴즈에이타니 2문제 풀기데이터 전처리&시각화 4주차 강의 수강라이브 세션 (10:00, 15:00)아티클 스터디 진행TIL 작성 및 제출🤖 에이타니 ● Bar Chart : 범주형 데이터를 비교하고 싶은 경우 사용지역별 매출 비교제품별 판매량 비교부서별 인원수 비교연령대별 고객 수 비교 ● Line Chart : 시간 흐름에 따른 변화(추세)를 확인하고 싶은 경우 사용월별 기온 변화주가 변동일별 방문자 수연도별 매출 변화 ● Histogram : 값이 어디에 많이 몰려 있는지, 데이터가 어떻게 퍼져 있는지 확인하고 싶은 경우 사용시험 점수 분포사람 키 분포제품 불량 크기 분포공정 온도 분포→ 오늘은 에이타니를 통해 '데이터 시각화 목적과 활용'에 관한 문제를 풀었다. ..

[내일배움 본캠프] 데이터 전처리와 시각화 기초

☆ To do list ☆에이타니와 문제풀기CodeKata 2문제 풀기데이터 전처리 & 시각화 강의 1차시 수강아티클 스터디라이브 세션 수강TIL 작성 및 제출 🤖 에이타니 오늘은 '시계열 데이터 보간과 전처리 이해' 를 주제로 문제를 풀어보았다.틀린 문제 없이 퀴즈를 마무리 했지만 처음 보는 용어나 헷갈리는 부분들이 있었다. ● 스플라인 보간법 : 부드러운 곡선을 만들어 결측값을 채울 수 있다. ● interpolate() : 이 메서드는 시계열 데이터의 결측치를 보간법으로 채우는 기능을 한다. → 이상치를 무조건 삭제하는 것이 좋지 않다는 것은 인지하고 있었지만, 이번 문제를 통해 품질적으로 생각을 넓혀갈 수 있었다. 단순히 이상치를 제거하고 분석을 진행하면 분석 과정이 쉬워질 수는 있을 것 같..

[내일배움 본캠프] 'Python' 데이터 분석 필수 문법

▶ 파일 확장자● CSV 파일(.csv) : Comma Separated Values의 약자로, 데이터를 쉼표(,)로 구분하여 저장하는 형식이다.→ 데이터프레임으로 불러오기 : pandas 라이브러리의 read_csv() 함수를 사용한다.import pandas as pddf = pd.read_csv('file.csv') ● Excel 파일(.xls, .xlsx) : 표 형태로 데이터를 저장하는 Microsoft Excel의 형식이다.→ 데이터프레임으로 불러오기 : pandas의 read_excel() 함수를 사용한다.import pandas as pddf = pd.read_excel('file.xlsx') ● JSON 파일(.json) : JavaScript Object Notation의 약자로, 데이..

[내일배움 본캠프]Python에서 함수란?

☆ 오늘의 일일목표 ☆AI 진단퀴즈 5문제 풀기파이썬 기초탄탄 라이브 세션 수강데이터 분석 파이썬 종합반 4 주차 수강데이터 리터러시 강의 1-3 수강이력서 초안잡기반복문 학습 시 사용하기! 파이썬 시뮬레이션 툴 → Python TutorPython Tutor - Visualize Code Execution​ ● 리스트 컴프리헨션(List Comprehension)→ 리스트를 간단하고 짧게 작성할 때 사용한다.def solution(n): answer = 0 for i in str(n): #print(i) # '1' # '2' # '3' answer+=int(i) # answer= answer + i re..

[내일배움 본캠프] 조건문과 반복문(if, For, While)

오늘은 파이썬에서 조건문과 반복문에 대해서 학습을 진행했다.↓ ↓ ↓ 연산자 총정리↓ ↓ ↓더보기 > : 초과>= : 이상== : 같다!= : 같지 않다+ : 덧셈- : 뺼셈* : 곱셈** : 거듭제곱/ : 나눗셈// : 몫(정수 나눗셈)% : mod 나머지 and : 모두 참일 때 참or : 하나 이상이 참일 때 참not : 조건을 부정↓ ↓ ↓ 데이터 조작의 기본 연산 ↓ ↓ ↓더보기C(Creat) : 데이터를 추가하거나 새롭게 '생성'하는 작업R(read) : 데이터를 '조회'하거나 '접근'하는 작업(읽기)U(Update) : 기존 데이터를 변경하거나 업데이트하는 방법(수정)D(Delete) : 데이터를 '삭제'하거나 제거하는 방법▶ 조건문 if→ 특정 조건이 참(True)인 경우에만 특정 ..

[내일배움 본캠프]Python기초

새로운 팀원들과 아이스브레이킹을 하고 라이브 세션과 LMS를 통해 파이썬 프로그램 기초를 다시 학습하는 시간을 가졌다. 추가로 데이터 리터러시에 대해 알아가는 시간을 가졌다.Python 기초 학습 ↓ ↓ ↓ 파이썬의 기대효과↓ ↓ ↓더보기● 데이터 관리 : 데이터 분석을 위해 방대한 데이터들을 불러오고 저장은 가장 기본적인 과정으로, 이로부터 파이썬 문법을 사용하기 시작한다.● 데이터 전처리 : 데이터 분석 전 데이터의 문제가 있는지 살펴보고 데이터를 분석하기 좋게 전처리하는 과정은 필수이다.● 데이터 시각화 : 데이터를 불러오거나 분석하고 난 후에 데이터의 형태를 살펴보기 위해 필수적이다.● 데이터 계산 : 데이터 분석에서 가장 중요한 과정이며 이를 수행하는데도 파이썬 문법이 필수이다. 다양한 통계적인..