내일배움 본캠프

[내일배움 본캠프] 프로젝트 시작!

hyeon-ji 2026. 6. 8. 20:59

☆ To Do List ☆

  • AI 진단퀴즈
  • 데이터 코드카타
  • 데이터 시각화 복습
  • 아티클 스터디
  • TIL 작성 및 제출

🤖 에이타니

▶ 다중 회귀 분석

 

독립변수와 종속변수 간의 곡선 형태의 비선형 관계를 파악하기 위해 사용한다.

→ 연속적인 값을 예측할 때 사용한다.

→ 여러 개의 독립변수를 사용한다.

 

 

● 독립변수가 너무 많아 모델이 과적합(Overfitting)되는 현상을 방지하기 위해 '회귀 계수'의 제곱합에 페널티를 부여하여 계수 크기를 줄이는 회귀 기법은?

 

→ 릿지(Ridge) 회귀 기법

    : 선형 회귀 모델에 L2 규제를 추가하여 회귀 계수의 크기를 작게 만들어 모델의 분산을 줄이고 과적합을 방지한다.

      이를 통해 다중공선성 문제를 완화할 수 있다.


🔐 CodeKata

● 정수 제곱근 판별하기

def solution(n):

    for i in range(n + 1): 
        n_squr = i * i
        
        if n_squr == n:
            return (i + 1) * (i + 1)
        elif n_squr > n:
            return -1

solution(121)

📰 아티클 스터디

https://yozm.wishket.com/magazine/detail/1113/

 

실험 조직으로 거듭나기: 2 검증할 ‘만’한 가설은? | 요즘IT

오늘은 실험 조직으로 거듭나기 2편으로, 가설의 뼈대를 만드는 방법을 살펴보겠습니다. 그로스(Growth)와 실험 문화를 팀에 도입하고 싶은 분, '무엇'을 '어떻게' 검증해야 할지 헷갈리는 분, 가설

yozm.wishket.com

 

' 실험 조직으로 거듭나기: ② 검증할 만한 가설은?' 주제로 아티클 스터디를 진행했다.

 해당 아티클을 통해 문제를 발견했다고 해서 바로 해결책을 적용하는 것이 아니라, 먼저 검증 가능한 가설을 수립하는 과정이 중요하다는 점을 알게 되었다. 특히, 품질 직무에서 가설 설정을 하는 것이 불량 발생 원인 추정 후, 실험과 데이터를 통해 검증하는 방식으로 문제를 해결한다는 점에서 중요하다는 것을 다시 한번 되새기게 되는 아티클이었다.

 또한 모든 문제를 동일하게 다루기보다 영향도가 높은 문제를 우선적으로 선정하고, 실험이 실패하더라도 그 결과를 다음 개선 활동에 활용할 수 있다는 점에서 실패 역시 중요한 학습 자산이 될 수 있다는 사실을 알게 되었다.

 


📊프로젝트

 

 오늘 팀원들과 함께 주제를 선정하고 목표를 세우며 프로젝트의 방향성을 잡는 시간을 가졌다. 서로 관심 있는 분야는 무엇이고, 주어진 데이터셋 중에서 분석을 할만한 것이 무엇인지 함께 살펴보며 '[산업 안전/제조]가스 센서 기반 위험도예측'이라는 주제로 선정했다.

 

 역할 분담을 하고 오늘부터 프로젝트를 진행했다. 데이터를 가지고 여러 시각화 자료를 만들어보고 싶어 '데이터 시각화 및 인사이트 도출' 역할을 맡았다. 자신이 있는 것을 할까, 도전해보고 싶은 것을 할까 고민하다가 도전해보고 싶은 역할로 프로젝트를 진행하게 되었다.

 

데이터 전처리 역할을 맡았던 팀원분이 오후 3시까지 데이터를 넘겨주셔서 바로 시각화를 진행했다.

처음 독립변수와 종속변수를 설정하고 그 사이의 상관관계를 분석하는 것까지는 문제가 없었다.

하지만 상관관계를 분석하고 난 후부터 머리가 아파왔다...

생각보다 데이터들이 방대하지도 않았고, 그렇다고 한눈에 유의미한 데이터 관계성이 보이지 않았다.

위헝성과의 상관관계 분석 'Heatmap'

 

그래도 다행히 같이 시각화를 진행하는 팀원분이 계셔서 서로 진행한 상황을 공유하며 의논을 했다.

의논을 하며 내가 차마 생각하지 못했던 부분에 대한 정보를 많이 들을 수 있어서 좋았다.

 

이를 바탕으로 내일부터 다시 유의미한 값을 찾아봐야징..

오늘은 그만하고 일찍 잘래요,,

😴😴