본문 바로가기

IT(개발, 보안)/코딩 스터디 일지

[스파르타코딩클럽] 기초 머신러닝 2주차

사실상 2일차이지만 오늘 2주차 강의를 다 들었기 때문에 2주차 스터디 일지를 작성한다

 

오늘 수업에서 배운것은 Logistic Regression과 Multinomial Logistic Regression 이었다.

 

Logistic Regression을 1 또는 0으로 결과물을 나타내는 모델에서 사용하는 회귀 방법이다.

 

Sigmoid function이 등장하였는데 학교 강의에서 들었던 sigmoid와는 사뭇 달라 보였다... 

 

푸리에 변환하면서 배우고 HPF LPF 배우면서 배웠던 sigmoid는 너랑 다르게 생겼단 말이지...

 

이런 이진회귀의 경우에는 손실함수를 Binary Cross Entropy 함수를 사용한다고 배웠다. 뭔가 근데 설명이 불친절하달까... 생략 된게 너무 많아서 이해를 할 수는 없었고 그냥 이러한 모델에는 이 함수를 사용해!라고만 설명하신다...

 

하긴 근데 대학강의들 들어보면 저런 모델 하나 설명하기 위한 background knowledge가 많이 필요하긴 해서... 이런 실무 위주의 강의에선 과감하게 생략하는 것 같다... 그런 deep한 설명이 갑자기 튀어나와 버리면 다들 지레 겁 먹을듯

 

Multinomial Logistic Regressioin의 경우 결과가 여러 class로 분류 되는데, class를 1,2,3,4, 이렇게 구분하지 않고 컴퓨터 친화적으로 바꾸어 줘야 한다고 한다. = One Hot Encoding

그리고 Softmax함수는 여러 parameter들의 합을 1로 바꾸어주는 함수인데 이 softmax함수와 one hot encoding을 활용해서 class를 분류하는 방법을 사용한다.

그리고 다항 회귀에서도 Crossentropy 함수를 손실함수로 사용한다.

 

 

 

이렇게 2개의 회귀방법을 이번 수업때 간단하게 배우고 Class를 분류하는 머신러닝 모델들을 몇개 소개해주셨다. 

Support Vector Machine, k-nearest, Decision tree, Random forest 등의 모델이었는데 K-nearest는 이전에 학교 강의에서 배운 적이 있어서 뭔가 반가웠다.

 

 

머신러닝에서 전처리 방법도 설명해주셨는데 Standarization과 Normalization을 설명해주셨다.

 

아무래도 전체 강의가 간단한 개념 설명과 실습 위주이다보니 이 둘이 무엇인지만 설명해주시고 차이점이라던가 어떤데 데 쓰이는지에 대한 설명은 부족해서 아쉬웠다.

 

둘다 이미 알고있는 개념이었지만 어디에서 쓰이는지 여전히 궁금하달까...

 

그리고 어김없이 이어지는 실습 수업... google colab으로 작성하신 코드를 하나하나 따라가면서 설명해주시는데 정작 모델을 학습시킬때 쓰이는 optimizer(Adam)과 Sequential 함수에 대한 설명은 여전히 많이 부족했다....

 

뭐 하시는대로 따라하면 결과는 나오기는 하지만 실습 자료 없이 내가 이걸 혼자서 할 수 있을까에 대한 의문은 여전히...

반응형