본문 바로가기

혼자 공부하는 머신러닝 + 딥러닝 책을 공부하고 업무에 활용해보자

ironwhale 2022. 9. 17.


2016년 알파고와 이세돌 9단의 대국이 펼쳐지고 우후죽순 머신러닝와 딥러닝에 관련된 책들이 발간되기 시작했습니다. 그 중 이 책은 사이킷런(Scikit-Learn)과 텐서플로(tensorflow)의 사용법에 대한 책입니다. 사실 이 책을 혼자 독학을 한다고 해서 딥러닝 전문가가 되는 것은 불가능합니다. 이것에 대한 이유는 유튜브에서

테크보이 워니 머신러닝 라고 검색하시면 스탠포드 박사님과의 인터뷰가 나오는데 그 영상을 보시면 실제 데이터사이언스가 무엇을 하는지와 단순히 라이브러리만 사용할수 있는사람과의 차이점에 대해 알수 있습니다.

그래서 저는 이 책을 통해 기본적인 머신러닝의 알고리즘의 종류가 무엇이 있는지와 대표적인 라이브러리인 사이킷런과 텐서플로의 기본적인 사용법을 공부하고 저의 업무 중 단순한 분류 문제나 회귀문제에 활용해보기 위해 공부하고 있습니다.

책의 구성

이 책은 크게 2개로 나누어 집니다. 사이킷런을 사용하는 파트와 텐서플로를 사용하는 파트로 나누어지며, 이런 구성은 이 책의 저자이신 박해선 작가님이 번역하는 핸즈온 머신러닝의 구성과 비슷합니다. 다만 핸즈온 머신러닝보다 책의 내용이 이해하기 쉽게 난이도 조절을 잘하신것 같습니다. 개인적으로 핸즈온 머신러닝의 난이도의 좌절하신 분들에게 이 책을 먼저 보고 다시 보시는걸 추천드립니다.

예시를 통해 문제 해결 플로우를 알 수 있다.

이 책은 머신러닝 업무를 맡은 '혼공머신'이 회사에서 발생하는 문제를 머신러닝을 통해 해결해나가는 과정을 통해 머신러닝으로 어떻게 실생활의 문제를 해결해갈수 있겠구나 설명하고 있습니다. 이 점은 다른 머신러닝 책과의 가장 큰 차별점이라고 생각이 드는데요.

대표적으로 이책의 초반부 내용을 간다하게 소개하자면 도미와 빙어를 사이즈만 가지고 분류하기위한 모델을 만드는 과정이 나와 있습니다. K-근접 알고리즘을 사용해서 접근해보고 이 과정에서 잘못 분류된는 문제가 발생하여 입력데이터의 스케일링을 다시 하는 과정을 통해 문제를 해결합니다. 이처럼 예시를 통해 머릿속에 쉽게 이해가 되도록 구성된 점이 좋았습니다.

 

구글 그룹스를 통한 저자분의 빠른 답변

혼자 공부하다보면 내가 이해한것이 맞는지 틀린지 이부분은 무슨 내용인지 이해가 안가도 어디 질문할곳이 없는게 가장 큰 문제입니다. 하지만 이 책의 가장 큰 장점은 저자분이 집필하시거나 번역하신 책의 내용에 대해 질문할수 있는 공간이 따로 마련되어 있는 점입니다. 구글 그룹스에 질문을 올리면 저자분이 직접 답변을 주셔서 독학을 하는데 아주 큰 도움이 됩니다. 

이 책을 통해 얻은 지식 활용

제가 이 책을 공부해서 얻을 수 있는 지식은 분명 한계가 있지만 제가 단순히 라이브러리만 사용할 수 있다고 해서 회사 업무에 가끔씩 사용하는 회귀문제나 분류문제에 사용하는데 활용 해보고자 합니다. 제가 맡은 업무 중에는 가스요금단가를 원/GJ을 원/톤으로 바꾸는 단순한 회귀 작업이 필요한 이런 회귀 문제에 사용해보고자 합니다.

댓글