머신러닝 분야 부동의 베스트셀러! 트랜스포머와 LLM 실습까지 더 많이 채웠다! 케라스는 물론 파이토치까지, 혼자서도 1:1 과외하듯 배우는 인공지능 자습서 ** 혼공 용어 노트, 저자 직강 유튜브 강의, FAQ(자주 하는 질문), 오픈 채팅 등 풀패키지 제공
『혼자 공부하는 머신러닝+딥러닝』 (개정판)은 머신러닝과 딥러닝의 핵심 개념을 쉽고 체계적으로 익힐 수 있도록 돕는 입문서로, 최신 AI 트렌드를 반영해 더욱 완성도를 높였다. 특히 트랜스포머와 대규모 언어 모델(LLM) 실습을 새롭게 추가하여, 최신 AI 기술이 실제로 어떻게 동작하는지 배울 수 있도록 했다.
1판에서 많은 독자의 사랑을 받았던 ‘1:1 과외하듯 배우는 설명 방식’과 ‘구글 코랩(Colab) 기반 실습’을 유지하면서, 파이토치 예제 코드를 보강했다. 또한, 각 장마다 ‘자주 하는 질문(FAQ)’ 코너를 추가해 학습자의 이해를 돕고, 실습 중 마주할 수 있는 오류나 개념적 궁금증을 쉽게 해결할 수 있도록 구성했다. 입문자가 실전에서 부딪히는 문제를 미리 경험하고 해결하는 능력을 키울 수 있어, 더욱 효과적으로 머신러닝과 딥러닝을 익힐 수 있다.
또한, 혼공 용어 노트, 저자 유튜브 강의, Q&A 커뮤니티 등 다양한 학습 지원을 제공해 혼자서도 끝까지 학습을 이어갈 수 있도록 돕는다. 최신 AI 개념을 이해하고 실습까지 제대로 해보고 싶다면, 지금 이 책을 만나보자.
저자소개
저자
박해선
기계공학을 전공했지만 졸업 후엔 줄곧 코드를 읽고 쓰는 일을 했습니다. Microsoft AI MVP, Google AI/Cloud GDE입니다. 텐서플로 블로그(tensorflow.blog)를 운영하고 있고, 머신러닝과 딥러닝에 관한 책을 집필하고 번역하면서 소프트웨어와 과학의 경계를 흥미롭게 탐험하고 있습니다.
『혼자 만들면서 공부하는 딥러닝』(한빛미디어, 2025), 『혼자 공부하는 머신러닝+딥러닝(개정판)』(한빛미디어, 2025), 『챗GPT로 대화하는 기술』(한빛미디어, 2023), 『혼자 공부하는 데이터 분석 with 파이썬』(한빛미디어, 2023), 『Do it! 딥러닝 입문』(이지스퍼블리싱, 2019)을 집필했습니다.
『머신 러닝 Q & AI』(길벗, 2025), 『개발자를 위한 필수 수학』(한빛미디어, 2024), 『실무로 통하는 ML 문제 해결 with 파이썬』(한빛미디어, 2024), 『머신러닝 교과서: 파이토치 편』(길벗, 2023), 『스티븐 울프럼의 챗GPT 강의』(한빛미디어, 2023), 『핸즈온 머신러닝 3판』(한빛미디어, 2023), 『만들면서 배우는 생성 AI』(한빛미디어, 2023), 『코딩 뇌를 깨우는 파이썬』(한빛미디어, 2023), 『트랜스포머를 활용한 자연어 처리』(한빛미디어, 2022), 『케라스 창시자에게 배우는 딥러닝 2판』(길벗, 2022), 『개발자를 위한 머신러닝&딥러닝』(한빛미디어, 2022), 『XGBoost와 사이킷런을 활용한 그레이디언트 부스팅』(한빛미디어, 2022), 『구글 브레인 팀에게 배우는 딥러닝 with TensorFlow.js』(길벗, 2022), 『파이썬 라이브러리를 활용한 머신러닝(개정2판)』(한빛미디어, 2022), 『머신러닝 파워드 애플리케이션』(한빛미디어, 2021), 『파이토치로 배우는 자연어 처리』(한빛미디어, 2021), 『머신러닝 교과서 3판』(길벗, 2021)을 비롯해 여러 권의 책을 우리말로 옮겼습니다.
01-1 인공지능과 머신러닝, 딥러닝 인공지능이란 머신러닝이란 딥러닝이란 [키워드로 끝내는 핵심 포인트] [이 책에서 배울 것]
01-2 코랩과 주피터 노트북 구글 코랩 텍스트 셀 코드 셀 노트북 [키워드로 끝내는 핵심 포인트] [표로 정리하는 툴바와 마크다운] [확인 문제]
01-3 마켓과 머신러닝 생선 분류 문제 첫 번째 머신러닝 프로그램 [문제해결 과정] 도미와 빙어 분류 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [자주 하는 질문]
Chapter 02 데이터 다루기
02-1 훈련 세트와 테스트 세트 지도 학습과 비지도 학습 훈련 세트와 테스트 세트 샘플링 편향 넘파이 두 번째 머신러닝 프로그램 [문제해결 과정] 훈련 모델 평가 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제]
02-2 데이터 전처리 넘파이로 데이터 준비하기 사이킷런으로 훈련 세트와 테스트 세트 나누기 수상한 도미 한 마리 기준을 맞춰라 전처리 데이터로 모델 훈련하기 [문제해결 과정] 스케일이 다른 특성 처리 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [자주 하는 질문]
Chapter 03 회귀 알고리즘과 모델 규제
03-1 k-최근접 이웃 회귀 k-최근접 이웃 회귀 데이터 준비 결정계수(R²) 과대적합 vs 과소적합 [문제해결 과정] 회귀 문제 다루기 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제]
03-2 선형 회귀 k-최근접 이웃의 한계 선형 회귀 다항 회귀 [문제해결 과정] 선형 회귀로 훈련 세트 범위 밖의 샘플 예측 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제]
03-3 특성 공학과 규제 다중 회귀 데이터 준비 사이킷런의 변환기 다중 회귀 모델 훈련하기 규제 럿지 회귀 라쏘 회귀 [문제해결 과정] 모델의 과대적합을 제어하기 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [자주 하는 질문]
Chapter 04 다양한 분류 알고리즘
04-1 로지스틱 회귀 럭키백의 확률 로지스틱 회귀 [문제해결 과정] 로지스틱 회귀로 확률 예측 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제]
04-2 확률적 경사 하강법 점진적인 학습 SGDClassifier 에포크와 과대/과소적합 [문제해결 과정] 점진적 학습을 위한 확률적 경사 하강법 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [자주 하는 질문]
Chapter 05 트리 알고리즘
05-1 결정 트리 로지스틱 회귀로 와인 분류하기 결정 트리 [문제해결 과정] 이해하기 쉬운 결정 트리 모델 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제]
05-2 교차 검증과 그리드 서치 검증 세트 교차 검증 하이퍼파라미터 튜닝 [문제해결 과정] 최적의 모델을 위한 하이퍼파라미터 탐색 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제]
05-3 트리의 앙상블 정형 데이터와 비정형 데이터 랜덤 포레스트 엑스트라 트리 그레이디언트 부스팅 히스토그램 기반 그레이디언트 부스팅 [문제해결 과정] 앙상블 학습을 통한 성능 향상 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [자주 하는 질문]
Chapter 06 비지도 학습
06-1 군집 알고리즘 타깃을 모르는 비지도 학습 과일 사진 데이터 준비하기 픽셀값 분석하기 평균값과 가까운 사진 고르기 [문제해결 과정] 비슷한 샘플끼리 모으기 [키워드로 끝내는 핵심 포인트] [확인 문제]
06-2 k-평균 k-평균 알고리즘 소개 KMeans 클래스 클러스터 중심 최적의 k 찾기 [문제 해결 과정] 과일을 자동으로 분류하기 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제]
06-3 주성분 분석 차원과 차원 축소 주성분 분석 소개 PCA 클래스 원본 데이터 재구성 설명된 분산 다른 알고리즘과 함께 사용하기 [문제해결 과정] 주성분 분석으로 차원 축소 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [자주하는 질문]
Chapter 07 딥러닝을 시작합니다
07-1 인공 신경망 패션 MNIST 로지스틱 회귀로 패션 아이템 분류하기 인공 신경망 인공 신경망으로 모델 만들기 인공 신경망으로 패션 아이템 분류하기 [문제해결 과정] 인공 신경망 모델로 성능 향상 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제]
07-2 심층 신경망 2개의 층 심층 신경망 만들기 층을 추가하는 다른 방법 렐루 함수 옵티마이저 [문제해결 과정] 케라스 API를 활용한 심층 신경망 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [파이토치 버전 살펴보기]
07-3 신경망 모델 훈련 손실 곡선 검증 손실 드롭아웃 모델 저장과 복원 콜백 [문제해결 과정] 최상의 신경망 모델 얻기 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [파이토치 버전 살펴보기] [자주 하는 질문]
Chapter 08 이미지를 위한 인공 신경망
08-1 합성곱 신경망의 구성 요소 합성곱 케라스 합성곱 층 합성곱 신경망의 전체 구조 [문제해결 과정] 합성곱 층과 풀링 층 이해하기 [키워드로 끝내는 핵심 포인트] [확인 문제]
08-2 합성곱 신경망을 사용한 이미지 분류 패션 MNIST 데이터 불러오기 합성곱 신경망 만들기 모델 컴파일과 훈련 [문제해결 과정] 케라스 API로 합성곱 신경망 구현 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [파이토치 버전 살펴보기]
08-3 합성곱 신경망의 시각화 가중치 시각화 함수형 API 특성 맵 시각화 [문제해결 과정] 시각화로 이해하는 합성곱 신경망 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [파이토치 버전 살펴보기] [자주 하는 질문]
Chapter 09 텍스트를 위한 인공 신경망
09-1 순차 데이터와 순환 신경망 순차 데이터 순환 신경망 셀의 가중치와 입출력 [문제해결 과정] 순환 신경망으로 순환 데이터 처리 [키워드로 끝내는 핵심 포인트] [확인 문제]
09-2 순환 신경망으로 IMDB 리뷰 분류하기 IMDB 리뷰 데이터셋 순환 신경망 만들기 순환 신경망 훈련하기 단어 임베딩을 사용하기 [문제해결 과정] 케라스 API로 순환 신경망 구현 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [파이토치 버전 살펴보기]
09-3 LSTM과 GRU 셀 LSTM 구조 LSTM 신경망 훈련하기 순환층에 드롭아웃 적용하기 2개의 층을 연결하기 GRU 구조 GRU 신경망 훈련하기 [문제해결 과정] LSTM과 GRU 셀로 훈련 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] [파이토치 버전 살펴보기] [자주 하는 질문]
Chapter 10 언어 모델을 위한 신경망
10-1 어텐션 메커니즘과 트랜스포머 순환 신경망을 사용한 인코더-디코더 네트워크 어텐션 메커니즘 트랜스포머 셀프 어텐션 메커니즘 층 정규화 피드포워드 네트워크와 인코더 블록 토큰 임베딩과 위치 인코딩 디코더 블록 [키워드로 끝내는 핵심 포인트] [확인 문제]
10-2 트랜스포머로 상품 설명 요약하기 트랜스포머 가계도 전이 학습 BART 모델 소개 BART의 인코더와 디코더 허깅페이스로 KoBART 모델 로드하기 텍스트 토큰화 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제]
10-3 대규모 언어 모델로 텍스트 생성하기 디코더 기반의 대규모 언어 모델 LLM 리더보드 EXAONE의 특징 EXAONE-3.5로 상품 질문에 대한 대답 생성하기 토큰 디코딩 전략 오픈AI 모델의 간략한 역사 오픈AI API 키 만들기 오픈AI API로 상품 질문에 대한 대답 생성하기 [키워드로 끝내는 핵심 포인트] [핵심 패키지와 함수] [확인 문제] 부록 한 발 더 나아가기 : 이 책에 대한 독자의 질문
출판사리뷰
머신러닝과 딥러닝을 한 권으로 처음부터 끝까지 배우고 싶을 때 수식 없이 직관적으로 개념을 익히고 싶을 때 혼자서도 실습하며 AI 모델을 구현해 보고 싶을 때
》 하나, ‘입문자 맞춤형 학습 설계’로 개념과 실습을 함께 익힌다! 이 책은 머신러닝과 딥러닝을 처음 배우는 학습자를 위한 맞춤형 학습 설계로 구성되었다. 개념을 쉽게 이해할 수 있도록 스토리텔링 방식의 설명과 직관적인 비유를 활용하며, 모든 실습은 구글 코랩(Colab) 환경에서 바로 실행할 수 있도록 제공한다. 또한, 개정판에서는 각 장마다 ‘자주 하는 질문(FAQ)’ 코너를 추가하여 학습자의 궁금증을 바로 해결할 수 있도록 했다.
》 둘, 최신 AI 기술까지 다루는 확장된 실습 범위! 기존의 머신러닝 및 딥러닝 개념을 탄탄히 다지는 것은 물론, 개정판에서는 트랜스포머와 대규모 언어 모델(LLM) 실습을 새롭게 추가했다. 또한, 독자 요청이 많았던 파이토치 예제 코드를 보강해, 케라스뿐만 아니라 파이토치까지 함께 익힐 수 있도록 구성했다.
》 셋, 혼자서도 끝까지 학습할 수 있도록 [용어 노트], [유튜브 강의] 등 다양한 학습 지원 제공! 책을 읽으며 학습을 이어갈 수 있도록 혼공 용어 노트, 저자 유튜브 강의, Q&A 커뮤니티, 독자 전용 오픈 채팅 등을 지원한다. 어려운 개념이 나오더라도 언제든 참고할 수 있도록 복습 자료를 제공하며, 궁금한 점은 온라인 커뮤니티에서 해결할 수 있도록 했다.
▶ 학습 사이트: https://hongong.hanbit.co.kr
》 넷, 실습과 개념을 균형 있게 익히고 싶은 모든 학습자를 위한 책! 이 책은 머신러닝과 딥러닝을 처음 배우려는 입문자, AI 실습을 통해 직접 모델을 구현해 보고 싶은 개발자, 최신 AI 기술을 익히고 싶은 실무자까지 모두에게 적합한 학습서다. 머신러닝과 딥러닝을 체계적으로 익히고 싶다면, 지금 이 책을 만나보자.
?♂’프로그래밍 다음 단계’ _ 비전공자인 저같은 사람들은 요즘같은 세상의 이기들이 너무나 반갑습니다. 노트북 한대와 책만 있으면 얼마든지 프로그래밍을 배울 수 있기 때문이죠. 프로그래밍을 하면서 느끼는 것은 프로그래밍이 코딩과 같지는 않지만, 외국어를 공부하고 이를 통해 자신의 실력을 쌓아나가는 원칙은 굉장히 유사하다는 것입니다. 예를 들어 어휘를 많이 알고 세세한 문법을 안다고 차별화된 외국어 실력을 가진건 아니지만, 차별화된 외국어 실력을 가질려면, 전자는 기본적으로 익숙해져야 한다는 것과 마찬가지지요. 아직은 프로그래밍에 많이 부족한 단계임에도 보다 시간이 흘러서 익숙해지면 저의 다음단계는 바로 데이터를 가지고 모델링을 하는, 머신러닝과 딥러닝 단계로 가는 것이라 생각합니다. <혼자 공부하는 머신러닝+딥러닝>은 그 와중에 훌륭한 스승이 되어줄 서적입니다.
어떤 서적이든 이해가 가장 우선입니다. 이해가 되고 나서 연습을 많이 해보야죠. 머신러닝 모델링 역시 이와 다르지 않습니다. 어느정도의 파이썬등 프로그래밍 언어와 손코딩에 익숙해졌다면 이제는 그러한 실습들을 어떻게 활용하느냐가 중요한데 그러기 위해서는 다양한 데이터 분석과 머신러닝의 모델링에 대한 원리의 이해가 필요합니다. 본서는 스토리텔링방식의 예제를 전달하기 때문에 개념을 이해하기에 아주 적합합니다. 그 반대급부로 다른 시리즈보다는 상당히 서적이 두껍다는 단점이 있지만 많은 수식이나 통계학적 지식이 없는 것을 그 분량으로 채운다고 보시면 됩니다.
본서의 중반부터는 머신러닝을 넘어 딥러닝으로 들어갑니다. 여기서 다양한 트랜스포머를 활용하게 되는데 합성곱 신경망의 시각화나 트랜스포머를 활용하는 법을 넘어 LLM으로 텍스트 생성까지 진행하면서 파이토치, 텐서플로, 케라스 등을 이용하는 과정에서 저같은 실력이 부족한 비전공자에게는 한단계 시야와 실력을 업그레이드하면서 인공지능 신경망 모델로 진입하는데 큰 도움을 주는 서적이라고 생각합니다.
무엇보다 <혼자..>의 가장 큰 장점은 학습인프라입니다. 저자가 1:1과외를 하듯이 전부 대답을 해주고 유튜브와 저자질문이 가능합니다. 혼자 공부하는 서적임에도 분명히 한계에 도입할 수 있거든요. 뿐만 아니라 ‘혼공학습단’이라는 별도의 비대면 학습 커뮤니티를 이용하는 것을 추천드립니다. (저 역시 3회 정도 참여를 했고 앞으로도 참여를 할 예정입니다) 아직 본서를 전부 실습하지 못했지만, 2회독 정도 수개월이 걸쳐 실습을 마치면 분명 실력이 상당히 향상되어 있을거라 생각합니다
『혼자 공부하는 데이터 분석 with 파이썬』 책을 처음 보고서 박해선 저자님 다른 책들도 차례로 보고 싶다고 생각했었는데, 그 사이에 『혼자 공부하는 머신러닝+딥러닝』 책은 벌써 개정판이 출간되었습니다.
입문자 입장에서 새로운 언어를 배울 때 아무래도 최신 버전이 반영된 책으로 공부하는 편이 혼동없이 공부할 수 있다고 생각되는데, 모두 이번에 처음 다뤄보는지라 이번 『혼자 공부하는 머신러닝+딥러닝』 개정판 또한 케라스, 파이토치 최신 버전을 담고 있는 것 같아서 좋습니다.
700쪽이 넘는 분량으로 책 두께가 상당한데요. 그만큼 설명이 상세하고, 실습 예제가 풍부하게 담겨 있습니다.
머신러닝, 딥러닝 분야에 관심이 많이 있어서 욕심껏 이번 책에 도전해 본 마음도 있었고, 혼자 공부하는 시리즈로 프로그래밍 언어를 독학했던 경험이 하나 둘 쌓이면서 머신러닝, 딥러닝도 분명 진짜로 혼자 공부할 수 있게 만들어진 책일 것이라는 믿음(?)으로 이번 책에 도전해보게 되었는데요.
워낙 아는 게 없어서(?) 더디긴 합니다만, 책 설명 자체가 강의 듣는 것처럼 체계적이고 상세하게 설명되어 있어서 이해하면서 공부할 수 있어서 좋고, 무엇보다 유튜브 동영상 강의가 무료로 제공되어서 정말 도움이 많이 됩니다. 이전에 공부했던 다른 혼공 시리즈도 유튜브 동영상 강의가 모두 제공됐지만, 하나하나 다 보지는 않았던 것 같은데, 머신러닝, 딥러닝은 워낙 기초가 없는 분야라 동영상 강의도 모두 챙겨보려고 합니다.
그 외에는 정말 혼자 공부 할 수 있도록 해주기에 다른 학습 전 요구되는 내용은 없습니다.
[ 책 구성 ]
이 책은 처음에 "학습 로드맵"을 제시하고 있기에 해당 하는 부분들 확인 후 개인의 이해도에 따라 적절하게 학습 계획을 가지고 학습 할 수 있습니다.
"학습 로드맵" 에도 얘기된 것 처럼 "1 ~ 6장" 이 머신러닝 관련이고 "7 ~ 10장" 이 딥러닝 관련 입니다.
혼자 공부할 수 있게 해주는 책인 만큼 학습 하면서 프로그램을 테스트 해볼 수 있도록 "코랩과 주피터 노트북" 에 대해서 사용법을 상세하게 설명하고 있기에 도구에 대한 부분을 별도 인터넷을 찾아서 사용법을 알아볼 필요는 없습니다.
책 내용들은 대화체 형태로 작성되어 있다 보니 전문가 선생님의 과외를 받고 있는 듯한 느낌이 듭니다.
딱딱하지 않게 지루하지 않게 표현되어 있어서 책 내용에 다가가기 더 좋은 것 같습니다.
설명 중간 중간에 직접 확인이 필요한 부분들은 "손코딩" 이라는 블럭으로 파이썬 코드를 직접 타이핑 해보고 확인 할 수 있도록 제공하고 있으며, "여기서 잠깐" 블럭으로 의미를 알면 좋을 내용 또는 좀 더 기초적인 내용들을 알 수 있게 제공 하고 있습니다.
각 섹션의 마지막에는 "마무리" 블럭으로 학습한 애용들에 대해서 상기 시켜 주고 "확인 문제" 를 두어 최소한 알아야할 부분에 대해 내용을 이해하고 있는지 확인 할 수 있도 제공 하고 있습니다. "확인 문제" 에 대한 답은 "부록" 에 있긴 합니다만 모르는 문제에 대해서는 다시 찾아보고 답을 찾는 과정이 있으면 좋을 것 같습니다.
[ 결론 ]
다른 머신러닝, 딥러닝 기초를 책 한권으로 혼자서 공부 할 수 있도록 책 구성이 잘 되어 있습니다.
여느 기초 서적들과 다르게 상황을 만들어서 그 주제를 가지고 직접 손코딩을 통하여 시험해 가면서 학습 할 수 있도록 구성되어 있어서 딱딱하지 않게 접근 할 수 있어서 좋은 것 같습니다.
일부 부족한 부분들에 대해서는 이 책을 한번 학습 한 후 다른 기초 책과 병행해서 학습하면 더 좋을 것 같습니다.
『혼자 공부하는 머신러닝+딥러닝(개정판)』은 인공지능 입문자를 위한 최적의 자습서로, 최신 트랜스포머 구조와 대규모 언어 모델(LLM) 실습을 추가해 기술 흐름에 맞춘 학습 경험을 제공한다. 구글 코랩 기반 실습으로 환경 설정 없이 바로 실습이 가능하며, 케라스와 파이토치를 병행해 다양한 프레임워크를 익힐 수 있다.
각 장마다 핵심 키워드, 확인 문제, FAQ 등이 포함되어 있어 혼자서도 체계적으로 학습할 수 있으며, 저자의 유튜브 강의와 커뮤니티 지원도 큰 장점이다. 생선 분류 문제에서 시작해 회귀, 분류, 신경망, 트랜스포머까지 단계별로 구성된 커리큘럼은 실제 프로젝트 적용까지 염두에 둔 구성이 인상 깊다.
AI에 첫발을 내딛는 학생, 교사, 개발자 모두에게 추천하며, 개정판은 기존보다 더 강화된 실습 중심의 구성으로 실용성과 완성도를 모두 갖춘 입문서라 할 수 있다.
※ 이 서평은 한빛미디어 서평단 <나는 리뷰어다> 활동을 위해 도서를 협찬 받아 작성되었습니다.
리액트와 자바스크립트 개발에 익숙한 저는 머신러닝(ML)과 딥러닝(DL)이 꽤 낯선 영역이었습니다. 파이썬도 간단한 스크립트 정도만 다뤄봤고, 수학 공식과 개념에도 자신이 없었죠. 그런 저에게 ‘혼자 공부하는 머신러닝 + 딥러닝’은 부담 없이 따라갈 수 있는 초보자 맞춤 가이드였습니다.
이 책의 가장 큰 장점은 초보자도 차근차근 따라올 수 있게 기본 개념부터 고급 내용까지 체계적으로 구성된 점입니다. 데이터 전처리부터 시작해 회귀, 분류 같은 기초를 다진 뒤 CNN(합성곱 신경망), 트랜스포머 같은 최신 기술로 자연스럽게 넘어갑니다. 확률적 경사 하강법을 산비탈을 내려가는 비유로 설명한 부분은 특히 이해하기 쉬웠는데, 복잡한 수학보다는 직관적 그림과 예시 중심이라 리액트에서 상태 관리 패턴을 익히는 것처럼 개념을 받아들이기 수월했습니다.
실습 예제도 인상적입니다. NumPy와 scikit-learn 라이브러리를 활용해 MNIST 이미지 분류를 직접 구현하는 과정은 프론트엔드에서 UI 컴포넌트를 만들고 데이터를 관리하는 일과 닮아 있었습니다. 특히 “손코딩”을 강조해 코드를 무조건 복사하는 대신 직접 타이핑하며 흐름과 원리를 체득하게 유도한 점이 좋았습니다. 다만, 확인 문제 중 몇몇은 생각할 거리를 많이 던져주어 반복 학습이 필요했어요.
책이 코딩과 이론 사이에서 균형을 잘 맞춘 점도 돋보입니다. 단순히 코드를 나열하거나 수학 공식을 풀기보다, 알고리즘이 탄생한 배경과 해결하려는 문제를 설명해 개념의 ‘이유’를 알게 해줍니다. 어텐션과 트랜스포머가 자연어 처리 분야에 어떤 혁신을 가져왔는지를 다룰 때는, 리액트에서 모듈화와 재사용성을 중요시하는 개발자의 시선으로 기술을 이해하는 데 도움이 됐습니다. CNN의 각 층을 색깔별로 구분한 시각적 설명은 복잡한 데이터 흐름을 컴포넌트 트리처럼 생각하게 해 친숙했죠.
다만 후반부 딥러닝 심화 내용(LSTM, 트랜스포머 등)은 익숙지 않은 개념이 많아 여러 차례 반복해서 공부해야 했습니다. 수학 용어나 개념이 가끔 등장해 부담스럽기도 했고, 리액트처럼 빠른 피드백을 기대하다 보니 모델 학습의 긴 시간 간격에는 적응이 필요했습니다.
종합하면, 이 책은 프론트엔드 개발자 등 비전공자나 AI 입문자에게 적합한 입문서입니다. 단기간에 훑고 끝낼 책이 아니라, 실습과 복습을 반복하며 천천히 내 것으로 만들어야 합니다. Jupyter Notebook과 GitHub를 활용해 공부하면 마치 리액트 프로젝트를 관리하듯 효율적으로 학습할 수 있습니다. AI 기술을 웹과 연결하는 미래를 준비하는 분들께 좋은 첫걸음이 될 것입니다.
이 책은 머신러닝과 딥러닝 분야에 처음 입문하는 독자를 위한 친절한 안내서입니다. 프로그래밍 기초(파이썬) 지식만 있다면 누구나 혼자서 학습할 수 있도록 체계적으로 구성되었습니다.
인공지능, 머신러닝, 딥러닝의 기본 개념부터 시작하여, 실습 환경 구축(코랩/주피터 노트북) 및 데이터 준비/전처리 방법을 배웁니다. 이어서 회귀, 분류, 트리 알고리즘, 앙상블, 비지도 학습 등 머신러닝의 핵심 알고리즘을 이론 설명과 함께 실제 코드로 구현하며 익힙니다. 모델 평가 및 성능 향상 기법(교차 검증, 하이퍼파라미터 튜닝)도 다룹니다.
책의 후반부에서는 딥러닝의 기초인 인공 신경망 구조를 배우고, 케라스(Keras)를 활용하여 심층 신경망을 구축하고 훈련하는 과정을 상세히 안내합니다. 특히 이미지 처리를 위한 합성곱 신경망(CNN)과 텍스트 처리를 위한 순환 신경망(RNN, LSTM, GRU)을 실제 예제와 함께 다룹니다. 개정판에서는 최신 AI 트렌드를 반영하여 트랜스포머(Transformer)와 대규모 언어 모델(LLM)에 대한 내용까지 추가하여 학습 범위를 넓혔습니다.
각 장마다 [문제해결 과정]을 통해 실제 개발처럼 사고하는 과정을 경험하고, [키워드로 끝내는 핵심 포인트], [확인 문제], [자주 하는 질문] 등을 통해 학습 내용을 효과적으로 점검할 수 있습니다. 이론과 실습의 균형을 갖춘 이 책은 머신러닝과 딥러닝의 탄탄한 기본기를 쌓고 싶은 입문자에게 최고의 선택이 될 것입니다.
초판이 나왔을 때 바로 구입해서 봤던 책이고 현재 강의 교재로 활용하고 있는 책이기도 합니다. 이 책을 교재로 활용하는 이유는 쉽고 자세한 설명 때문이었습니다. 그리고 내용이 너무 방대하거나 간결하지않고 분량도 적당해서 강의용으로 딱 좋습니다. 그리고 내용도 가상의 인물들이 데이터분석을 업무에 적용해가는 스토리텔링식으로 이루어져있어서 지루하지 않고 재미있게 공부할 수 있습니다.
책의 표지입니다. 왼쪽이 구판이고 오른쪽이 개정판입니다. 개정판에서 달라진 부분 위주로 소개하겠습니다.
1. 내용추가
이전판에서 챕터 하나가 더 추가되었습니다. 구판은 텍스트를 위한 인공 신경망 RNN, LSTM, GRU 까지만 나와 있었는데 최근 GPT를 필두로한 LLM의 발전에 발맞추어 Attention과 Transformer에 대한 내용이 새롭게 추가되었습니다.
2. 자주 하는 질문 코너 추가
개정판에서 아주 마음에 들었던 부분인데요. 구판에서 독자들이 남긴 질문을 모아서 자주하는 질문이라는 코너가 챕터 중간중간에 추가되었습니다. 다른 책에서 다루는 내용이라 본 책에서 빠진 내용도 있고, 아주 자세히 설명하기에는 수준이 맞지 않아서 생략된 내용들에 대해서 들어온 질문들 중 자주 나왔던 질문을 모아서 답변을 정리해 주었습니다.
3. 텐서플로, 케라스 최신 코딩 문법 반영
tensorflow 2.16 이후부터 keras3.0이 도입되면서 tensorflow를 이용해 코딩시 문법이 몇 몇 변경되었습니다.
예전에는
model.add(Flatten(input_shape(28,28))
이렇게 작성했던 코드가
model.add(Input(shape=(28,28))
model.add(Flatten())
이런 식으로 변경되었죠.
데이터를 넣는 입력층을 만들때 방식이 변경된 것인데 최신 버전에 맞추어 코드가 잘 변경되어 있었습니다. 이것 외에도 모델을 저장할 때 구 버전에서 .h5로 저장하던 것이 .keras로 변경되었는데 그런 부분도 빠짐없이 다 변경되어 있습니다.
4. 파이토치 내용 추가
그리고 파이토치에 대한 내용도 추가되어 있습니다. 파이토치는 Meta에서 만든 딥러닝 라이브러리인데 주로 학계에서 많이 사용하고, LLM 쪽에서는 파이토치를 더 많이 사용하는 경향이 있습니다. 사전 학습된 모델을 사용할 수 있는 hugging face나 lang chain을 이용할 때도 파이토치가 더 많이 사용되고요. 그래서 그런지 파이토치에 대한 내용이 새롭게 추가되었고, 그 덕에 tensorflow와 pytorch 코드를 비교하며 공부할 수 있습니다.
5. 어텐션과 트랜스포머 내용 추가
LLM 이 대세인 만큼 혼자공부하는 머신러닝 + 딥러닝에도 LLM이 탄생할 수 있었던 배경인 attention과 transformer 에 대한 내용이 추가되었습니다. 새로운 챕터가 생긴 것으로 앞 부분의 내용과 연계된 내용으로 재미있게 학습할 수 있습니다.
6. 마무리
이번에 새롭게 개정된 혼자공부하는 머신러닝 + 딥러닝에 대해서 이전 책과 달라진 점에 대해서 소개했는데요. 최신 트랜드에 맞추어 attention과 transformer에 대한 내용이 추가된 점이 가장 큰 차이점이지만, 독자들의 질문을 모아놓은 자주하는 질문 코너를 통해 독자들의 의문점을 해결해준 점, 그리고 최신 버전의 코드로 모두 업그레이드 해준 점이 아주 마음에 들었습니다. 이제 시계열 분석만 추가된다면 더 바랄 것이 없는 책이 될 수 있겠네요. 다음 개정판도 기대해 보겠습니다. ^^
그 동안 머신러딩, 딥러닝에 대한 책을 여러권 보았는데, 책을 처음에 보면 꼭 Python 기초 문법부터 시작을 해서 본격적인 머신러닝은 뒷편에 30% 정도로 소개하고 끝나는 책이 많았다. 최근 AI 도서에서는 많은 양의 데이터로 여러가지 머신러닝 방법을 소개한다. 정말 신기했고 결과물은 환상적이였다. 하지만 이 코드로 응용을 하기에는 데이터에 대한 이해가 많이 부족했다.
이번에 공부한 도서 '혼자 공부하는 머신러닝+딥러닝'은 스토리가 있는 도서다. '혼공머신'이라는 친구가 정말 간단한 데이터로 머신러닝을 시작한다. 이후 데이터도 복잡하게 하나 하나 늘어나며 미처 생각치 못했던 이상 결과물에 대해서 하나 하나 고쳐나가는 모습으로 점점 머신러닝을 이해해 가게 된다.
기존에 AI를 공부하면서 계속해서 수학 공부가 필요하다는 생각이 많이 들었고 데이터에 대해서 더 공부를 해야겠구나라는 생각도 많이 했었다.
물론 이 책을 난이도가 쉬운 데이터로 부터 학습을 했다고 해서 나의 부족했던 면이 나아지는 것은 아니다.
이해하기 쉽게 설명을 했을 뿐이지 중간 중간에 나오는 수학적인 용어가 나와서 파이썬에서 numpy로 쉽게 결과값을 얻어내지만 '왜?'라는 궁금증 까지는 해결되지 않는다. 수학책이 아니니 이부분은 내가 따로 학습해야 하는 부분이다.
그리고 다른 AI도서와는 다르게 중간 중간에 데이터 검증이 자주 나오는데 '산점도'를 이용해서 이해하기 쉽게 검증을 하는 모습을 종종 보여준다.
머신러닝 까지는 어떻게 어떻게 넘어는 갔지만 역시 AI는 쉽게 얻을 수 있는 지식은 아닌 것은 확실한 것 같다.
Java 개발자로 코드를 학습하는 것은 쉽지만 학습하면서 학창시절 수학 공부하는 것만 같았다. 그만큼 내용이 쉽지 않다는 말입니다.
1독으로 배불리려는 욕심이 과했던 것 같아, 한번 정리해보고 다시 처음부터 놓치고 지나간 부분을 찾아 다시한번 복습해서 진짜 내것으로 만들어보는 시간도 갖아야 할 것 같다.
너무 쉽게 AI를 공부하려고 했는데 그렇게 쉽지만은 않았고 어려운 상황을 쉽게 풀어 쓰려고 하는 작가님의 노력이 보여 글자 하나 허투루 넘길 수가 없는 책이 였지만 허투루 넘기게 되었..
아무튼, 도서의 중간 지점부터는 한페이지가 넘어가기가 쉽지 않았으며 뒤로 갈 수록 눈으로만 보게 된다.
소스코드만 마냥 따라 칠 수는 없기에 도서만 읽고 추후에 다시 시간 내어 이해하며 보고자 한다.
기존에 나와있는 도서보다는 상황설명부터 스토리 텔링 형태로 풀어나가 이해하기가 수월했다.
AI 개발자에 관심이 있으신 분들은 이 도서를 먼저 보고 볼 만하다면 더 깊이있게 공부를 해도 좋을 것 같다. 이 책이 AI 개발 시작의 길잡이가 기꺼이 되어줄 책이다.
도서의 앞부분만 보고 머신러닝을 판단하지 말고 적어도 중간까지는 살펴보기 바란다. 앞부분 보고 별거 아니네 하고 섣부른 판단을 하지 않길 바라며 AI에 관심이 있는 모든 개발자에게 꼭 추천해주고 싶은 책이다.
긴 연휴 동안 이것저것 책을 많이 읽어봤지만, 솔직히 끝까지 다 읽은 건 이 책이 유일했어요. 한 번만 읽고 끝낸 게 아니라 여러 번 다시 보기도 했고요. 이유는 간단해요. 일단 어렵지 않거든요. 보통 머신러닝 책이라고 하면 판다스, 넘파이, 맷플롯립 같은 생소한 라이브러리 이름부터 머리가 아픈데, 이 책은 그런 배경지식이 없어도 무난하게 읽을 수 있었어요. 저처럼 처음 시작하는 사람에게 딱이죠.
그리고 각 단원 끝에는 요약도 잘 되어 있고, 복습 문제도 있어서 공부한 걸 다시 확인해볼 수 있어요. 마치 학교 교과서처럼 말이죠. 아! 그리고 저자가 만든 유튜브 강의도 있어서 아침에 지하철 타고 이동 할 때 짬짬이 보기에 정말 좋아요. 눈으로 글만 보는 게 아니라 실제 강의를 들으니까 이해도 훨씬 잘 되더라고요.
책에서는 머신러닝과 딥러닝이 어떤 건지 전체적인 그림도 보여줘요. 뭔가 하나하나 다 외우는 식이 아니라, 큰 흐름을 먼저 알려줘서 전체가 어떻게 돌아가는지 감이 잡혀요. 게다가 부록으로 혼공노트가 들어 있는데, 거기엔 키워드 위주로 핵심 정리가 잘 되어 있어서 ‘어? 앞에서 뭐라고 했더라?’ 싶을 때 꺼내서 보면 기억이 바로 나요. 요게 진짜 꿀이에요.
또, 고사양 컴퓨터가 없어도 걱정 없어요. 코랩이라는 웹 기반 툴로 직접 코딩도 해볼 수 있어서 집에 평범한 노트북만 있어도 무리 없이 따라갈 수 있거든요. 그리고 책에 나오는 코드도 저자 깃허브에서 최신 버전으로 계속 업데이트돼서, 옛날 코드 때문에 오류 나는 일도 거의 없어요. 현업에 있는 사람들이 실전에서 필요로 하는 것들 위주로 내용을 구성해뒀다는 게 느껴져요.
무엇보다 이 책은 초보자 입장에서 정말 친절해요. 어려운 수학 공식 같은 건 최소한으로 줄이고, 이해하기 쉬운 비유랑 예시로 설명해줘요. 마치 이야기책처럼 술술 읽히는 구성이라서, 지루할 틈이 없어요. 만약 "머신러닝 책 딱 한 권만 봐야 한다!"고 묻는다면, 저는 이 책을 자신 있게 추천할 거예요.
혼자 공부하다가 포기한 적이 있다면, 이 책으로 다시 시작해보는 걸 추천해요. 꼭 돌파구를 찾게 될 거예요. 만약 혼자 하는 게 너무 힘들다면, 저자가 운영하는 ‘혼공학습단’에 참여해서 같은 목표를 가진 사람들이랑 함께 공부하면 동기부여도 되고, 재미도 배가 될 거예요.
많은 데이터 분석 책들이 그냥 데이터를 어떻게 불러오는지, 어떻게 예쁘게 꾸미는지에만 집중하는 반면, 이 책은 머신러닝 모델 자체를 제대로 알려줘요. 회귀, 분류, 군집 같은 알고리즘은 물론이고, 뒤쪽에는 딥러닝까지도 나와요. 개발자가 실제로 궁금해하는 부분들―예를 들면 "이 알고리즘은 어디에 써야 해?", "이 파라미터는 뭐지?" 같은―그런 것도 빠짐없이 알려줘서, 실전에서 바로 쓸 수 있는 지식을 배울 수 있어요.
『혼자 공부하는 머신러닝+딥러닝(개정판)』은 인공지능을 처음 접하는 입문자에게 최적화된 자습서로, 개정판에서는 최신 기술 트렌드를 반영하고 실습 경험을 강화하여 학습의 깊이와 폭을 모두 끌어올렸다고 생각되었다. 기존판이 머신러닝과 딥러닝의 기본 개념과 실습을 중심으로 구성되었다면, 개정판은 여기에 최신 트랜스포머 구조, 챗GPT와 같은 대규모 언어 모델(LLM)까지 포함해 최신 AI 흐름에 발맞춘 실습 경험을 제공한다.
특히 개정판은 실습 환경을 더욱 편리하게 구성해 구글 코랩 기반의 실습이 가능하도록 하여서, 독자들이 별도의 환경 설정 없이 곧바로 실습을 할 수 있도록 하였다. 또한 케라스뿐만 아니라 파이토치 기반 실습도 함께 제공하여, 다양한 프레임워크를 접해보고 싶은 독자들에게도 유용하다고 생각된다.
기존판의 강점이었던 명확한 설명과 단계별 학습 구성은 그대로 유지하면서, 개정판에서는 ‘자주 하는 질문(FAQ)’, ‘혼공 용어 노트’, ‘혼공 플랜’ 등의 학습 보조 도구가 더욱 강화되어 혼자서도 문제없이 공부할 수 있게 도와준다는게 장점이다. 또한, 저자의 유튜브 강의와 Q&A 커뮤니티도 지속적으로 운영되어 학습 중 겪는 어려움을 빠르게 해소할 수 있도록 한다는것도 좋았다.
무엇보다 이 책의 가장 큰 장점은 ‘혼자 공부하는’ 독자를 위해 설계된 세밀함과 친절함이다. 복잡한 수식이나 개념을 최소화하면서도, 필요한 부분은 명확하게 짚어주고, 실습 중심의 학습을 유도한다. 머신러닝의 기초 알고리즘부터 CNN, RNN, LSTM, 트랜스포머까지의 흐름을 차근차근 따라가다 보면, 어느새 실전 프로젝트에 적용 가능한 수준의 실력을 쌓을 수 있으리라 생각된다.
이 책은 AI 분야에 첫발을 내딛고 싶은 입문자, 대학생, 실무에 딥러닝 기술을 적용하고자 하는 개발자 모두에게 강력히 추천하는 바이다. 최신 AI 흐름에 대한 내용을 익히고, 혼자서도 끝까지 공부할 수 있는 동기부여와 관련자료를 제공한다는 점에서 개정판은 기존판을 뛰어넘는 실용성과 완성도를 갖췄다고 할 수 있겠다.
아직은 그 발전 범위가 점차 넓혀지는 중이기 때문에 이것이 크게 와닿지 않는 분야도 있겠지만, 자신의 삶 어느 부분이건 조금이라도 AI를 사용하지 않은 사람은 아마 없을 정도로 대중화 되어 있다.
지금은 AI라는 이름으로 정리되어 서비스를 사용중이지만(특히 생성형AI)
이전에는 머신러닝, 딥러닝에 대한 학습이 주를 이루었던 때가 있었다.
이렇게 빠르게 발전할 줄은 미처 몰랐지만, 필요성은 느꼈던 시절이다.
그래서 공부를 하고 싶다는 생각이 들었지만 아무래도 난이도가 높아서 계속 좌절함을 느끼곤 했다.
그렇게 시간이 빠르게 지나가서 응용에 관한 책만 읽었는데, 이러던 중 다시 머신러닝과 딥러닝에 대한 관심을 갖고 책을 보기 시작했다.
관심있게 보던 이 책에 대해 개정판이 나온 것이다.
책 정보
코랩을 통한 실습을 기반으로 하기 때문에 환경 구축에 대해 부담이 없다.
1:1 과외하듯 배우는 느낌이 들도록 한다는 것이 인상적이다.
이 책을 읽으면서 나만 알기에는 너무 좋다는 생각을 많이 하게 되었는데, 아래의 후기를 적은 독자와 의견을 같이 하게 되었다.
'2천만 원짜리 국비 교육보다 더 효과적으로 머신러닝과 딥러닝의 기본 원리를 알 수 있었습니다.'
- 정가: 32,000원
- 분량: 747쪽
- 저자: 박해선
인상받은 부분
끌리는 목표가 눈에 띄었다.
LLM으로 텍스트를 생성하는 것을 내가 직접 구현한다니. 머신러닝을 공부하려는 사람에게 이 얼마나 구미가 당기는 목표인가.
물론 이곳까지 이르기엔 장장 700쪽이 넘는 분량을 읽고 이해하는 것이 필요하다.
하지만 당연히 지식의 축적이 필요한 부분이기 때문에 이것은 피할수가 없다.
어쩌면 내용의 깊이에 비해 700쪽이면 상대적으로 저렴하게 느껴질 정도이다.
그렇다고 시작하는 챕터가 그렇게 높은 난이도를 요구하지도 않는다. 아주 기초부터 차근히 밟아나가게 한다.
이 책에서 눈에 띄는 부분은 도입부 부분에서 다루고 있는 비유로 현재의 개념을 설명한 부분들이다.
사실 머신러닝을 학습하기 위해서는 많은 개념과 용어를 공부해야 한다.
그렇기 때문에 하나씩 학습할 때마다 그 높은 산을 넘어야 하는데, 그것으로 인해 포기하기 쉽다.
하지만, 이 비유는 그것을 쉽게 넘도록 도와준다.
그리고 중간에 이해가 어려운 부분은 가급적 그림을 넣어서 이해를 쉽게 도와준다. 상당히 친절하게 느껴졌다.
실습이 쉬운것도 마음에 들었다.
사실 이런 실습이 중요한 책은 환경 구축에서 먼저 어려움을 느끼는 경우가 적지 않았다.
로컬 환경에서 각자 환경을 구축하다보면, 특히 파이썬의 경우 버전이나 플랫폼의 영향을 많이 받기도 해서 venv를 이용하기도 하지만, 이 책은 아예 google의 colab(https://colab.research.google.com/)을 이용해서 그마저도 없애주었다.
그리고 가독성이 높은 것은 물론이거니와 여러 데이터를 타이핑하게 되는 시점에서는 적절하게 bit.ly 숏링크를 제공해서 굳이 타이핑하며 오타를 유발하지 않도록 도와주었다. 사실 데이터는 일일히 입력한다고 실력에 도움이 되는 것도 아니기 때문에 적절했다고 생각한다. 오히려 그 데이터를 기반으로 함수 호출에 집중하게 함으로써 불필요한 곳에 에너지를 낭비하지 않도록 하였다.
그리고 그 출력된 데이터도 보여줌으로써 실제 실습하기 어렵다면 이것만으로도 이해가 되도록 하였다.(물론 실습하면 당연히 더 좋다.)
서두에서 언급했다시피 LLM에 대한 학습 부분이 인상적이었다.
그것도 수박 겉핥기 식으로 대충 한 것이 아닌, 스텝바이스텝으로 차근차근 알려준다.
텍스트를 토큰화해서 다뤄야 하는 이유를 말해주고, 그것을 실제 손과 눈으로 경험하게 해준다.
그리고, 출력물이 다듬어지지 않았을 시점에서는 이렇게 중간에 나올 수 있음을 이야기 하고 이것을 정리하는 방법도 알려준다.
실제 내가 LLM으로 데이터를 뽑아내는 과정에서도 유용하게 사용될 수 있을 듯 하다.
그리고, 모든 학습에는 확인문제가 존재한다. 이것으로 스터디 교재로 삼거나, 누군가를 가르쳐줄 때 유용한 도구가 될 것이다. 정답도 맨 뒤에 몰아있기 때문에 의지가 굳건하다면 컨닝하기도 쉽지 않다.
마지막으로 이곳에 있는 작은 옥의티가 있어서 이 부분을 언급하자면, 저자의 이력에서 Google AI GED로 활동한다고 적혀있는데, GED가 아닌 GDE(Google Developer Experts, https://developers.google.com/community/experts)이다. 혹 나중에 다시 인쇄할 일이 있다면 고쳐졌으면 좋겠다.
이 책을 추천하고 싶은 독자
AI 자체에 관심이 있다면 그런 사람들에게 추천하고 싶다.
특히 기술부분에서 접근하고 싶었으나 높은 난이도로 인해 포기했다면 이 책으로 다시 시작하기를 권하고 싶다.
머신러닝과 딥러닝. 이것은 AI 분야에서 빼놓을 수 없는데, 이 책을 제대로 통달하고 난 뒤라면 아마도 다른 산들을 정복할 준비가 된 상태가 될 것이다.
총평
이 책은 난이도가 높게 시작하지는 않지만, 독자를 크게 성장시켜 줄 것이다.
AI 분야에 문외한이라 할지라도 말이다.
다양한 프로그래밍 분야에 관심이 있는 사람이라면 당연히 딥러닝 머신러닝에 대해 관심을 가졌을 것이다.
이 책으로 학습을 해도 좋고, 어느정도 지식이 있는 사람이라면 본인의 실력을 점검하기에도 좋다.
둘 다 만족한 상태라면, 누군가를 가르치기에도 좋다.
그리고 책의 정성과 퀄리티가 상당하며, 그에 비해 비용은 매우 저렴하다. 다소 두꺼워서 짧은 기간에 다 읽기는 어렵지만 그정도는 단점이라고 보기엔 매우 사소하다.
AI 시대에 관련 기술자로 먹고 사는 사람이 아니더라도, 대화를 할 수 있는 지식을 만들어 주는 책
“혼자 공부하는 머신러닝+딥러닝”을 처음 펼쳤을 때, 마치 예전 대학 시절로 돌아간 듯한 기분이 들었다. 지도 교수 없이도 혼자서 코드를 뜯고, 이론을 곱씹으며, 반복된 시행착오 속에서 하나하나 깨우치던 그 시간들. 이 책은 바로 그 시절의 ‘1:1 과외 선생님’이 되어주었다. 친절하지만 결코 얕지 않고, 탄탄하면서도 부담스럽지 않게, 엔지니어의 시선에서 본다면 실로 이상적인 머신러닝 입문서라 할 만하다.
책은 인공지능의 개념부터 시작해, 구글 코랩 환경에 익숙해지는 것으로 출발한다. 여기까지는 많은 입문서들이 채택하는 전형적인 흐름이다. 하지만 이 책의 진가는 다음부터 드러난다. '생선 분류 문제'라는 간단해 보이는 예제 안에 머신러닝의 전형적인 문제정의-데이터 준비-모델 학습-평가라는 사이클을 녹여냈고, 이를 실습 중심으로 풀어가며 자연스럽게 독자를 모델 개발의 문턱으로 이끈다. 특히 “도미와 빙어”라는 친근한 예제 덕분에, 개념이 보다 피부에 와닿았다.
다음장에서는 머신러닝의 알파이자 오메가인 데이터 전처리의 중요성을 강조한다. '수상한 도미 한 마리' 에피소드는 편향된 데이터가 어떻게 잘못된 의사결정으로 이어지는지를 직관적으로 보여주며, 엔지니어로서 데이터의 본질을 보는 눈을 키워준다. 넘파이와 사이킷런을 활용한 전처리 코드도 깔끔하게 정리되어 있어, 실전에서 그대로 응용 가능하리라 생각된다.
회귀, 분류, 트리 기반 모델 등 지도 학습의 핵심 알고리즘을 다루는 부분에서는, 단순히 공식을 나열하는 것이 아니라 각 알고리즘이 해결하려는 문제와 사용처를 명확히 짚어준다. 특히 릿지, 라쏘 회귀를 통한 모델 규제, 교차 검증과 하이퍼파라미터 튜닝, 그리고 앙상블 학습의 성능 향상 효과를 다룰 때는 실제 업무에 바로 적용할 수 있을 만큼 실용적이고, 문제 중심적 접근이 돋보인다.
다음 차례로 비지도 학습의 감을 잡을 수 있도록 k-평균 군집, PCA를 이용한 차원 축소 등을 단계적으로 설명한다. 여기서의 설명은 수학적 엄밀성보다는 직관에 집중하고, 시각적인 예시와 함께 데이터의 구조를 ‘느낄 수 있도록’ 유도한다. 이 부분은 수학에 부담을 느끼는 독자에게도 충분히 이해 가능한 수준으로 설명되어 있다.
책의 후반부 부터 본격적인 딥러닝 영역으로 들어선다. 케라스를 기반으로 신경망의 기본 구조에서 시작해, 심층 신경망, 드롭아웃, 옵티마이저, 모델 저장/복원 등 실무에서 반드시 필요한 요소들을 꼼꼼히 짚어준다. 파이토치 버전을 병기한 점도 인상 깊다. 이는 실제로 프레임워크 간 비교나 전환을 염두에 둔 독자에게 큰 도움이 된다. 특히 나는 “심층 신경망의 층 구성 방식”을 설명한 파트에서, 모델 설계의 감각을 키울 수 있는 좋은 인사이트를 얻었다.
이미지와 텍스트라는 비정형 데이터의 대표 분야를 다루는 부분에서는.. CNN과 RNN 구조, IMDB 리뷰 분석, LSTM/GRU 비교 등, 이론과 실습의 밸런스가 뛰어나며, 다양한 실전 예제가 마치 실제 프로젝트를 수행하듯 독자를 몰입시킨다. 특히 텍스트 처리 파트에서 '단어 임베딩', '순차 데이터의 특성', '시각화' 등을 체계적으로 다루는 점이 인상 깊었다. NLP에 입문하는 독자에게는 이보다 나은 길잡이는 없을듯 하다.
마지막장 에서는 최근 화두가 되는 트랜스포머와 LLM을 소개한다. 특히 HuggingFace의 KoBART와 OpenAI API를 이용한 실습은, 단지 책을 읽는 것에 그치지 않고, 곧바로 현업에서 활용 가능한 수준으로 안내해 준다. 나는 이 장을 읽으며, 최근 내가 관심 있었던 대규모 언어모델 아키텍처의 맥락을 다시 한번 점검할 수 있었고, 토큰화와 디코딩 전략에 대한 감각도 정립할 수 있었다.
총평하자면, 이 책은 ‘혼자 공부한다’는 전제를 충실히 지키면서도, 초심자와 경험자 모두에게 실질적인 가이드를 제공하는 드문 입문서다. ‘배운다’는 것이 아니라 ‘이해한다’는 감각을 주고, 매 챕터마다 등장하는 “문제해결 과정”은 이론을 맥락 속에서 익히게 해준다. 학습자의 혼란을 미리 예상하고, 예상 질문에 대한 해답까지 책 말미에 포함한 구성 또한 매우 인상 깊었다. 물론, 심화된 수학적 공식이나 수치해석에 대한 설명은 생략되어 있지만, 이는 이 책의 의도와 잘 맞아 떨어진다. 코어 개념을 실습과 함께 이해하고, 이후 심화로 나아가기 위한 탄탄한 밑거름을 만들기에는 이보다 좋은 입문서는 드물다. 마치 튼튼한 바닥재 위에 지어지는 인공지능 학습의 집처럼, 이 책은 '기초'의 의미를 가장 충실하게 보여주고 있다.
머신러닝,딥러닝 학습의 여정을 혼자서 묵묵히 나아가고자 하는 이들에게, 이 책은 가장 든든하고 확실한 동반자가 되어줄 것이다.
처음에 이 책을 신청했을때, 가장 먼저 든 생각은 “이걸 혼자 해낼 수 있을까?” 잠시 고민을 했습니다. 알고 싶었지만.. 너무 어려운것도 사실 알고 있었기에.. 하지만 책을 따라가다 보면 그 걱정이 조금씩 줄어듭니다. 수학적인 부분이나, 전문 용어가 주는 압박감도 점차 익숙해져 갑니다.
- 총평 -
혼자서 머신러닝과 딥러닝을 시작해보고 싶은 분이라면, 《혼자 공부하는 머신러닝+딥러닝》은 정말 이름 그대로 “혼공”에 최적화된 책인 것 같습니다. 물론 저는 동영상 강좌를 함께.. 봤습니다.
경험상 교재 + 동영상 강의를 추천 드립니다.
기초 개념부터 시작해서 최신 딥러닝 모델까지, 단계적으로 배우며 나만의 AI 프로젝트를 만들어가는 재미를 느낄 수 있었어요. 아직 용어나 개념이 익숙하지 않더라도,꼭 다 이해하려고 조급해하지 말고, 한 장씩 차근차근 넘겼습니다.
그러면 어느 순간, '아, 나도 머신러닝 할 수 있겠는데?' 싶은 근거 없는 자신감이 생깁니다. ^^
- 한줄 평 -
"머신러닝과 딥러닝, 막연했던 개념들이 처음으로 눈앞에 그려지기 시작했습니다."
- 누구를 위한 책-
"저 처럼 막연한 관심이 있는 머신러닝/딥러닝을 처음 배우는 입문자를 위한.."
- 이책의 장점 -
그림과 표, 코드의 균형이 잘 맞춰져 있어 처음 보는 개념도 이해하기 쉽게 구성되어 있고, 각 장마다 나오는 ‘마무리' 와 ‘확인 문제’, ‘자주 하는 질문’은 복습에 매우 효과적입니다. 머신러닝에서 딥러닝, 그리고 대규모 언어 모델까지 이어지는 흐름이 단계적이며 연결감 있게 구성되어 있는것도 이 책의 장점이라고 생각 됩니다.
- 책의 구성과 내용-
Chapter 01~02: 머신러닝 입문과 데이터 다루기
인공지능, 머신러닝, 딥러닝의 차이부터 시작해 Google Colab과 Jupyter Notebook 사용법을 소개합니다.
간단한 생선 분류 문제를 통해 머신러닝 프로세스를 체험하고, 훈련 세트/테스트 세트 분리, 데이터 전처리(스케일링)의 중요성을 배웁니다.
Chapter 03: 회귀 알고리즘과 규제
k-최근접 이웃(k-NN), 선형 회귀, 다중 회귀, 릿지/라쏘 회귀를 통해 과대적합과 과소적합 개념을 소개합니다.
사이킷런의 다양한 도구와 함수를 실습으로 다뤄봅니다.
Chapter 04~05: 분류와 트리 기반 알고리즘
로지스틱 회귀부터 SGDClassifier 등 확률적 경사하강법을 소개하고, 결정 트리, 랜덤 포레스트 등 트리 기반 모델을 설명합니다. 하이퍼파라미터 튜닝, 교차 검증, 그리드 서치도 친절하게 다룹니다.
Chapter 06: 비지도 학습
k-평균 군집화, PCA(주성분 분석) 등 비지도 학습을 실제 데이터에 적용하며 개념을 익힙니다.
주로 시각 자료와 예제를 통해 감각적으로 설명되어 있어 이해에 도움이 됩니다.
Chapter 07~08: 인공신경망과 CNN
패션 MNIST 데이터로 인공신경망을 구현하고, 심층신경망(DNN), 합성곱 신경망(CNN)까지 확장해 나갑니다.
케라스와 파이토치 버전을 함께 보여주어 두 프레임워크 비교가 가능합니다.
Chapter 09~10: RNN과 트랜스포머, 언어모델
IMDB 영화 리뷰 감성분석, BART 기반 KoBART 모델 요약, OpenAI의 GPT API 사용법까지 다루며 LLM 시대에 맞는 최신 흐름을 반영합니다. 순환신경망(RNN), LSTM, GRU 등 시계열 처리 모델도 알기 쉽게 소개합니다.
책을 전체적으로 한번 쭈욱 보았습니다. 내용도 제대로 이해 했는지 모르고, 한번 더 깊게 볼 생각이라..머신러닝과 딥러닝을 이제 막 시작 하신다면 꼭 추천하고 싶습니다.
이 책은 그러한 인공지능을 ‘제대로’ 이해하고 싶은 이들에게, 방향과 깊이를 함께 제시해준다.
이 책은 ‘인공지능 공부의 첫 단추를 바르게 꿰고 싶은 사람’을 위한 최고의 입문서다.
데이터를 제대로 이해하고 활용하는 법에 관한 책
회귀, 분류, 군집 알고리즘 등 다양한 모델들을 다루고 있다.
인공지능 데이터 모델을 공부하다보면 각 파라미터들이 무엇을 의미하는지 궁금해지는데 이 책을 통해 제대로 학습할 수 있다는 생각이 들었다.
그리고 컴퓨터 공학 관련 학생들이 초심자때 항상 어려움을 겪는데 과도한 수식내용으로 막막해지곤 한다. 이 책은 재밌는 비유와 유용한 실습자료들로 학습이 가능하다.
기본적인 데이터 전처리부터, 회귀 알고리즘, 확률적 경사하강법, 결정트리가 기본적인 부분이다.
그리고 그 이후 교차검증, 트리의 앙상블, K-평균, 주성분 분석에 대해 나아갈 수 있다.
7장부터는 딥러닝, 합성곱 신경망의 시각화, LSTM , 트랜스포머까지 인공지능에 대해 꼭 알아야하는 내용들이 담겨있다.
겉핥기식 이해가 아닌, 진짜 인공지능을 알기 위해서는 책을 여러 번 읽어보고 실습을 하며 체화하는 것이 정말 중요하다고 생각한다.
이 책이 좋은 인공지능 책이라고 생각하는 이유는 코드 나열식이 아니라, 다양한 질문을 던질 수 있게끔 해준다. 알고리즘의 발전 원인, 문제 해결 과정들을 상세히 서술하며 그래서 왜 이러한 알고리즘이 등장했는지를 깊이 탐구할 수 있게 해준다. 확률적 경사하강법이 어떻게 등장했고 Attention 메커니즘 같은 LLM 기술들이 자연어 처리 문제를 해결하는지를 상세히 학습할 수 있다.
이 책으로 깃허브를 참고하며 여러번 실습한 적도 있고, 수업 자료를 만들면서 좀 더 좋은 비유가 나와서 많이 참고했던 책이다.
그리고 이진 분류, 클래스를 설명하면서 헷갈릴 수 있는 부분에 대해 짚어준다. 초심자로서는 궁금할 수 있을 것 같다.
각 장에서 마무리를 통해 fit() 메서드, K-최근접 이웃알고리즘, 모델 ( 알고리즘이 구현된 객체), 정확도 등에 대해 한번 더 일목요연하게 정리해준다 .
책을 그냥 읽다보면, 제대로 이해했는지 궁금할 때가 있는데, 확인 문제를 풀어가면서 한번 더 짚고 넘어갈 수 있다. 1, 2 번 문제 같은경우에는 책을 읽었다면 쉽게 풀어볼 수 있을 것 같은데 3,4 번 문제는 좀 더 생각을 요해야 하는 문제여서 어려웠다 :)
이이 특히 마음에 들었떤 이유는, 확률적 경사 하강법에 대한 비유가 너무 좋았기 때문이다. 되게 이해하기 힘든 부분일 수 있는데 이 비유를 따라가다보면 이해가 된다. 산의 경사면은 확실히 연속적이어야 한다 .!
모델에 대한 이해가 끝나면
MNIST를 활용한 실습 예제가 나온다.
코딩을 손코딩으로 해보며 내용에 대한 정확한 이해를 권장하고 있는 것이 특징이다
어텐션 메커니즘의 장점과 단점이 자세히 설명되어 있다.
트랜스포머의 작동 반식, 셀프 어텐션 계산 과정 등에 대해 자세히 알 수 있다.
올해 읽어본 책중에 머신러닝 분야에서는 TOP 3 안에 들어갈 정도로 추천한다.
머신러닝의 정석 처럼 차근차근 상세히 스토리텔링 되어 있는 책을 읽어서 좋았다.
진짜 학습은 반복과 실습을 통해 내 것이 되는 과정이다. 이 책과 함께 한다면, 막막해보이던 인공지능 공부가 길이 보일 것이다. 대체 어떤 강의를 들어야할지 막막하던 사람도 눈이 트일 것이다.