글쓰기 연습/독후감

머신러닝 시스템 설계

ggyongi 2024. 5. 12. 01:44
반응형

제목: 머신러닝 시스템 설계

출판사/저자: 한빛미디어/칩 후옌

읽은 기간: 2024.05

 

[잠시 다른 말]

독후감을 적기 전에, '만들면서 배우는 생성 AI'을 읽을 때부터 느꼈던 건데 이 오레일리(OREILLY)에서 나오는 책들(표지가 동물그림인 시리즈)이 상당히 퀄리티가 좋은 것 같다. 굉장히 공들여 쓰여진 책이고 그래서 얻을 수 있는 지식의 양이나 깊이가 남다른 것 같다. 앞으로 애용해야겠다.

 

[독후감]

일단 이 책은 생성 AI에 대한 책을 읽고 나서 무얼 해야될까 생각하다가, 좀 더 실전적인 느낌으로 모델을 어떻게 배포시키는 지, 파라미터는 어떻게 저장을 하는지 등 내가 지금 하고 있는 웹개발에 있어서의 전반적인 인프라의 과정과 어떻게 다른지 알아보면 좋을 것 같아서 읽게 되었다. 마침 이 책을 처음 알아볼 때 devops와 mlops의 차이점을 파악할 수 있다는 문구가 보여서 읽고 나면 지식이 매우 확장될 것 같았다. 

읽으면서는 매우 큰 어려움에 봉착했다. 아직 ai에 대해선 초보의 입장인데 이 책은 ai공부를 시작하는 사람이 읽기엔 너무 어려웠다. 일단 생소한 용어도 많고 경험 안해봤던 분야도 많았기 때문에 읽으면서도 정확한 이해가 안되는 부분이 많았다. 그래서 그냥 그런 부분은 적당히 넘기고 내가 궁금했던 것들만 좀 해소하고 전체적인 과정만 살펴보는 것을 목표로 했다.

그래서 이 책을 읽는 목적을 위와 같이 제한하면 그래도 소기의 목적은 달성한 것 같다. 사실 간단한 예측 알고리즘 같은 경우 학사 논문에서 경험해봤듯이 대충 데이터 받아서 결측값 채우는 등 데이터를 다듬고(피쳐 엔지니어링) 학습 모델을 선정해서 학습 시키면 그리 복잡하지 않게 예측 모델을 만들 수는 있어서 뭔가 내가 모르는 것이 있지 않을까라 생각했었다. 그런 가려움을 이 책이 잘 긁어 주었다. 실제 데이터 수집에서부터 만나게 될 수 있는 어려움과 데이터의 신뢰성 문제, 데이터의 시프트 등 이전에 전혀 생각지도 못했던 고민 거리들을 보여주었다. 모델 학습에 있어서도 성능 유지를 위해 얼마나 자주 학습을 시켜야 하는지, 그 성능은 또 어떻게 평가할 건지 등 mlops 업무에서 만나게 될 여러 장애물에 대한 조언을 담은 책이었다. 다만 현재는 여기 있는 수많은 지식들을 당장 써먹을 수는 없기에 이 책은 책장에 잘 꽂아두고 필요할 때 다시 봐야겠다. 아니면 좀 더 실전적으로 쓰여진 mlops 책(역시 이것도 OREILLY 시리즈..' mlops 실전 가이드'라는 책)도 있던 것 같아서 그런 책을 읽어봐도 도움이 될 것 같다.