본문 바로가기

책을 보다

[리뷰] 수식보다 딥러닝 <fastai와 파이토치가 만나 꽃피운 딥러닝>

풀어가는 순서

많이 회자되고 있으며 이미 많은 책들이 나와있습니다. 더 이상 미루면 안 될 것 같다는 느낌을 받기는 하지만 선뜻 시작하기에는 주저하게 됩니다. 책을 펼칠 때마다 보는 수식이 상당히 부담스럽기 때문입니다.

 

많은 딥러닝 책들은 무엇을 만들 것인가 알려준 뒤 어떻게 만들어 가는지 보여줍니다. 왜 만드는지는 알려줄 때도 있고, 생략할 때도 있습니다.

무엇을, 어떻게 만드는지에 집중합니다. 제대로 만들어지고 있는지 대상과 과정을 반복 확인하며 만들어 나가는데 중점을 두고 있는 경우가 대부분입니다.

'무엇을, 어떻게, 왜' 라는 순서를 가집니다. 이 책은 방향이 다릅니다.

먼저 '왜'를 앞에 두고, 그다음 '어떻게'를, 그리고 '무엇을' 하는지 알려줍니다.

 

읽는 도중 '왜' 라는 질문을 계속하게 합니다.

예를 들머, 딥러닝을 시작할 때 이미지를 가지고 시작합니다. 왜 데이터로 이미지를 사용할까요? 텍스트를 이용하면 좀 더 쉬울 것 같다는 생각이 드는데 말이죠.

그리고 이미지를 어떻게 활용하는 걸까요? 이미지를 데이터로 만들고 이를 통해 훈련시킨다고 볼 수 있지만, 데이터만 나열한 상태로는 사람이 이해하고 확인하기 어려우니, 이미지로 구현하면 이해하기 쉽고 생각을 확장하기도 쉽기 때문이라고 생각합니다.

이렇게 이미지로 훈련시킬 수 있으면 보이는 이미지뿐 아니라 보이지 않는 대상도 이미지화해서 활용할 수 있습니다. 소리, 정확히는 소리가 가진 여러 가지 복잡한 파형이 대상이 되겠죠. 움직임, 움직이는 경로를 추적한 이미지. 냄새조차도 센서로 측정하여 이미지화할 수 있다면 가능하다는 얘기입니다.

 

 

같이 가려는 발맞춤

각 단원 마지막에 질문지와 추가 연구가 있습니다.

간혹 연습문제가 있는 책이 있습니다. 정답을 알려주는 것도 있고, 그렇지 않은 경우도 있지만요.

연습문제가 '이런 문제를 풀어 보면 앞에서 배운 내용을 좀 더 이해할 수 있을꺼야' 라고 알려준다면, 질문지는 '이번 단원에서 알고 넘어가야 하는 내용에는 이런 것들이 있는데 어때' 라고 물어봅니다. 결정적인 차이점은 질문지에서 물어보는 내용은 앞에서 모두 확인할 수 있다는 점입니다.

 

추가 연구는 어떻게 보면 연습문제와 비슷할 수 있습니다. 다만 결이 조금 다릅니다.

연습문제가 가르치고 배우는 입장이라면, 추가 연구는 동료를 찾는, 동료가 되어주었으면 하는 입장입니다.

알게 된 지식에 매몰되지 않도록 다양한 시각으로 살펴보는 시간과 자신만의 생각을 정립하는 시간을 가지기를 바라는 바람이 들어있는 것 같습니다.

 

 

기술 밖을 바라보다

데이터 윤리, 다른 책에서 볼 수 없는 이 책만 가진 특징이라고도 생각합니다.

인공지능 대화 프로그램이 막말이나 인종차별 발언 때문에 문제가 되었던 일이 있었습니다. 명령어를 기반으로 기능하는 프로그램이 아니라 데이터를 기반으로 훈련하여 움직이는 프로그램이 가진 장점이자 단점인 부분입니다.

데이터 윤리 단원에서는 기술에만 몰두하다 보면 놓칠 수 있는 부분인, 기술보다 더욱 중요한 사람을 잊지 않도록 알려줍니다.

 

편향이 존재할 수 밖에 없는 데이터와 이러한 편향에서 벗어나기 위해 필요한 인식과 다양성, 정책을 놓치지 않도록 챙겨줍니다. 굳이 엔지니어가 아니더라도 일하는 분야가 딥러닝과 관련 있거나 관심이 있다면 데이터 윤리 단원은 도움이 되리라 생각합니다.

 

 

수식도 좋지만 딥러닝에 보다 집중할 수 있는 책이라 생각합니다.

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

반응형