"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다."
자연어 처리를 위한 대규모 언어 모델 사용 안내서입니다.
좀 더 정확하게 말하면 인간과 컴퓨터가 텍스트를 이용하여 자연어로 상호작용하는 방법을 얘기합니다.
참고로, 텍스트는 정보교환의 최종 형태라고 이해하시면 됩니다.
음성도 텍스트로 변환할 수 있습니다. 유튜브가 음성 내용을 자막으로 제공한다는 걸 아실 겁니다.
구성
책은 크게 세 부분으로 나눠집니다.
1 ~ 3장은 머신러닝 기초가 이루는 수학과 주요 머신러닝 모델을 다룹니다.
4 ~ 6장은 텍스트를 다룹니다. 전처리, 분류, 재해석
7 ~ 9장은 대규모 언어 모델과 자연어 처리를 보여줍니다.
10, 11장은 대규모 언어 모델과 인공지능이 들어온 산업의 현재와 미래입니다.
느낌
마치 자연어 처리 개론 수업을 들은 듯한 느낌입니다.
자연어 처리를 대규모 언어 모델 이전과 이후로 구분할 수 있을 만큼 대규모 언어 모델의 등장이 얼마나 놀라운 사건임을 알 수 있습니다.
대규모 언어 모델이 뛰어난 능력을 가지므로 굳이 이전 모델을 붙들고 있을 이유가 없는 것처럼 보입니다.
다만, 대규모 언어 모델이 모든 걸 담당할 필요는 없기 때문에 기존 모델을 적절히 활용합니다.
가장 인상적인 부분은 9장이었습니다.
검색 증강 생성(RAG)과 랭체인(LangChain)으로 웹에 있는 정보를 추출하여 요약하는 부분과
대규모 언어 모델로 팀을 구성하여 문제를 해결하는 다중 에이전트에 관한 내용이었습니다.
생각하던 것 이상이었습니다.
내용 하나하나, 수식이나 모델을 이해하고 넘어가려고 했다간 제풀에 나가떨어질 것 같아 일찌감치 마음을 접었습니다.
안내서라 생각하고 이야기처럼 읽어 나갔습니다.
자연어 처리를 통해 머신러닝과 딥러닝이 어떻게 되어 있는지 어렴풋이나마 전체를 볼 수 있었습니다.