microsoft's Machine Learning for Beginners 한국어 번역 회고

오늘은 microsoft의 Machine Learning for Beginners 한국어 번역 후기를 공유하고자 합니다.

시작하며

최근 마이크로소프트에서 공개한 Machine Learning for Beginners 강의를 7월 3일부터 8월 16일까지 약 40일에 걸쳐 번역했습니다. 퇴근 후 시간과 주말을 활용해서 틈틈이 진행한 탓에 생각보다 긴 기간 동안 작업을 하게 되었습니다.

해당 강의는 인공지능 파트에서 classic 머신러닝이라고 불리는 분야를 위주로 구성되어 있습니다.

https://github.com/microsoft/ML-For-Beginners

참여한 이유

Web-Dev-For-Beginners를 번역하고…

이전에 Web-Dev-For-Beginners 라는 프로젝트를 번역했던 적이 있었는데, 커리큘럼이 입문자 대상 강의에 충실하면서 실습 기반으로 잘 짜여져 있고 웹 개발의 기초부터 간단한 게임을 만들 수 있는 좋은 가이드라고 생각하면서 번역을 진행했었습니다. 번역하며 익힌 내용을 실무에서도 적극 활용하며 위 내용의 유용함을 확인했습니다.

Web-Dev-For-Beginners 후속 프로젝트가 생겼다는 소식이 있었을 때, 빨리 번역을 해봐야겠다는 생각이 들었습니다. 머신러닝에 대해 늘 관심을 갖고 있었기 때문에 이번 번역에 대한 의욕이 어느때 보다 컸던 것 같습니다.

데이터 엔지니어로 근무하며…

2019년부터 한 스타트업에서 데이터 엔지니어로 일하고 있는데, 회사에서 개발하는 서비스에 필요한 데이터와 ML 모델에서 필요한 데이터를 수집해서 가공하는 일을 주로 하고 있습니다.

엔지니어링 업무를 하면서 직접 ML 모델을 만들지 않더라도 이론과 여러 모델의 특징 정도는 알고 있어야 ML 엔지니어와 원활한 소통이 가능하다고 느껴왔습니다.

Machine Learning for Beginners 저장소를 살펴보니 기존에 번역 작업을 했던 구조와 유사했으며 ML에 대한 전반적인 공부도 해보고 싶다는 생각으로 이 작업을 시작했습니다.

진행 과정

clone -> commit -> PR draft -> review -> merge

우선 Machine Learning for Beginners 를 로컬에 클론하고, 1강부터 순서대로 번역했습니다.

영문 마크다운 파일을 기반으로 새로운 마크다운에서 번역을 했습니다. 원본 소스파일을 복사해서 다른 파일로 옮긴 후 번역하는 것은 원문이 달라졌을 때에 번역문을 최신으로 유지하는 작업이 어려울 수 있지만, GIT 버전관리로 인하여 상당부분 단점을 가릴 수 있었습니다.

번역을 본격적으로 시작하기 전에 해당 챕터에서 중심이 되는 주제에 대하여 사전 지식을 학습하였습니다. 평소 업무에 자주 접하는 기술 스택이 아니었기 때문에 생소한 내용으로 구성된 중후반으로 넘어갔을 때는 진도가 더디게 나갔지만 새로운 것을 알게 되었을 때의 만족감이 꽤나 컸습니다.

어느 정도 번역이 마무리된 후에 번역 기간 동안 쌓인 커밋들을 로컬 git 프로젝트에 동기화하고 변경된 원문들을 한국어 번역문에 반영했습니다.

주로 예제 코드와 퀴즈 URL에 관련된 내용들이었으며 실습을 하는 유저들에게 영향을 줄 수 있는 내용이었기 때문에 정리할 필요가 있었습니다.

마지막 날에는 한 달 넘게 유지했던 Github pr draft를 풀고 해당 저장소의 메인테이너를 태그하고 마무리했다는 소식을 코멘트로 알렸으며, 바로 main 브랜치에 반영되었습니다.

번역을 진행하면서 들었던 기분

힘들었던 점

번역 기간 동안 거의 대부분의 휴일 시간을 투자하였고 평일에는 퇴근 이후 시간을 할애했습니다. 되도록 빨리 번역을 마무리짓고자 퇴근 직후 부터 바로 작업을 이어갔기 때문에 일의 연장이라는 기분이 들었습니다. 코로나로 인해 재택근무를 하고 있어서 출퇴근에 필요한 시간까지 투자할 수는 있었지만 업무시간과 개인시간이 분리되지 않는 듯한 느낌이 들었습니다.

아쉬운 점

한국어 번역에 소수 인원만 참여하는 환경이라서 다소 아쉬웠습니다. 조금 더 다양한 사람들과 같이 번역 문장을 리뷰할 수 있는 환경이 되었으면 좋겠습니다. 다수의 사람들이 함께 진행했다면 번역하면서 생각나지 않은 표현들을 상호 간 캐치할 수 있지 않았을까 하는 생각이 들었습니다.

잘했다고 생각한 점

회사 업무와 병행하여 힘든점도 있었지만, 퇴근 후 애매하게 버려지던 시간을 투자하여 Machine Learning for Beginners 한국어 번역 프로젝트를 마무리짓고 나니 개인의 역량 강화와 오픈소스 발전에 기여할 수 있었음이 매우 뿌듯했습니다.

마치며

방대한 머신러닝 영역 중에서 입문자들에게 꼭 필요한 핵심 내용을 보여주고 있을 뿐만 아니라, 퀴즈와 실습이 적절하게 섞여 있어서 활용도 높은 자료가 될 것 같습니다. 입문자들을 위해 이런 자료를 만들었다는 것이 놀라웠습니다,

마이크로소프트에서 새로운 for Beginners 시리즈가 기획되어 다시 번역의 기회가 주어지길 기대합니다.

감사합니다.

Written on August 21, 2021