2021.11.25
현 시대에서 가장 중요한 기술 중 하나를 고르라면 빅데이터를 빼놓을 수 없습니다.
네이버웹툰에도 네이버웹툰, 라인웹툰, 웹소설, 시리즈, 시리즈온 등 다양한 서비스의 수많은 데이터를 저장하고 가공해 유의미한 비즈니스 인사이트를 도출해 내는 핵심에 W Stat팀(빅데이터 개발팀)이 있습니다.
지금도 글로벌 100여 개국 이상, 7,200만 사용자의 데이터가 계속 모이면서, 방대한 데이터를 제대로 활용하기 위해 빅데이터 플랫폼 개발자분들을 지속해서 채용하고 있는 상황인데요,
네이버웹툰의 빅데이터 플랫폼 개발자를 희망하는 분들께 조금이나마 정보를 드리고자, 오늘은 데이터 기반의 혁신을 만드는 'W Stat팀'의 일과 삶에 대한 이야기를 들어보았습니다.
(선화) 안녕하세요, W Stat팀 Lead 정선화입니다. 저는 웹툰을 좋아해서 2018년에 네이버에서 네이버웹툰으로 조직 이동을 했습니다. 16년 차 Back-End 엔지니어였던 저는 조직이동을 하면서 하고 싶은 업무를 선택할 수 있었는데요, 데이터에 대한 관심도 있었고 당시에 데이터 지표 관련 업무가 시급하다고 하여 웹툰 W Stat팀으로 이동하게 되었습니다. 워낙 데이터에 대한 호기심도 있었고, 데이터 기반의 의사결정에 관심이 많았기에 나름의 좋은 기회였다고 생각하고 있어요. 지금은 회사 성장에 더 많이 이바지하기 위해, 요청 업무의 효과가 극대화되도록 검토하고 우선순위를 조율하고 있습니다. 또한 기술적으로 문제가 없을지 architecture 측면에서 점검하고, 실제 담당자가 업무를 진행할 수 있도록 구체화하거나 지원하는 작업을 하고 있습니다. 그리고 리더로서 조직원들이 데이터 엔지니어로서 잘 성장하도록 돕고 있습니다.
(신우) 저는 W Stat팀 허신우라고 합니다. 저는 지인 소개로 네이버웹툰 CIC 조직을 알게 되어 서버 개발자로 합류했다가, 빅데이터 처리 업무를 맡게 되면서 데이터 엔지니어의 길로 들어오게 됐습니다. W Stat팀은 다양한 경로의 로그와 서비스 메타을 안정적으로 입수하고, 이로부터 유의미한 지표를 발굴하여 분석에 활용할 수 있도록 제공하고 있습니다. 그 중에서 저는 주로 데이터 파이프라인 관련 작업과 데이터 가공 처리를 하고 있습니다.
(시온) W Stat팀 김시온이라고 합니다. 저는 네이버에서 인턴을 하고 있을 당시에 조직장님이신 찬규님(현 네이버웹툰 CTO)의 비전이 너무 좋아서 함께 이동하고자 지원하였습니다. 제가 주로 하는 업무는, 서비스에서 유입되는 로그를 실시간으로 처리하는 Real Time 앱 개발을 맡고 있고요, 이외에도 분석가와 서비스 운영자분들께서 활용하실 수 있는 BI 툴 운영을 맡고 있습니다.
(태수) 저는 W Stat팀 김태수입니다. 대학원에서 빅데이터 관련 업무를 하던 중 네이버웹툰 빅데이터 플랫폼 채용 공고를 보고 지원해 작년 3월 인턴십을 시작했고, 작년 8월 정규직으로 전환이 되었습니다. 저는 팀으로 유입되는 데이터가 정상적인 데이터인지 검증하는 툴을 개발하는 것과 저희 팀에서 보관 중인 데이터를 시각화하는 지표 페이지 개발을 주로 진행하고 있습니다.
(선화) 저는 W Stat 팀을 '데이터 도우미'로 표현할 수 있을 것 같은데요, 타부서에서 내부나 외부 데이터 이용, 분석하고 쉽게 활용하고 싶으실 때 저희 팀에 도움을 요청하기 때문에 ‘데이터 도우미’라고 표현해봤어요. 요청을 많이 주셔서 개발 리소스가 허용되는 선에서 최대한 도움을 드리려고는 하는데요. 아무래도 업무량이 많다 보니 (웃음) 가능한 선에서 차근차근 도움을 드리려고 하고 있습니다.
(시온) 저도 생각해 봤는데요, 저희 팀은 '서비스의 이정표'라고 생각했습니다. 데이터 기반으로 서비스의 상태를 파악하거나 다양한 것들을 볼 수가 있고, 그것을 기반으로 앞으로 서비스가 어떻게 성장해 나갈지 이런 것들을 파악할 수 있는 것 같아서 이정표의 역할을 한다고 생각합니다.
(신우) 저는 서로 간의 기술 공유로 팀원 전체가 같이 성장한다는 생각이 들 때 가장 동기부여가 되더라고요.
(시온) 대량의 데이터들을 처리하면서 여러 가지 고민과 개발을 하잖아요. 그러면서 실제 개발이 완료되고 데이터들이 정상적으로 쌓이고 있을 때가 제일 뿌듯했던 것 같습니다.
(태수) 저도 시온님이랑 비슷한 맥락으로 기획, 운영, 개발팀이 의논해서 데이터를 드리는데요, 그 데이터를 효율적으로 잘 사용하고 있다고 얘기해주실 때 그때가 동기부여가 많이 됩니다.
(선화) 저도 비슷한데요, 데이터를 연동해서 서비스가 추가되거나 개선되고, 실제 분석 지원으로 의미 있는 인사이트가 도출되어서 그걸 통해 서비스의 성장에 도움이 되었을 때 많은 동기 부여가 됐던 것 같습니다.
(태수) 입사 전에는 학부 수준의 데이터 처리를 처리해오다보니, 입사 후 현업에서 다루는 여러가지 스택을 이해하고 적용하는 것이 조금 어려웠습니다. 하지만 모르는 내용을 정리하고 저희 팀 미팅 또는 개인적으로 메신저를 통해서 질문드렸을 때 모든 팀원이 자세하게 답변해 주셔서 어려움을 잘 이겨냈습니다.
(시온) 저는 처리 측면인데요, 많은 데이터를 다루다 보니까 최적화나 성능 튜닝을 해야 하는데 그 과정에서 리소스를 많이 투입하게 돼요. 이런 튜닝하는 과정에서 고민을 많이 하고 깊게 생각하게 되는 것 같아요. 그래서 일단 이런 것을 효율적으로 처리하기 위한 부서 스터디를 많이 진행했고, 개인적으로 자료도 많이 찾아보고 팀 내 의견 공유를 통해서 더 나은 이슈 해결방법과 방향성을 찾으려고 했습니다.
(신우) 개인적으로 가장 초창기 버전의 클러스터가 기억에 남아요. 당시 임계치 상황에서 클러스터가 계속 운영되고 있었는데요, 그것을 보완 적용한 클러스터로 이전하는 과정이 기억에 남습니다. 기술적으로도, 인프라 부서와의 협업 과정에서도 난도가 상당히 높았으면서도 재밌었습니다.
(시온) 저의 경우는 가장 인상 깊었던 프로젝트가 실시간 파이프라인 설계였습니다. 저희가 기존에는 주기적으로 데이터를 가공하고 있었는데요, 실시간 처리를 처음 도입하다 보니 그만큼 필요한 것들이 많더라고요. 예를 들면 실시간 데이터는 얼마나 늦은 시간까지 기다리고 나서 입수를 할 것인지, 실시간으로 정합성 체크는 어떻게 할 건지 등의 이론들을 많이 연구하면서 책에서 봤던 것 이상으로 훨씬 더 많은 것을 얻었습니다.
(선화) 일단 네이버웹툰은 좋은 사람이 많아서 좋은 동료들과 함께 일할 수 있다는 점이 하나의 포인트라고 생각합니다. 또 제가 웹툰을 좋아하기 때문에 개인적으로 좋아하는 서비스들을 함께 만들어갈 수 있다는 측면에서 좋은 포인트라고 생각해요.
(신우) 네이버웹툰에는 각 서비스 조직마다 그로스(Growth) 조직이 있는데요. 그만큼 데이터 기반의 의사결정 구조를 가지고 있다는 것이 네이버웹툰의 강점이라고 생각합니다. 그리고 저희 W Stat팀이 그 부분에서 가장 크게 기여하고 있고 그로스 해킹의 기반을 닦는 경험을 할 수 있다는 것이 큰 경쟁력 포인트라고 생각합니다.
(태수) 아무래도 저희가 데이터를 받아오는 부서이기 때문에, 타 부서와 개발 관련 회의를 할 때 향후 커뮤니케이션 이슈가 없도록 데이터를 어떻게 받아오는 게 좋을지 등의 관점에서 논의를 많이 하는 편입니다.
(선화) 제일 많이 소통하는 조직은 Data Insight 조직인데요, 비즈니스 분석가분들과 함께 원시 데이터를 가지고 최대한의 효율을 낼 수 있는 구조로 가공하는 작업도 같이하고 있어요. 그렇기 때문에 실제로 사용하시는 분들이 보기 편안한 형태로 데이터가 저장되어 있도록 하는 관점에서 굉장히 소통을 많이 하고 있습니다. 현재는 데일리 미팅도 진행하고 수시로 논의사항이 있을 때마다 개별적으로 회의를 진행하고 있습니다.
(시온) 저는 개인적으로 회의를 통해 소통하는 것 같아요. 선화님께서 말씀하신 것처럼 비즈니스 분석가분들과 협업을 많이 하는데요, 분석가분들이 잘 활용할 수 있는 데이터인지 확인하기 위해, 초안을 만들고 회의를 하면서 함께 맞춰 나가는 것이 중요하고 이렇게 해야 다음에 이슈가 안 생기더라고요.
(시온) 저는 앞으로 더 유망할 것 같아요. 왜냐하면, IT 뿐만 아니라 사실 여러 산업이 전반적으로 빅데이터 또는 데이터 기반의 이야기를 많이 하고 있잖아요. 결국, 데이터를 기반으로 한 서비스의 성장이라는 방향으로 가기 때문에, 데이터가 더 많이 수집될 것이고 그만큼 빅데이터 테크 개발자들이 더 많아질 것으로 생각합니다.
(신우) 빅데이터 기술이 현재 선택이 아닌 필수가 되어가는 추세여서 전망은 밝다고 생각합니다. 그랬으면 좋겠습니다. (웃음)
(선화) 저도 현재 AI가 발전할 수밖에 없는 시장 흐름이 생겼고 그 밑바탕에는 빅데이터가 자리 잡고 있어서 계속 동반 성장하리라 생각해요. 그리고 사실 AI를 활용하려면 원시 데이터만으로는 절대 불가능해요. 빅데이터는 데이터가 단순히 많은 것일 뿐이고요, 당연히 예쁘게 만들어주는 과정이 지속해서 필요하고 이 부분은 앞으로 필수적인 부분이 될 것으로 생각해서 전망은 아주 좋다고 생각합니다.
(시온) 저는 '코드리뷰' 문화가 정말 좋은 것 같아요. 코드리뷰는 본인이 작성한 코드 내용을 가지고 사내 깃허브(github)에 프리캐스트를 하면, 부서분들께서 함께 보면서 피드백 주시는 문화에요. 혼자만의 생각으로는 안 보이는 게 사실 많은데요, 이렇게 코드리뷰를 하면 코드가 더 깔끔해지고 주니어와 시니어 관계없이 개인이 성장을 할 수 있는 문화라고 생각해요.
(신우) 저희 팀은 도전하고 성장 가능한 문화를 가지고 있어요. 사실 빅데이터가 주목받은 지 얼마되지 않아서, 빅데이터 분야의 오랜 경력을 가지고 있는 개발자는 별로 없어요. 그래서 데이터 엔지니어의 측면에서 보았을 때, 팀원 간의 경력이나 기술 편차가 크지 않아서 서로 함께 성장할 수 있는 요소가 있다고 생각해요. 그래서 서로 자극이 되고 도전할 수 있는 저희 팀의 문화가 좋다고 생각합니다.
(선화) 저희 W Stat팀은 주 3회 1시간씩 개발 미팅을 진행하고 있어요. 이 미팅에서 코드 리뷰 뿐 아니라 공유하고 싶은 내용을 자유롭게 이야기하는데요. 기술적으로 어떤 어려움을 겪었고 어떤 방식으로 해결했다는 경험이나 도움이 필요한 부분을 자유롭게 이야기하면서 업무 공유와 피드백을 받는 자리를 항상 가지고 있어요. 이를 통해서 자연스레 지속 성장이 가능한 분위기가 조성되었다고 생각합니다. 추가로 저희 팀은 주 1회 스터디도 진행하면서 편안한 분위기 속에서 서로 성장하고 학습하는 분위기를 함께 만들어 가고 있습니다.
(태수) 선화님께서 말씀 주신 것처럼 주 3회 개발 미팅이 있는데요, 제가 느끼기에는 이 개발 미팅에서 받는 피드백이 정말 좋더라고요. 개발을 시작할 때의 방향성에서부터 다양한 의견을 듣고 작업을 할 수 있는 저희 팀의 문화가 정말 좋습니다.
(선화) 기술적으로 저는 데이터 엔지니어링 계 '초절정 고수'가 되고 싶어요. (웃음) 그리고 팀 리더로서, 각 팀원이 역량을 최대한으로 발휘할 수 있게끔 도움을 주고 전체 조직 성과를 최고로 높이는데 기여하려는 목표가 있습니다. 그리고 신기술도 많고 환경은 항상 변화하고 있어서, AI와 데이터 분석에 대한 학습이 필수라고 생각해요. 변화에 대응하고 여러 조직과 협업해서 조직의 성과를 높이기 위해 항상 학습하는 자세를 잃지 않으려고 노력하고 있습니다.
(시온) 제 개인적인 커리어 목표는 다양한 콘퍼런스에서 발표하는 것입니다. 그러려면 기술 성장이 먼저 이뤄져야 하는데요, 그 과정 중 하나로 깊은 개발을 하면서 경험을 공유하는 여러 콘퍼런스에 참여하고 있고, 그 자체가 성장에 기여할 것이라고 생각합니다. 그 이후에는 기술 서적도 출판해보고 싶습니다.
(태수) 저는 개발 기술들의 변화 속도가 굉장히 빠르다고 생각해요. 그래서 개인적 커리어로는 신기술을 계속 공부하면서 그 기술들이 저희 팀에 잘 녹아들 수 있도록 준비를 하는 것이고요, 신기술과 효율적으로 처리할 수 있는 기술에 대해서도 계속 검토하고 있습니다.
(신우) 제 목표는 데이터와 빅데이터 처리가 필요한 곳이라면 어디든 그 기반을 구성할 수 있는 데이터 엔지니어가 되는 거예요. 그렇게 되기 위해서, 한 측면에서는 클러스터를 구축 운영하는 경험을 쌓아야 하고, 또 다른 측면으로는 파이프라인과 데이터 처리에 대한 다양한 기술 스펙을 쌓아야 하는데요, 그렇게 양 측면에서 커리어를 생각하고 있습니다.
(신우) 일단 신입분들의 경우, 면접에서 빅데이터를 실제 처리할 기회나 환경이 없는데 어떤 걸 준비해야 하는지 질문을 하시는데요, 현직자들도 이런 기회나 환경이 없는 것을 알고 있습니다. 그렇기 때문에 데이터 처리 속도 부분을 보는 것이 아니라, 어떤 방식으로 동작하는지를 이해하면서 기술 습득을 하는 것이 중요하다고 생각해요.
(시온) 저도 사실 처음 준비할 때 빅데이터를 학생들이 다루기 힘든데 어떻게 경험을 할지 고민을 많이 했어요. 하지만 입사하고 여러 가지 경험을 해보니까, 엄청나게 많은 데이터를 다룰 수는 없겠지만 공공 데이터 포털이나 Kaggle 등에 데이터들이 있거든요. 그래서 그것을 기반으로 Spark나 Flink와 같은 기술 스택을 깊게 파보셨으면 좋겠습니다.
얇게 많이 아는 것도 굉장히 중요하지만, 한 가지를 깊게 파보면서 자신의 경험이 정리되어 있다면 아무래도 더 좋지 않을까 생각합니다.
(태수) 저도 비슷하게 취업 준비를 하면서, 어려웠던 부분이 학생 신분의 환경에서는 빅데이터 분산처리가 어려웠다는 점이었어요. 그런데 이 부분을 고민하시는 것보다는 관련 서적, Spark 서적, 관련 커뮤니티 도큐먼트를 보면서 상황과 원리를 이해하시면, 이후 분산 처리 환경에서는 이해하시는 데 큰 어려움은 없을 것 같아요. 먼저 하둡과 스파크에 대한 동작 원리를 깊게 파고 들어가시기를 추천해 드립니다. 그리고 저희가 현재 개발하고 있는 대부분이 자바 언어라서 자바 개발은 기본적으로 하시면 좋을 것 같습니다.
(선화) 마지막으로 저는 빅데이터 및 특정 플랫폼 기반 지식에 대한 이해가 필수라고 생각해요. 그리고 컴퓨터 사이언스 기초 지식과 추가로 백엔드 개발 지식을 갖추고 있으면 도움이 될 것 같습니다. 그 외에는 웹툰 도메인에 대한 관심도 필요할 것 같은데요, 어쨌든 도메인에 대한 관심이 데이터를 더욱 잘 이해할 수 있도록 하므로 필요하다고 봅니다.
(시온) 단순히 기술을 사용해 본 게 아니라 '개발'해 보신 분들이면 좋을 것 같아요. 예를 들면 공식 Document만 보고 실행하고 사용했다는 건 사실 쉽거든요. 이제 그걸 본인에 맞게, 이 기술의 특성에 맞게 잘 커스터마이즈하고 어떤 값이 어떤 의미를 가졌는지 알고 있는 동료분이 오시면 좋을 것 같습니다. 그리고 필요 역량으로는, 처음에는 꼼꼼함과 섬세함이 아닐까 생각했는데, 데이터에 대한 관심과 끈기라고 생각해요. 왜냐하면 많은 데이터를 보다 보면 막막할 때도 많고 어디서부터 설계를 시작해야 할지 이런 고민을 하게 되는데요, 관심과 끈기가 있다면 어떻게든 이 상황을 해결할 수 있다고 생각합니다.
(태수) 저는 개발에 대해서 호기심과 비판적인 시각을 가지신 분들이 좋을 것 같아요. 그 이유는 데이터가 지금 시각으로는 완벽하더라도 나중에 봤을 때 완벽하지 않은 데이터들이 나오기 때문인데요, 이 데이터가 왜 이상하게 들어오지, 이렇게 들어오면 안 되는데, 이런 비판적인 의견을 가진 분들이 있다면 저희가 좀 더 완벽한 데이터를 갖추는 데 도움이 될 것 같습니다.
(신우) 같이 성장하고자 하는 의지를 가지고 있는 사람, 그래서 기술 전파를 함께하는 사람이 가장 좋은 동료라고 생각합니다. 그리고 하나의 작업이 전체에 어떠한 영향을 주는지에 대한 판단력이 중요하다고 생각하고, 다양한 속성의 워크로드가 있다 보니 이러한 워크로드에 대한 이해가 깊으신 분 있으면 좋을 것 같습니다.
(선화) 기술적인 부분 외에 리더로서 말씀을 드리자면, 서로 배려하면서 '같이 성장하려는 마음가짐' 그게 가장 중요하다고 생각합니다.