데이터를 읽는 사람은 언제나 강하다 - 점점 더 똑똑해지는 세상으로부터 나를 지켜주는 필수 데이터 사이언스 개념
데이터 사이언스는
AI 시대 새로운 교양이자 최강의 개인 경쟁력
현대 생활에서 데이터가 차지하는 역할이 점점 커지고 있다. AI 기술이 발달하면서 그 근간이 되는 데이터를 가공하고 분석하여 이면에 존재하는 의미를 해석하는 데이터 사이언스에 대한 관심도 급증했다. 자신이 일하고 공부하는 분야에 데이터 사이언스를 접목하고 활용하는 능력은 개인의 경쟁력이 되고 있다.
『데이터를 읽는 사람은 언제나 강하다』는 노무라종합연구소 데이터사이언스랩 연구원들이 AI 시대를 살아가는 개인에게 필요한 데이터 사이언스 핵심 개념을 엄선해 그래픽과 함께 간명한 언어로 풀어낸 책이다. 자주 쓰이는 머신러닝 알고리즘과 통계 개념부터 현실 세계의 문제를 데이터 사이언스의 프레임에 짜맞추어 넣는 법, 기업 현장에서 부딪히는 예상 밖의 낯선 상황에 대처하는 자세, 데이터 언어를 자신 있게 활용하기 위해 갖추어야 할 자질까지 75개의 키워드로 압축해 한 권에 정리했다. 취업이나 이직으로 데이터 사이언티스트가 되고 싶은 사람, 사내 인사이동이나 보직 변경으로 새롭게 데이터 사이언스 업무를 맡게 된 사람은 물론 객관적이고 합리적인 사고를 원하는 모든 사람에게 데이터 사이언스에 관한 체계적인 이해를 가져다주는 핵심 개념 지도가 될 것이다.
‘데이터 사이언스’라고 하면 생경하게 느껴질 수 있으나, 유튜브 추천 알고리즘부터 스포츠 선수 역량 분석, 최적의 택배 배송 경로를 찾는 문제까지 데이터 사이언스는 이미 우리 생활 속 깊숙이 자리하고 있다. 저자들은 점점 더 똑똑해지는 세상에서 모두가 데이터 사이언티스트가 될 필요는 없지만, 적어도 데이터를 해석하고 의사소통에 활용하는 능력은 갖출 필요가 있다고 강조한다. 데이터 사이언스가 무엇이고 일상에서 어떻게 활용되는지, 데이터 사이언티스트는 무슨 일을 하고 어떤 특성이 필요한지 현장에서 몸으로 체득한 노하우를 담아 일목요연하게 펼쳐 보인다.
평균값과 중앙값부터 자연어 처리까지
점점 더 똑똑해지는 세상을 이해하는 최소한의 데이터 사이언스 지식
저자들은 노무라종합연구소에서 전사적으로 데이터 사이언스를 추진하기 위해 설립한 조직인 데이터사이언스랩에 몸담고 있다. 공식 유튜브 채널에서 데이터 사이언스에 관한 다양한 정보를 제공해 온 저자들은 2021년 왜 지금 데이터 사이언티스트가 주목을 받고, 이 직업에 어떤 비전이 있는지 등을 소개한 가이드북을 출간했다. 그 후 그 책을 읽고 데이터 사이언티스트에 관심이 생겨 더 읽을 만한 책을 찾았지만 구체적인 분석 기법을 다룬 전문서밖에 없어 아쉬웠다는 의견을 접했다. 어떻게 하면 이들처럼 이 분야를 처음 접하는 일반인이나 현장 실무자가 데이터 사이언스를 체계적으로 배울 수 있도록 도울 수 있을까 고민한 결과물이 이 책 《데이터를 읽는 사람은 언제나 강하다》이다.
저자들은 문자보다 이미지로 전달되는 정보를 더 잘 이해하고 기억하는 시각적 학습자를 위해 데이터 사이언스를 활용하는 데 필요한 최소한의 지식을 직관적인 그래픽으로 압축하여 설명한다. 세 페이지 분량의 간명한 설명과 개념을 잡아주는 그래픽으로 우리는 AIㆍ머신러닝ㆍ딥러닝이 어떤 개념 관계이고 평균값과 중앙값은 무엇이 다른지, 회귀분석과 베이즈 네트워크는 어떤 차이가 있고 자연어 처리와 텍스트 마이닝은 어디에 활용하는지 등 평소에 자주 접하지만 어떻게 활용되는지 정확히 몰랐던 개념을 이해하는 짜릿함을 맛볼 수 있다.
이 책은 데이터 사이언스의 이론적인 근간이 되는 머신러닝 알고리즘과 통계 개념만을 다루지 않는다. 저자들은 이러한 개념을 바탕으로 실제로 데이터 사이언스를 활용하여 분석 모형을 구축하고 텍스트 마이닝을 수행하는 법, 역사가 짧은 직종인 이 분야에 첫발을 들여놓은 현장 실무자가 고민하는 문제에 대해서도 조언을 아끼지 않는다. 처음부터 적극적으로 데이터 사이언티스트를 꿈꾸기보다는 어쩌다 보니 데이터 사이언스 업무를 시작하게 된 선배들의 커리어 스토리는 데이터 사이언티스트가 되고 싶은 사람에게 값진 조언이 될 것이다.
데이터를 해석하고, 데이터에서 관계를 찾고,
데이터를 기반으로 사고하는 법
정보기술의 발달로 수집할 수 있는 데이터의 양과 종류가 크게 늘면서 데이터 사이언스를 활용하는 분야도 확대되고 있다. 저자들은 그 배경에 두 가지 요인이 존재한다고 진단한다. 하나는, 엑셀 등 스프레드시트 프로그램이나 클라우드 서비스를 이용하면 기본적인 데이터 분석 정도는 누구나 손쉽게 할 수 있는 여건이 조성되었다는 점이다. 다른 하나는, 데이터 사이언티스트를 직접 채용하거나 외부에 분석을 의뢰하여 경영상의 의사 결정에 데이터 사이언스를 활용하는 기업이 크게 늘었다는 점이다. 저자들은 이런 추세라면 조만간 부서 단위 보고에도 데이터 사이언스를 활용한 분석 자료를 사용하는 것이 당연시될지도 모른다고 내다본다.
일반적으로 비즈니스에서는 주어진 과제를 해결하기 위해 데이터의 활용 가능성을 검토한다. 저자들은 무엇을 위해 데이터를 사용할 것인지보다 데이터로 무엇을 할 수 있을지 상상하는 힘이 더 중요하다고 말한다. 데이터로 새로운 비즈니스를 상상하고 데이터 사이언스의 힘을 빌려 이를 구체화해야 한다는 것이다. 저자들은 향후에는 과제를 기점으로 데이터를 활용하는 능력보다 데이터를 기점으로 새로운 비즈니스를 창출하는 능력을 갖춘 인재의 수요가 더 높을 것으로 전망한다. 비즈니스 현장에서 데이터 사이언스는 아직 충분히 활용되지 못하고 있다고 덧붙인다.
노무라종합연구소 데이터사이언스랩 대표인 시오자키 준이치는 한국 독자에게 전하는 메시지에서 향후 데이터 사이언스가 전 세계 비즈니스의 변화를 주도하는 핵심이 될 것으로 내다본다.
“숫자(데이터)는 세계 공통의 언어입니다. 예를 들어 기업의 혁신을 추진하는 과정에서 최신 프레임워크로 구조화할 때보다 사실을 나타내는 한 가지 데이터를 제시할 때 문제를 더 쉽게 공유할 수 있습니다. 데이터가 지닌 신비한 힘은 직종 사이의 벽을 뛰어넘어 전 세계가 함께 의견을 주고받으며 같은 시선으로 문제를 해결하는 계기를 마련해 줍니다. 데이터 사이언스에는 그만한 힘이 있습니다.”
?〈한국어판 출간에 부쳐〉 중에서