반응형

김미경TV) 빅데이터 분석기사!

반응형

김미경TV) 빅데이터 분석기사!

대한민국 최고의 빅데이터 전문가 서울대 산업공학과 조성준 교수, 그동안 김미경 강사가 너무 관심이 많아서 쫓아다니다가 드디어 만난 조성준 교수.

 

(현재 서울대학교 산업공학과 교수와 데이터 마이닝 센터장으로 재직하고 있는 조성준 교수는 서울대 산업공학과 학사, 석사학위를 취득 후 , 미 국무성의 풀브라이트 전액 장학생으로 선발되어 머신러닝, 뉴럴 네트워크 분야 등으로 박사학위를 받았고요. 세상을 읽는 새로운 언어의 작가이기도 합니다.)

 

 

빅데이터는 21세기의 석유이며  미래의 금광이라는 말 처음 들어보시는 분도 계실 것 같은데요. 생소하지만 이미 규모가 큰 회사에서는 많은 투자를 아끼지 않는다는 것입니다. 구글, 유튜브, 아마존, 인스타는 더욱 더 큰 회사로 나아가고 있는데요. 구글이 유튜브를 통해서 광고 수익만 버는 것이 아니었구나 라는 것도 알 게될 것입니다. 꼭 기업뿐 아니라 개인도 자신도 모르게 자신의 데이터가 있는데요. 

 

과거에는 부자라고 하면 지주(땅주인)가 있었고

그다음엔 빌주(빌딩주인)가 있었습니다.

그러나 이제는 데이터주 입니다.

 

세상을 읽는 새로운 언어, 오늘은 김미경 TV에서 조성준 교수의 미래 금광에 대한 정보를 드리겠습니다.

김미경 TV) 조성준 교수의 미래 금광은 빅데이터!

인공지능이라고 말하면 먼저 무섭다고 생각하실 것입니다. 우리의 직업을 빼앗고 두려움을 줄 미래의 대상으로 말이죠. 그러나 단순하게 AI인공지능도 빅데이터도 그저 컴퓨터일 뿐입니다. 무서운 존재는 결코 아니지요.

 

본질은 식재료와 같고 AI는 조리법과도 같습니다. 새우(빅데이터)를 갖고 튀김요리(AI)하면 새우튀김이 되듯이 말입니다. 

 

 

예를 들어서 알파고, 이세돌 기사와 경기에서 승리하고만 알파고도 결국은 과거의 수많은 기사들과 경기를 하면서 모아놓은 데이터로 승리하게 된 것이죠. 그런데도 불구하고 사람을 지배할 수는 없습니다. 최소한 향후 20년도 인간을 지배하지는 못합니다.

 

어느 특정 부분을 인간보다 넘어섰다고 해서 인간을 지배할 수 있는 것은 아니니깐요. 자율주행차에서는 AI는 운전만 잘할 줄 압니다. 대화하는 AI는 대화에만 능숙합니다. 인간이 하는 여러 가지를 한꺼번에 못하고 무엇보다도 삶의 목적의식이 없습니다. 그래서 기계라고 볼 수 있는 것이죠. 알파고보다 이세돌 씨는 더 적은 수의 데이터량의 경험을 갖고 있었기 때문에 어쩌면 더 적은 데이터만으로도 비슷하게 겨뤘다고 볼 수 있는 것입니다. 그러나 인간은 살아오면서 체험하고 경험한 것의 데이터량이 기계에 비해 어마어마하기 때문에 불완전하다는 이유로 기계보다 인간이 못하다고 할 수도 없는 것이죠. 컴퓨터만큼이 아닌 소규모 스몰 데이터만 있어도 인간은 잘 삽니다. 겁먹을 필요가 전혀 없어요.

 

1. 김미경 강사가 관심 갖는 이유

그동안 조성준 교수의 빅데이터에 관심이 많았다고 합니다. 그 이유 중 하나가 사업을 위해서 필요 가치를 느꼈기 때문인데요. 구글에서 무료로 채널을 분석하는 프로그램을 사용하고 있다고 합니다. 그곳에서는 자신의 영상으로 유입하는 사람의 나이 때와 성별, 시간 등으로 무료이지만 훌륭한 분석 자료라고 생각한다고 합니다. 그러나 더 많이 공부하고 유료라도 컨설팅업체에 의뢰를 한다면 더 큰 이익을 보지 않을까 생각을 했었다고 해요. 그러자 조성준 교수도 앞으로 올릴 콘텐츠, 주제, 기존의 것 중에 어떤 것을 확장할 것인지 분석을 받을 수 있을 것이라 합니다.

 

2. 빅데이터란 무엇인가?

사람은 일어나서부터 잠들 때까지 하루 매 순간 계속해서 만들어내고 있는 데이터.

외출할 때부터 나를 지켜보는 cctv들, 곳곳에 있습니다. 주변의 자동차마다 블랙박스가 나를 찍을 테고 교통카드를 이용할 때면 나의 카드로 데이터는 기록됩니다. 만일 자가용을 이용하더라도 내비게이션은 나의 목적지를 데이터화하고 있으며 외출을 하지 않더라도 집에서 스마트폰을 켜는 순간 나의 위치도 기록이 됩니다.

 

내가 누구에게 카톡을 보내는지 어떤 앱을 사용하는지부터 모두가 기록되고 있으며 TV를 켜도 내가 어떤 프로를 봤는지 다 기록됩니다. 단순히 찍히고 기록되는 것뿐 아니라 병원에서 엑스레이를 찍으면 병원, 국민건강보험공단에서는 나의 엑스레이 찍은 내용들이 전달되며 나도 모르게 기록이 됩니다. 이렇게 매 순간 기록되는 데이터들은 성별, 나이 때 상관없이 인간이라면 모두가 관심 갖고 공부해야 할 중요한 것입니다.

 

 

 

 

3. 우리나라 데이터 산업 수준은?

우리나라의 데이터들은 잠겨있기 때문에 미국에 비해서 많이 뒤처져 있는 상태입니다. 우리는 의료 데이터, 금융데이터는 개인보호를 위해서 거래할 수 없도록 막아져 있어서 거래가 불가합니다.

그러나 미국 같은 경우는 데이터 개방 국가입니다. 즉 개인이 무엇을 사고 파는지의 거래가 개방되어 있습니다. 단 그런 데이터를 범죄에 악용하게 되면 크게 벌을 받는 법이 있는 것이죠. 우리나라는 마이 데이터(My Data)를 적극 활용해야 합니다. 마이 데이터 (자신의 정보를 적극적으로 관리, 통제하는 것은 물론 이러한 정보를 능동적으로 활용하는 일련의 과정.)

 

정부가 개인의 프라이버시 문제로 그동안 차단된 상태였습니다. 우리의 정보를 보호해주기 위한 차원에서 엄격하게 차단되었는데 지금은 마이 데이터 활용 규제를 완화하는 정책으로 되었습니다. 마이 데이터는 더 진보되었고 내가 허락하면 활용할 수 있는 것이지요. 즉 마이 데이터는 개인과의 거래가 이루어지는 것입니다.  개인이 활용하게 되면 회사에서 나의 데이터를 분석하고 나에게 내가 원하는 것을 조언을 하는 식이 될 수 있습니다. 

 

유튜브, 인스타, 구글, 아마존에서도 큰돈을 쓰면서까지 사업에 활용하고 있으며 우리나라도 마이 데이터를 사용으로 데이터 산업 수준을 높일 필요가 있습니다. 

 

4. 데이터를 활용하여 창업과 취업을?

개인이 데이터를 생산하기도 하지만 데이터로부터 수혜를 받는 사람이기도 해야 합니다. 창업, 취업이 갈수록 유리합니다. 타인의 데이터를 모아서 그것으로 돈을 버는 사람이 꽤 많습니다. 대표적인 곳은 네이버, 구글, 페이스북, 인스타 등 회사인데, 플랫폼 역할을 하는 것 외에는 하는 일이 없습니다. 모두 개인이 자신의 계정을 관리하는 것이죠. 사업을 하는 사람 입장에서는 데이터만 잘 모으면 좋은 사업수단이 될 수 있습니다.  HOTELS.COM처럼 생산자 이면서 동시에 소비자가 되는 것입니다.

 

고객이 호텔을 이용하고 사이트에 후기를 남기면 플랫폼 비즈니스의 핵심인 데이터가 손님에 의해 자동 생산되는 것입니다. 또 하나는 데이터 자체가 돈이 됩니다. 대포적인 회사가 쿠팡인데요.

쿠팡에서는 데이터로 전 국민이 어느 곳에서 어떤 물품을 가장 많이 선호하며 잘 팔리는지에 대한 자세한 내용을 알고 있습니다. 더 충격적인 회사는 링크트인(세계 최대 비즈니스 인맥관리 서비스 사이트)이라는 회사인데, 그 사이트에 이력서를 올리면 구인회사가 채용조건을 검색하고 원하는 직원을 찾아 채용하는 것이죠. 현재는  그렇게 이력서를 올린 사람이 1억 명이 넘는데요. 어머 한 양을 갖고 있을 것입니다. 

 

그렇게 돈이 되며 구글이 유튜브를 통해서 버는 건 광고 수익뿐이 아닌 것입니다. 유튜버가 자신의 채널에서 좋은 콘텐츠를 만들면 유튜브를 한 번도 보지 않던 다양한 연령층이 많은 유입이 될 테니깐요. 그렇게 새로운 사람들의 데이터를 가져가는 것이죠.

 

스스로 새로운 금광 산업에 창업을 원하신다면  플랫폼이 되어서 데이터를 쌓을 수 있는 사업을 겨냥하면 됩니다.

사업 자체가 수익을 못 내고 0으로 가는 것도 괜찮고 쿠팡처럼 수익이 마이너스 5천억이 돼도 사업은 잘되며 점점 커집니다. 그만큼의 가치가 있는 데이터 산업인 것이죠. 물론 이제 알게 된 분에게 창업을 시작하기란 막막한 일이지요. 우선 관련 서적을 보시고, 전문가 교육과정에 대해 학습, 관련 자격증을 취득한 후 전문가로 근무하여 경험을 쌓고 창업 준비를 하신다면 더 좋을 것 같습니다.

 

미래에 꼭 필요한 데이터를 가진 회사가 성장하고 그런 나라가 성장하지요. 그렇게 지주가 아니라 데이터 주의 세상이 되는 것이죠. 

 

5. 만일 창업보다 취업을 원한다면?

지금 많은 회사들이 데이터를 분석하고 싶어 합니다. 그 말은 데이터 전문가를 필요로 한다는 것이죠. 우리나라의 40대 50대들이 컴퓨터를 배우기 시작하면서 윗세대를 밀어낼 수 있었습니다. 다음의 20~30대의 물결은 데이터인 것이죠. 

자격증을 취득하는 것부터가 시작이라 하겠습니다.

 

기성세대는 컴퓨터는 이해하는 단계에 이르렀지만 정작 데이터는 아직 어려운 세대입니다 , 데이터가 금이라는 것은 알아도 어떻게 접근할지 모르는 것이죠. 그래서 취업이 잘 안 되는 요즘, 20대 30대의 기회는 데이터 전문가가 되는 것입니다. 예를 들어서 삼성전자의 오븐기가 빵, 과자를 여러 번 만들어 보았지만 잘 안되었을 때. 똑같은 내용을 28살의 김대리는 팀장님, 제가 해보니까 빵, 과자가 잘 안 만들어지더라고요.라고 말한다면 상사는 그건 너의 개인 생각이라고 무시하기 일쑤입니다. 다른 사람은 잘들 만들더라고 말이죠. 그러나 고객의 소리로 말을 한다면 어떻게 될까요? 팀장님 저는 잘 모르겠지만 고객님들은 잘 못 만들겠다는 데이터가 많이 나왔답니다. 70만 소비자를 대상으로 의견이 나오는 것과 나 홀로 건의를 하는 것은 분명한 차이가 나기 때문입니다. 정답은 바로 데이터로 무장하면 개인의 의견보다 큰 힘이 생기는 것입니다. 

 

 

6. 마케팅 부서 문과 사람들도 가능할까요?

문과분들은 코딩이라고 하는 넘을 수 없는 벽이 있습니다. 그러나 코딩 없이도 데이터 분석이 가능한 방법들이 많습니다. 그리고 사람의 마음을 글로 쓰고 기획하는 것은 문과를 나온 사람들의 특기일 테니 어려운 수학이라고만 생각하고 어려워하지 않아도 될 것입니다. 

 

빅데이터는 우리 모두에게 상관관계가 있습니다. 현재 나이가 60대 70대라며 나는 일을 할 계획도 없다 하더라도 내 데이터가 누군가의 손에 들어가고 그걸 가지고 매분 매초 싸우고 있는 것이니 이런 상황을 어떻게 바라볼 것인지, 그 후에 내가 선택권이 있다면 내 데이터를 어떻게 쓸 것인가의 질문을 던지고 조금씩 알아가는 자세가 필요합니다. 

 

과거에는 컴퓨터 할 줄 알아요? 저는 좀 하는데 라는 말로 대화를 나눴다면 앞으로는 빅데이터 할 줄 알아요?라는 대화가 나오게 됩니다. 그래서 선택이 아닌 필수입니다. 언제의 문제지 할 거냐 말 거냐의 문제가 아닌 것이죠.

그래서 한 살이라도 어릴 때 공부하기를 추천합니다. 

 

앞으로 취업을 하거나 창업을 하려는 우리 후속 세대들에게도 유용한 기술이 될 것입니다.

여기까지 김미경TV) 빅데이터 분석기사! 였습니다. 감사합니다.

반응형

이 글을 공유하기

댓글

Designed by JB FACTORY