티스토리 뷰

점점 데이터의 양이 늘어나고 있어요.

그러다보니 예전에는 상상할 수 없던 수십 테라바이트의 데이터를 모을 수도 있어젔는데요. 사용자가 언제 어디서 접속했다는 거나, 어느 웹사이트에 접속하는지, 쇼핑몰에서 어떤 상품들을 보고 있는지, 사용자의 흔적이 고스란히 데이터로 남지요. 우리가 IT 서비스 사용이 늘어나면서 이런 데이터들이 늘어가고 있는데요. 이 데이터를 모아서 어떻게 활용할 수 있을지 몇년전부터 화제가 되고 있어요.

빅데이터를 통해 무엇을 할 수 있는가. 유명한 해외 사례가 있어요. 아마존 사례인데요. 쇼핑몰에서 임산부에게 추천하는 카달로그와 쿠폰북이 딸에게 와서 아버지가 항의를 했다는데요. 자기 딸은 아직 결혼 전이라고. 임신한적 없다고요. 그런데 확인해보니 딸이 정말 임신을 했고, 쇼핑몰에서는 딸이 얼마 전부터 유기농 제품, 식품을 클릭하고 사는 것을 보고 임산부라고 예측했다고 하더라고요. 보통 임산부가 보여주는 패턴이라고요.

국내에서는 다음소프트 송길영 부사장님이 활용 분야에서 가장 앞서 있는 것 같고, 이분 강의를 들으면 좀 더 와닿을거예요. 강의에서 스스로를 사람들의 마음을 캐는 사람 송길영이라고 소개해요. 사람들이 살면서 흔적을 많이 남기는데요. 그 흔적들을 긁어모아서 마음과 욕망을 읽는 일을 하는게 직업입니다. 이 말이 데이터 마이닝을 잘 설명한다고 생각해요. 세바시 513회 "상상하지 말라, 관찰하라." https://www.youtube.com/watch?v=2XK4kEL7D1M

거대 인터넷 기업들이 늘어나면서 구글, 페이스북에서 이런 데이터들을 열심히 수집해오고 있죠. 구글이 안드로이드폰 위치 정보를 서비스를 꺼도 수집했다는 이야기 들어보셨죠? http://www.yonhapnews.co.kr/bulletin/2017/11/22/0200000000AKR20171122082100009.HTML

구글 포토는 사진 크기를 일부 줄이는 대신 무제한 저장 용량을 제공하면서 빅데이터를 수집하는 용도로 쓰이고 있다고 하죠. https://brunch.co.kr/@coldsky/119

국내에서는 아직 잘 활용해내지 못하고 빅데이터가 유망하다니까 정보를 수집하는데에만 열을 올리고 있는 걸로 보여요. 서비스 이용하려 하면 왜이리 동의해야하는게 많은지. 그중 일부는 개인정보 수집 동의죠. 빅데이터 정보 수집도 같이 동의하시는 겁니다. ^^;;

데이터 마이닝도 한계가 있어요. 무질서 중에 연관 관계를 찾을 수 있지만 왜 그런지를 답해주지는 않는다는 것이죠. 해석은 우리의 몫이예요. 송길영님 말처럼 인간이 이용하고 인간을 위한 것이니까요. 인간을 이해하는데서 시작해야한다는 거예요. :)



댓글
댓글쓰기 폼