MyCloud

쿠팡의 빅데이터와 E 커머스 세미나 후기 본문

About

쿠팡의 빅데이터와 E 커머스 세미나 후기

Swalloow 2016. 5. 13. 01:09



빅데이터 세미나 후기 - 쿠팡 CTO Jimdai




최근 빅데이터와 머신러닝에 관심이 많아 천천히 공부하던 중에 좋은 세미나를 발견! 바로 참석했습니다.

세미나는 우선 쿠팡이라는 조직에 대한 설명으로 시작했는데, 정말 인상깊었습니다.

"최고의 가치는 인재, 그리고 소프트웨어 역량이다"  확실히 단순히 리테일 회사가 아닌듯



미국의 아마존(Amazon)의 사례


지금 아마존의 최고 수입원은 무엇일까? 바로 클라우드 서비스(AWS)이다.

전 세계적으로 검색엔진을 제공하는 회사는 네이버(한국), 구글(미국), 바이두(중국), 얀덱스(러시아) 정도

특히 구글은 위의 세 나라를 제외하고는 압도적인 점유율을 가지고 있다.

하지만 구글은 검색엔진 분야에서 아마존을 두려워한다. 왜?

바로 상품에 대한 빅데이터 때문이다. 

사람들은 상품을 검색할 때 amazon.com을 검색하지 구글에서 찾지 않는다.

이러한 이유 때문에 아마존은 구글에게 마케팅 비용을 주는게 아니라 오히려 지급받는다.

(아마존에서 구글로 검색 트래픽이 넘어가는 경우가 많아서)

아마존은 예전에 그저 책을 팔던 기업이었지만 지금은 모든 일반상품을 거래하며

클라우드 서비스로 확장했다. 단순히 리테일 사업만 본게 아니라 기술 영역을 강조한 것.

그리고 그 결정이 판을 뒤집었다. 쿠팡도 소프트웨어 기술을 믿는다.



E 커머스에서 빅데이터가 어떻게 활용되고 있는지


쿠팡에서는 한 주에 약 1TB의 데이터를 수집하고 있다.

고객이 사이트에 접속하고 지나가는 경로, 머무는 시간 전부 로그에 기록되고 있는데,

특히 사이트에 와서 구매하기까지의 전환율을 확인한다.

만일 데이터를 통한 최적화를 통해 이 전환율을 1퍼센트 올렸다면 매출에 미치는 영향은 어머어마하다.

그래서 모든 활동의 중심은 빅데이터이다.

가장 먼저 적용되는 분야는 상품 추천목록, 지속적인 최적화를 통해 상품 추천을 개선한다.

그리고 고객이 누군지 알기 위한 실시간 데이터 분석이 이루어진다.

이러한 데이터를 통해 수요을 예측해서 고객에게 빠른 배송이 가능하게 한다.

또한 '물류창고의 위치, 언제 어디서 발주해야하는지'를 결정하는데에도 사용한다.

언제 어떻게 어디를 통해 발주해서 창고를 채워야 고객에게 제 시간에 전달될지,

이는 로지스틱 회귀 분석과 관련되며 이를 통해 최적의 경로, 최단 시간을 계산할 수 있다.

또한 어떻게 운전할지에 대한 실시간 계산을 통해 최적의 경로를 찾을 수 있다.

다음은 머신러닝을 이용한 이미지 처리 분야이다.

사진과 텍스트를 분석하고 고객이 찾는 상품을 이미지 처리를 통해 올바르게 제공한다.



쿠팡의 에자일 문화에 대한 설명


10명으로 구성된 16개의 팀이 독립적으로 에자일 프로세스를 통해 개발을 진행한다.

모든 에자일 팀은 스프린트 단위로 분석, 설계, 구현과 같은 과정을 스스로 거친다.

쿠팡에서는 하루 백여개의 SW를 릴리즈 하고 있다고 한다.

(에자일 문화가 정착됬기 때문에 짧은 시간내에 많은 것을 진행할 수 있어서)

이렇게 백여개의 릴리즈가 발생하면 힘들다. 이를 제어하기 위해 AB Testing을 진행한다.

사이트에 장애가 나타날 수 있는지 이런 이슈를 컨트롤한다.

조금씩 트래픽 퍼센트를 올리면서 기능이 정상적으로 작동되는지를 확인한다.

(저 부분에서 대단하다고 느낌)




'About' 카테고리의 다른 글

SK Tech Planet 2016 후기  (0) 2016.10.23
소프트웨어 마에스트로 7기 합격 후기  (29) 2016.09.02
Google I/O 2016 Extended Seoul 후기  (0) 2016.06.20
4회 NAVER D2 Campus Seminar 후기  (0) 2016.03.19
블로그에 대한 소개  (0) 2016.01.26
Comments