데이터 분석의 힘

이토 고이치로 지음 | 인플루엔셜(주) 펴냄

데이터 분석의 힘 (그 많은 숫자들은 어떻게 전략이 되는가)

이 책을 읽은 사람

나의 별점

읽고싶어요
14,800원 10% 13,320원

책장에 담기

게시물 작성

문장 남기기

분량

보통인 책

출간일

2018.8.31

페이지

244쪽

#4차산업혁명 #데이터분석 #미래 #빅데이터

상세 정보

2017년 출간 직후 일본 아마존 경제 1위, 제39회 산토리 학예상 및 제60회 닛케이경제도서문화상을 동시 수상하며 학계와 대중으로부터 뜨거운 관심을 받은, 빅데이터 시대를 위한 데이터 분석 입문서. 듣기만 해도 어려운 데이터 분석 이론들을 흥미로운 사례와 함께 설명해 전문가가 아니어도 쉽게 이해할 수 있도록 썼다.

정말 그 광고가 제품의 매출을 높였다고 판단할 수 있는지, 오바마 대선 캠프는 어떤 데이터 분석을 활용해서 6천만 달러의 후원금을 ‘더’ 모았는지, 정부가 전기요금을 얼마나 인상해야 절전 효과가 발생하는지, 구글과 우버는 빅데이터를 활용해 어떤 비즈니스 전략을 이끌어냈는지 등 실제 사례를 통해 데이터 분석의 세계를 경험케 한다.

상세 정보 더보기

이 책을 언급한 게시물2

taihoon님의 프로필 이미지

taihoon

@taihoon

[전자책]
데이터 리터러시가 화두가 된지 오래다. 과학기술의 발달로 빅데이터의 구축이 어렵지 않게 된 오늘날 결국 올바른 분석을 위해서는 올바른 데이터를 올바른 방식으로 이용해야 한다는 결론에 이르게 된다. 이제 그냥 눈에 보이는 패턴 외 그 뒤에 숨겨진 의미를 찾아야 할 때이다. 이 책은 그러한 여정의 첫발을 떼는 데 도움을 줄 것이다.

데이터 분석의 힘

이토 고이치로 지음
인플루엔셜(주) 펴냄

2022년 10월 21일
0
박혜원님의 프로필 이미지

박혜원

@barkhyewondwus

4차산업혁명 시대의 화두인 빅데이터.
정형, 비정형데이터가 난무하는 수많은 데이터 속에서 어떻게 분석하고 가공하여 의미를 찾아낼 것인지?
데이터 분석의 기본 개념 설명을 다룬 책이다.

우리는 흔히 상관관계와 인과관계를 착각한다. 이를 분명히 할 필요가 있다.
광고를 했더니 아이스크림 매출이 급상승했다?
광고 이외에도 아이스크림 판매에 영향을 미친 요인을 따져봐야한다.

우리뿐만 아니라 언론에서도 학계의 연구결과를 갖고 굉장히 비약적인 메시지를 던지기도 한다.

모든 잘못된 데이터 분석의 출발점은 이 지점이다.
‘데이터의 상관관계는 인과관계가 아니다.’

이어서 데이터 분석기법 몇가지를 소개한다.

1. RCT 무작위비교시행
Randomized controlled trial

오바마캠프가 6000만 달러의 후원금을 더 모을 수 있었던 비밀,
웹사이트의 이미지와 문구 조합은 그냥 만들어진게 아니다.

2. 자연실험 quasi-experiment

2-1. RD디자인 (회귀불연속설계법)
불연속 discontinutiy 과 경계선 borderline 이 특징

일본의 사례, 70세이상부터 의료비 본인부담금을 덜어주는 경계선에 착안하다
급격한 변화의 경계선을 찾는게 핵심
경계선에서 데이터가 집적한다.

2-2. 집군분석
계단식 변화가 있는 곳에선 집군분석이 유리하다.
자동차 연비 규제, 덴마크의 한계 소득 세율 등

2-3. 패널 데이터 분석
= 이중차분법 difference in differences methods
= 고정효과추정법 fixed effect estimation

패널데이터란 복수의 집단에 대해 복수의 기간에 걸쳐 수집한 데이터이며,
평행 트렌드 가정이 반드시 필요하다. paralled trend assumption
: 만약 개입이 일어나지 않았다면 개입집단의 평균과 비교집단의 평균값은 평행한 추이를 보인다.

이러한 데이터 분석툴이 널리 활용되기 위해서는
첫째, 기업, 정부와 데이터 분석 전문가의 협력관계
둘째, 데이터 분석자가 데이터에 접근할 길을 넓힐 것

그럼에도 불구하고, 데이터 분석은 불완전하다.
데이터 자체가 불량이면 무용지물이며,
분석 결과가 분석 대상 외에도 적용 가능한가?라는 외적타당성 문제를 늘 고려해야한다. (외적 타당성과 내적 타당성)
출판 편향이나 협력 관계 편향이라는 문제도 있다. 따라서 관련자의 뜻에 맞지 않는 결과는 세상에 나오기 어렵다.
개입집단에 대한 개입이 비교집단에도 파급효과를 미칠 때는 주의가 필요하다.

-
여기까지 주 내용을 요약해보았다.
통계학적인 수식. 더 전문적인 내용을 알고 싶다면 좀 더 난이도있는 책을 찾아야 할 것이고, 빅데이터나 데이터 분석에 흥미를 갖고 개략적인 지식을 습득하기에 좋은 입문서다.


데이터 분석의 힘

이토 고이치로 지음
인플루엔셜(주) 펴냄

2019년 2월 6일
0
집으로 대여
구매하기
지금 첫 대여라면 배송비가 무료!

상세정보

2017년 출간 직후 일본 아마존 경제 1위, 제39회 산토리 학예상 및 제60회 닛케이경제도서문화상을 동시 수상하며 학계와 대중으로부터 뜨거운 관심을 받은, 빅데이터 시대를 위한 데이터 분석 입문서. 듣기만 해도 어려운 데이터 분석 이론들을 흥미로운 사례와 함께 설명해 전문가가 아니어도 쉽게 이해할 수 있도록 썼다.

정말 그 광고가 제품의 매출을 높였다고 판단할 수 있는지, 오바마 대선 캠프는 어떤 데이터 분석을 활용해서 6천만 달러의 후원금을 ‘더’ 모았는지, 정부가 전기요금을 얼마나 인상해야 절전 효과가 발생하는지, 구글과 우버는 빅데이터를 활용해 어떤 비즈니스 전략을 이끌어냈는지 등 실제 사례를 통해 데이터 분석의 세계를 경험케 한다.

출판사 책 소개

★ 2017년 일본 아마존 경제 1위, 일본 신서대상 6위 선정 도서
★ 제39회 산토리 학예상, 제60회 닛케이경제도서문화상 동시 수상!
★ 빅데이터 최고 권위자 이학배 교수의 감수, 송길영(다음소프트).조용민(구글) 등 강력 추천작!

폭발하는 빅데이터 시대,
데이터는 어떻게 전략이 되는가


2017년 출간 직후 일본 아마존 경제 1위, 제39회 산토리 학예상 및 제60회 닛케이경제도서문화상을 동시 수상하며 학계와 대중으로부터 뜨거운 관심을 받은, 빅데이터 시대를 위한 데이터 분석 입문서. 듣기만 해도 어려운 데이터 분석 이론들을 흥미로운 사례와 함께 설명해 전문가가 아니어도 쉽게 이해할 수 있도록 썼다. 정말 그 광고가 제품의 매출을 높였다고 판단할 수 있는지, 오바마 대선 캠프는 어떤 데이터 분석을 활용해서 6천만 달러의 후원금을 ‘더’ 모았는지, 정부가 전기요금을 얼마나 인상해야 절전 효과가 발생하는지, 구글과 우버는 빅데이터를 활용해 어떤 비즈니스 전략을 이끌어냈는지 등 실제 사례를 통해 데이터 분석의 세계를 경험케 한다. 이 책을 통해 의미 없는 숫자의 나열에 불과해 보이는 데이터가 어떻게 똑똑한 전략, 세상을 바꾸는 정책으로 진화하게 되는지를 이해하게 될 것이다.

■ 폭발하는 빅데이터 시대를 위한 쉽고 친절한 데이터 분석 입문서의 등장
― 출간 즉시 학계와 대중의 돌풍을 일으킨, 시카고대학교 이토 고이치로 교수의 신간


모든 것이 데이터가 된 시대, 바야흐로 빅데이터의 시대가 밝았다. 이제 개인의 위치 정보, 건강 상태, 소비 패턴, 통화와 검색어를 통한 생각의 흐름은 물론이고 기업과 정부의 경영 전략, 정책입안에 이르기까지 매 순간 데이터가 쏟아지고, 또 그 데이터를 활용해 결정이 이루어진다. 필연적으로 데이터를 처리, 분석, 해석하는 인간의 판단력, 즉 ‘데이터를 읽는 힘’이 중요한 화두로 떠오를 수밖에 없다.
이러한 흐름 속에서 출간 직후 일본 아마존 경제 분야 1위에 오르며 돌풍을 일으킨 책이 있다. 바로 신간 《데이터 분석의 힘》이다. 이 책은 미국 시카고대학교 해리스스쿨(공공정책대학원)의 촉망 받는 경제학자 이토 고이치로 교수가 최신 데이터 분석 이론을 수식 없이 쉽게 풀어낸 결과물이다. 그는 매해 논문을 통해 ‘중국인들은 미세먼지 1마이크로그램을 줄이기 위해 얼마를 지불할 용의가 있는지’, ‘동일본 지진으로 전력 공급에 차질이 생긴 일본에서 수요를 줄이는 적정 전력 가격은 얼마인지’ 등 뜨거운 환경?에너지 이슈에 관한 실증 데이터 분석과 정책 평가로 데이터 분석 이론과 응용에 관한 제일선의 경제학자로 꼽히고 있다. 대중을 상대로 처음 쓴 이 책으로 저자는 제39회 산토리 학예상과 제60회 닛케이경제도서문화상을 동시 수상하며 대중과 학계의 스포트라이트를 한 몸에 받았다.

■ 구글, 우버… 전 세계를 압도하는 비즈니스 리더들의 전략은 ‘데이터 분석’에서 출발
― 숫자의 나열에 불과한 데이터는 어떻게 최적의 전략을 만들어 내는가


지난 몇 년 사이 구글, 우버, 페이스북 등 많은 IT 기업들이 이전 시대에는 상상할 수 없을 엄청난 빅데이터를 확보하고 이를 비즈니스 모델에 적극 활용하면서 데이터 분석 자체가 강력한 전략으로 진화하고 있다. 저자 이토 고이치로가 설명하듯이, 그 최전선에 있는 기업 구글은 작게는 웹페이지 디자인 서체에서부터 알파고 등의 머신러닝 개발과 같은 신사업에 이르기까지 비즈니스 전 범위에 걸쳐 빅데이터를 활용하는 기업이다. 특히 구글이 검색 결과 화면에 배정할 ‘완벽한 파란색’을 찾기 위해 무려 41가지의 파란색을 선별하고 대규모 RCT(무작위비교시행) 실험을 단행했던 사례는 그들이 얼마나 데이터 분석을 전략적으로 활용하고 있는지를 보여준다.
미국을 넘어 전 세계로 진출하고 있는 차량 공유 플랫폼인 우버(Uber)도 데이터 분석을 통해 실시간 수요(이용자)-공급(운전자) 균형을 이루는 최적의 ‘요금’을 산출해낸다. 특히 시카고대학 연구팀과 함께 우버가 그들의 이용자 데이터 분석을 진행해 우버의 ‘수요 곡선’을 도출하는 내용은 자못 흥미롭다(본문 190쪽). 미래 지형을 바꾸는 기업들이 데이터를 어떻게 읽어내고, 그것을 비즈니스의 기회로 만들어내는지를 읽다보면, 데이터 분석이라는 세계의 무한한 가능성과 전략적 힘을 가늠하게 된다.
기업뿐만이 아니다. 2008년 미국 대통령 선거 당시, 버락 오바마 대선 캠프는 구글 출신의 광고 전략가 댄 시로커(Dan Siroker)를 영입해 ‘선거 후원금’을 최대로 모금할 수 있는 최적의 대선 후보 웹페이지를 설계했다(본문 74쪽). 그는 앞서 구글이 활용했던 RCT를 여기서도 활용했다. 시로커는 4개의 오바마 후보의 이미지와 6개의 카피를 조합한 총 24가지 버전의 웹페이지 화면을 무작위로 방문자에게 노출해, 가장 많은 메일링리스트 가입을 이끌어낸 최적의 시안을 찾아냈다. 그리고 이를 통해 예상치보다 약 6천만 달러의 후원금을 ‘더’ 확보할 수 있었다.

■ “그 광고가 정말 매출 상승의 원인입니까?” 흥미롭게 경험하는 데이터 분석의 세계
― RCT에서 패널 데이터 분석까지, 최신 데이터 분석 이론을 수식 없이 쉽게 배우다


저자는 《데이터 분석의 힘》을 통해 인과 분석에 관한 데이터 분석의 최신 이론들, 즉 RCT.RD디자인.집군 분석.패널 데이터 분석법 등을 다채로운 사례를 들어가며 설명해낸다. 정말 그 광고가 매출을 높였다고 ‘판단’할 수 있는지(상관관계는 인과관계가 아니다!), 전력난에 직면한 일본의 지자체가 전력요금을 얼마나 인상해야 절전 효과를 최대치로 끌어올릴 수 있는지(교토 게이한나 지역 현장 실험 사례), 실제로 유학을 다녀오면 취업률이 높아지는지, 외국인의 소득세를 낮추면 이민자들이 늘어나는지(덴마크 세제 개혁 사례) 등 실재하는 사례들을 통해 흥미롭게 데이터 분석의 세계를 경험케 한다.
그 과정에서 저자가 수식을 사용하지 않고 사례를 통해 설명한 점은 이 책의 가장 독창적인 부분이기도 하다. 이를 통해 독자들은 복잡한 통계학 지식 없이도 데이터 분석 이론의 개념과 원리를 수월하게 이해할 수 있다. 이 책의 감수를 맡은 이학배 연세대 응용통계학과 교수가 “이런 친절한 입문서가 왜 이제야 나왔을까”라고 치켜세운 것도 바로 그 때문이다.

■ “빅데이터 시대의 실용적인 인사이트란 바로 이런 것이 아닐까”
― 마케팅팀 김 대리부터 국가의 대통령까지, 모두가 탑재해야 할 새로운 ‘언어능력’


아무리 재료가 좋아도 칼솜씨가 없거나 고객이 원하는 맛을 이해하지 못하면 초밥이 맛있을 리 없다. 그런 맥락에서 저자는 책의 프롤로그에서 “데이터 분석에는 초밥 장인의 마음가짐이 필요하다”고 언급했다. 이제 데이터는 어디서나 구할 수 있지만, 제대로 읽어내지 못한 데이터는 무의미한 숫자 뭉치가 되거나, 진실을 호도하는 무기로 악용될 뿐이다. 그래서 중요한 것이 데이터를 처리, 분석, 해석하는 인간의 똑똑한 판단력, 즉 ‘데이터 분석력’이다. 게다가 더 이상 데이터 분석은 전문가들만의 영역이 아니다. 마케팅팀 김 대리에서부터 정부기관의 박 국장, 한 국가의 대통령에 이르기까지 모두가 탑재해야 할 또 하나의 ‘언어능력’이다. 모든 의사결정이 바로 ‘데이터’에 근거하고 있기 때문이다.
이 책을 읽고 나서 일반 독자가 당장 전문적인 데이터 실험을 설계하거나 복잡한 통계 분석을 직접 다룰 수 있게 되지는 않을 것이다. 그러나 앞서가는 데이터 분석가들이 데이터를 어떻게 분석하는지, 어떤 분석이 인과관계의 오류를 찾아내는지, 결국 데이터는 어떻게 똑똑한 전략이 되고 더 나은 세상을 만드는 정책이 되는지를 이해하게 될 것이다. 이를 통해 얻는 것은 새로운 시대를 읽는 ‘눈’이다. 독자들은 단순히 데이터 분석을 둘러싼 개념을 이해하는 데 그치지 않고, 다가온 빅데이터 시대를 살아갈 실용적인 인사이트를 명쾌하게 얻게 될 것이다. 촉망 받는 경제학자, 이토 고이치로의 등장이 반가운 까닭이다.

무제한 대여 혜택 받기

현재 25만명이 게시글을
작성하고 있어요

나와 비슷한 취향의 회원들이 작성한
FLYBOOK의 더 많은 게시물을 확인해보세요.

지금 바로 시작하기

플라이북 앱에서
10% 할인받고 구매해 보세요!

지금 구매하러 가기

FLYBOOK 게시물이 더 궁금하다면?

게시물 더보기
웹으로 보기