'Data수집'에 해당되는 글 1건

  1. 2013.02.28 통계학. 속지도, 속이지도 않는 IT 기획자를 위해

IT 전략과 기획을 이야기하는데 통계학의 등장이 의외라고 생각하는 분들은 너무 멀리 온거 아니냐고 물을지도 모르겠다. 허나 전략을 이야기할때 통계는 필요충분조건이다. 온갖 수치와 멋들어진 그래프로 사람들을 혼란스럽게 만들기도 하고, 때로는 모두가 방향을 잃고 허공을 헤매일 때 방향성을 제공해 주기도 한다.

웹기획이나 프로젝트 수주 제안서에서는 상대적으로 그 사용 빈도나 중요도가 조금 낮을 수 있으나 사업계획서나 전략수립서 그리고 특히 BPR/ISP(Business Process Restructuring / Information Strategy Plan) 에서는 준비된 자료의 많은 부분이 통계에 의지된다. 그렇기에 여러분이 “전략”이란 단어에 깊은 관심을 가지고 있다면 결코 간과할 수 없는 분야이다.

통계나 확률을 이야기하면 ‘숫자’를 떠오르기 쉽지만, 사실 거기에는 보이지 않는 힘이 작용한다. 미국 월스트리트의 합법적 사기꾼들이 온갖 수치와 그래프로 미국 경제는 물론 전세계 경제에 먹구름을 드리운 이야기는 많이 들어보았을 것이다. 일반인은 몇 년이 걸려도 절대 이해 못할 계산식을 통해 돈이 돈을 벌 수 있다는 파생 상품이나 펀드 상품들도 문제는 있지만, 이 과정에서 숫자들은 결코 거짓을 말한 적이 없다. 모두 그 숫자들을 모으고, 배치하고, 해석했던 월 스트리트의 ‘사람들’이 문제였다. 정직한 ‘숫자’들을 원하는대로 재그룹하여 특정한 의중을 그 위에 얹은 사람들의 의도가 결국 보이지 않는 힘이다.

이제 작은 속임수를 하나 보자. 아래 그래프에는 8개 회사의 년간 수익률이 그래프로 표시되어 있다.


여러분은 어떤 회사의 IT 전략을 수립중이고, 몇몇 이유로 인해 특정 사업 분야를 가지고 있는 회사를 인수해야 한다고 가정해보자. 여기 8개의 회사의 년간 수익률이 나와있다. 여러분은 위 자료는 바탕으로 인수할 회사를 선정해야 한다. (E사의 데이터는 의도적으로 누락시킨 것이다)
 1. 여러분이 2개의 회사를 선정해야 한다면, 즉 [그래프1]에서 회사를 하나 택하고, [그래프2]에서도 하나를 택해야 한다면 각각 어느 회사를 선택하겠는가?
 2. 여러분이 A에서 H 중에 단 하나의 회사를 선정해야 한다면 어느 회사를 선택하겠는가 ?

수익률이 높은 회사를 선택하는 것이 당연하니, 2개를 선택해야 한다면, C와 G를 선택했을 것이고, 하나만 선택해야 한다면 당연히 G사를 선택했을 것이다.

위의 이제 각각 그래프의 수치를 다시 한번 한번 보자.




물론 설명을 위해 극적인 예를 든 것이지만, 어떤가? 실상 A=E, B=F, C=G, D=H 이고, 각 회사의 수익률을 수치를 살펴보면 [그래프3]과 [그래프4]는 같다. 그러나 누가봐도 C 보다는 G가 매력적으로 보인다.
극적인 예를 든김에, 이 간단한 두 개의 그래프만으로도 다음과 같이 억지스러운 해석들이 가능하다.  (여러분이 일반적인 사람들처럼 진실을 모른다는 가정 하에 )

(1) A ~ D 사의 수익률은 그다지 큰 차이가 없으므로 수익률보다는 경영진이나 부대적인 다른 요인들로 인수할 회사를 선정하는 것이 바람직한것으로 판단됨.
(2) G사는 동종 업계 타 사에 비해 압도적으로 높은 수익률을 보여주므로 G사를 인수하는 것이 바람직한것으로 판단됨.

(1)번의 해석에는 수익률보다는 다른 요인(가령 경영진이나 기술력)으로 인수할 회사를 결정하겠다는 의도가 보인다. 이를 위해 좌측의 수치를 7%, 8%와 같이 1% 단위로 설정하였다.
(2)번의 해석은 의도적으로 소수점 단위로 그래프를 그려 G사의 수익률을 매력적으로 보이게 하였다.


물론 실제 사업계획서에서 이렇게 심플한 데이트로 이렇게 극적인 결과를 내놓는다면 그것은 절대적인 아마추어일것이다. 하지만. 분명히 이와 같이 동일한 데이터를 놓고도 그래프를 어떻게 표현하는지에 따라 전혀 다른 해석을 내 놓을 수 있다는 사실을 잊어서는 안된다. 이것이 통계학이 가진 어두운 이면이고 통계학이 가진 힘이다. (사실 ‘통계학’이라기 보다는 자료 해석과 표현이 더 정확할지 모르겠으나 이를 뒷받침하는 것은 “통계학”이라 이렇게 표현한다.)


여러분은 기획자로서 사업계획서를 쓸 때나 컨설턴트로서 전략서나 BPR/ISP를 작성할 때 이처럼 수치와 그래프의 임의 설정을 통해 본의 아니게 왜곡된 데이터와 해석을 전달할 수 있다. 혹은 여러분이 이런 데이터를 제공받는 발주사의 입장일수도 있다. 보고서를 검토하는 입장이라면 이런 통계 자료들이 난무할 때, 어떤 의중(기저)을 가지고 작성되진 않았는지 의심해 볼 수 있어야 한다.

속이지 않기 위해서 또는 속지 않기 위해서는 몇몇 노하우가 필요하다. 통계를 포함한 [자료 수집과 해석]의 전체적인 흐름은 아래의 그림과 같다. 가장 중요한 것은 [Data 수집 방향성과 수집 항목 설정] 구간과 [Data의 해석] 구간에 특정한 의도가 내포되어 있거나 해석이 편향적이지 않는지 신중하게 검토해야 한다는 사실이다.




개인적으로 나는 이 Part 1. 기저(Basis) 구간에서 그나마 이 “통계학”이 가장 여러분이 쉽게 접하고 빠르게 익힐 수 있다고 생각한다. 지금 즉시 서점으로 달려가보길 바란다. 일반인을 위해 쉽게 풀어쓴 통계나 확률에 대한 책들을 손쉽게 찾아볼 수 있다. 속이지도, 속지도 않는 기획자가 되길 바란다.



Justin의 추천 서적

* 촘스키처럼 생각하는 법 (노르망 바야르종 지음)



Point !

검색 엔진에서 “통계 왜곡” 이라고 검색을 해 보거나, “통계, 거짓말” 등의 키워드로 서적을 검색해 보라. 우리가 얼마나 왜곡된 통계 속에서 살고 있는지 놀랄 것이다.



Part 1. 기저(Basis): 기저를 파악하라.

  • 철학(Philosophy). 철학자처럼 생각하라. (바로가기)
  • 심리학(Psychology) 논리학(Logic) 언어학(Linguistics). 유희 (바로가기)
  • 경영학(Business Management). 최소한의 기본기 (바로가기)
  • 통계학(Statistics). 속지도, 속이지도 말라.


IT Philosopher Justin from Philosophiren



신고
Posted by Philosophiren