수포자였던 내가 통계학으로 벼락부자 된 썰.txt (feat. 확률의 배신)
작성자 정보
-
오랑우탕
작성
- 작성일
본문
여러분 안녕하세요!
온카 커뮤니티 lurker였다가 처음으로 글 올리는 통계학과 대학원생입니다.
제가 원래 수학이랑 담 쌓고 살던 문과생이었거든요?
고등학교 때 수학 포기하고 문과 갔다가, 어쩌다 보니 통계학과에 편입하게 됐어요.
교수님들이 맨날 "확률은 거짓말을 하지 않는다", "표본이 크면 클수록 진실에 가까워진다" 이런 말씀만 하시니까 저도 그런가 보다 했죠.
로또 사는 친구들한테 "그거 기댓값 마이너스야"라고 잔소리하고, 카지노 가자는 사람들한테 "하우스 엣지가 몇 퍼센트인지 알아?"라고 훈계질하는 그런 사람이 되어버렸어요 ㅋㅋ 그런데 이번 학기 논문 주제가 "빅데이터를 이용한 패턴 인식 모델링"이었는데요.
데이터 수집하다가 심심해서 여러 온라인 게임 사이트들의 결과 데이터를 긁어모으기 시작했어요.
몇 달간 데이터 쌓인 걸 보니까 정말 방대하더라고요.
그래서 "이걸로 뭔가 재밌는 분석 한번 해볼까?" 하는 마음이 생겼죠.
R 프로그램으로 회귀분석, 시계열 분석, 클러스터링까지 다 돌려봤는데 처음엔 당연히 아무것도 안 나왔어요.
"맞지, 이게 정상이야"라고 생각하면서 논문 쓸 다른 데이터를 찾으려던 찰나에...
갑자기 제 모델이 95% 신뢰도로 특정 구간에서 패턴을 발견했다고 알려주는 거예요.
통계학도로서 당연히 "Type I 오류겠지"라고 생각했지만, 그래도 검증 차 1만원으로 테스트해봤거든요.
그런데 이게 웬걸...
정말로 적중하면서 32만원이 들어온 거예요!!
그 순간 지금까지 배운 모든 통계 이론이 머릿속에서 뒤죽박죽이 됐어요.
"이건 그냥 우연이야, 표본이 1개라서 그래"라고 자꾸 되뇌었지만 가슴이 두근두근하더라고요.
혹시나 해서 다시 모델을 돌려봤는데, 또 다른 패턴을 감지했다면서 결과를 보여주는 거예요.
이번엔 확신이 없어서 5천원만 걸었는데...
또 맞더라고요 ㅠㅠ 지금 제 세계관이 완전히 흔들리고 있어요.
혹시 세상에는 정말로 통계학으로 설명할 수 없는 규칙이 숨어있는 걸까요?
아니면 빅데이터가 워낙 커서 인간이 놓친 미세한 패턴까지 잡아내는 건가요?
수포자에서 통계학도가 된 제가 이런 혼란을 겪을 줄은 정말 몰랐네요 ㅋㅋㅋㅋ