로그인


l

팁 & 강좌 게시판

생활속에서 필요한 지식과 지혜를
다른 회원들과 나누는 게시판입니다.

  • 전체보기
  • [PDA]
  • [PC/모바일]
  • [생활상식]
  • [취미/음식]
  • [기타]
  • [카메라]
  • [iPhone/Touch]
  • [기타 전자기기]

[기타]

[발암주의] 김어준의 더 플랜 K값 소동 요약

안녕하세요.

 

더 플랜에 나오는 "K값이 잘못되었다."라는 주장에 대한 반박글을 링크합니다.

 

[발암주의] 김어준의 더 플랜 K값 소동 요약

 

해당 글 안에, 수학적인 반박과 논리적인 반박글의 링크가 모두 있습니다.

 

공론화되어야 하는 문제라 생각되어 가끔 이용하는 클리앙에도 올리는 것이니 양해해주시면 감사하겠습니다.(_ _)

 

여기저기 퍼가셔도 됩니당

 

  • 라임에이드님
  • (2017-04-20 23:59)
저쪽 동네도 사람 사는 동네군요 ㅎㅎ 역시 논리/통계 모르면 안돼요.

닉이 같은 걸 보니 글쓴분이시군요. 혹시 아래쪽에 제 글 읽어보셨나요? 못쓰는 것이나 아닌지 좀 보아주시고 퍼가셔도 됩니다 ㅎㅎ
  • 가방싸개님
  • (2017-04-21 14:41)
논리도 통계도 다 틀린 논의는 노인가설이긴 하지요.

제일 중요한 부분이  아래 내용이지요.
K=KU/ KC = (P2/M2)/(P1/M1),
Theoretical expectation of K: E[K]=1
 P1 ~ B(P, 1-r), where B represents a binomial distribution with a probability r = Pr(UP).
 P2 ~ B(P, r)
 M1 ~ B(M, 1-r), where r= Pr(UM)=Pr(UP).
 M2 ~ B(M, r)
It is known that if X ~ B(n, p), E[1/X+a]= integral[t^(a−1)Px(t)dt  , where 0<p<1, E represents  expectation, and Px(t) is the probability generating function. We thus have
E[1/X+1]=integral[T^0 (q+pt)^ndt= {1− q^(n+1)}/{(n+1)p} , where q=1−p [2]. If n → infinity, then q^n→ 0 as 0<q<1. Thus E[1/X+1]= 1/(n+1)p ≃ 1/np as n→ infinity,
Also for large X, we see E[1/X+1] ≈ E[1/X]≃ 1/np .
Applying to the 18th presidential election in 2012, we have
E[1/P1]=1/P(1−r) and E[1/M2]=1/Mr for large P1 and M2.
Since candidate 1’s classified versus unclassified votes are independent from candidate 2’s,
E[K]=E[P2/M2⁄P1⁄M1]= E[P2/P1⁄M2/M1] = E[P2/P1*∙M1/M2 ]=E[P2/P1 ]* E[M1/M2].
As P and M are constants, we get
E[P2/P1 ]= E[(P− P1)/P1 ]=E[P/(P1-1) ]= P*E[1/P1]−1=P/P*(1−r)−1= r/(1− r), E[M1/M2 ]= E[(M− M2)/M2 ]= M* E[1/M2]−1=M/(M*(r−1)= 1−r/r ,
E[P2/P1 ]* E[M1/M2]= r(1− r)/ (1−r)∙r =1.
Therefore E[K]= 1.

위 내용에서 제일 중요한 부분이 바로 E(1/X)~1/np를 증명하는 부분이지요. 이게 큰 수의 법칙이 들어가는 부분이구요. 그래서,E(K)값은 이항분포의 이론적 기대값이기 때문에 선거가 이항분포를 따른다면, 거의 무조건 기대값 즉, 평균은 1 주변에서 정규분포를 이루도록 나와야 하는 거지요. 그런데, 이상하게 1.5주변에서 정규분포를 이루도록 18대 대선이 치루어 졌다는 거지요. 이건, 선거가 이항분포를 따르지 않았다는 결론이 나오는 거지요. 만약, 선거가 이항분포를 따르지 않았다면, 그건 선거가 비밀 선거가 아니게 되니, 조작을 의심하게 된 거구요. 이게 이론적 배경이지요.

노인 가설이 잘못된 이유는 저 부분에서
 P1 ~ B(P, 1-r), where B represents a binomial distribution with a probability r = Pr(UP).
 P2 ~ B(P, r)
 M1 ~ B(M, 1-r), where r= Pr(UM)=Pr(UP).
 M2 ~ B(M, r)
r값이  r= Pr(UM)=Pr(UP). 를 따르지 않고, Pr(UM)이 Pr(UP)와 다르다고 가정하는 거지요. 그런데, 다르 뿐만 아니라, Pr(UM)과 Pr(UP)가 노인연령층의 비율에 따라 달라질 것이라고 가정한 거지요. 그런데, 그렇게 되면, 저 증명에서
P를 지지한 후보와 M을 지지한 후보가 동시에 선거를 했는데, 서로 다른 이항분포를 그렸다는 뜻이 되는 거지요. 이건 마치, 선거가 두가지 분포를 그리면서 동시에 진행됐다고 가정하는 것과 같지요. 결국, 단순히, r값이 변경되는 문제가 아니라, 선거라는 것이 비밀 선거라면, 독립시행이고, 그것이 서로의 표를 볼 수 없다는 것인데, 지지자에 따라 분포를 다르게 만드는 특별한 힘이 작용했다고 가정하는 셈인 거지요. 이걸 r값만 미지의 변수의 함수라고 가정한다고 해결될 문제가 아닌 거지요. 선거가 후보자에 따라 서로 다른 분포를 그릴 수 있는 경우는 비밀 선거가 아닌 경우 밖에 없으니, 조작을 의심하는 거구요. 만약, r값이 달라지더라도 r이 일정한 비율로 달라지는 시스템적 오류가 존재할 수는 있으나, 1.5를 주변으로 정규분포를 그릴 정도로 완전히 서로 다른 분포를 그리는 게 가능하지 않다는 것이 이론적 주장이지요.

이론적으로 따지면, 노인가설이 성립하려면, 저 증명에서 마지막 부분이 E[P2/P1 ]* E[M1/M2]= r'(x)/(1− r'(x))*(1−r(x))/r(x) = K로 바뀌지요. 즉, r 값이 후보자별로 다른 이항분포를 따르기 때문에 새로운 변수 x, 노인연령층의 비율에 따라 생기는 변수를 추가해야 하는 거지요. 그런데, 그렇게 되면, 저식은 K~r'(x)/r(x) 에 근사치인 경우가 된다고 볼 수 있게 되지요. 그런데, 1.5가 나오려면, 결국 노인 연령층이 많을 수록 K값이 증가한다는 식으로 나오지 않는 이상, 설명이 안된다는 뜻이 되는 거지요. 그런데, 그말은 r'(x)와 r(x) 즉, 후보자간 미분류율이 일정하게 변하는 선형관계를 가진다는 뜻과 같은 거지요. 그래서 r'=r+b 로 고쳐서 대입하여, 계산해야만 한다는 소리와 같은 말이 되는 거지요. 이건, 결국, 시나리오1에서 반박되었지요. r'와 r이 즉, 후보자간 지지율에 따른 미분류율이 선형관계를 가진다고 가정하여 상관관계를 분석하면, 상관관계가 없다라고 나온다는 거지요. 그 말은 시스템적 오류든, 노인가설이든 이항분포를 따른다면, K값 1.5를 설명할 수 없다라고 계산된 거지요. 결국, 이항분포를 따르지 않은 선거였다는 결론이 이론적 주장인 거지요.
  • wijw1님
  • (2017-04-21 16:25)
시나리오 1이 무슨 내용에 대한 검정인지 여전히 이해하지 못하시는군요. 다시 논문 읽어보고 오세요.
  • 마봉길님
  • (2017-04-21 16:29)
wijw1님 //
+1
  • 가방싸개님
  • (2017-04-21 16:54)
논문을 안읽은 분이 누군지 모르겠군요. 전 읽었습니다.  반박을 하실 생각이 없으시네요.
  • Talin님
  • (2017-04-21 17:02)
가방싸개님//

"만약, 선거가 이항분포를 따르지 않았다면, 그건 선거가 비밀 선거가 아니게 되니, "

--> 아니... 어떻게 이런 대담한 논리전개를 하시는겁니까?

이 전글에서도 "논문 제대로 읽은거 맞냐", "수식 제대로 봤냐" 하실 정도면 이런식의 논리전개를 하시면 안되죠...

이전 글에 부탁드린거나 증명해보세요.
  • 가방싸개님
  • (2017-04-21 17:06)
대담한 주장이라니요? 투표는 한후보를 찍으면 다른 후보를 찍지않는 베르누이 시행입니다. 이건 고등학교 수학시간에도 나오지요. 베르누이시행이 뭔지는 아시나요? 베르누이 시행이 아니라면 비밀투표가 아닌 거지요.  반박하실 생각이 없으시면 그만 두시지요.
  • wijw1님
  • (2017-04-21 17:17)
http://www.clien.net/cs2/bbs/board.php?bo_table=lecture&wr_id=356721

이 글에서 충분히 반박된 내용이라고 봅니다.
저 댓글 반박 내용에서 조금이라도 벗어나는 이야기를 해보세요.
  • 가방싸개님
  • (2017-04-21 17:19)
그 때 이미 틀린 이야기라고 말씀드린 듯 하네요. 더이상 할 말 없으시면 그만두시지요. 반박이란 게 우긴다고 되는 건 아니지요.
  • Talin님
  • (2017-04-21 17:36)
가방싸개님//

저 식이 성립하는 조건에서만 쳐다보니까 자꾸 저런식으로 전개하시는거잖아요. 저 식이 성립하는 조건에서만 얘기하면서 1.5가 나옴 -> 이항분포를 따르지 않음 -> 비밀선거가 아니게 됨.

이미 저 식의 근간이 되는 가정이 틀렸다는건데 왜 자꾸 저 식을 가져와서 얘기하십니까? 가정자체가 틀렸다는 얘기를 하는데, 그 틀렸다는 가정으로부터 나온 식으로 반박하시는걸 대담한거 아니면 뭐라고 할까요?

그리고, 시나리오1이 노인가설을 포함한다는건 아직도 유효하신건가요?

그러면 지난번 그 식 좀 증명해주세요.
  • 가방싸개님
  • (2017-04-21 17:49)
근간은 이론적 가정입니다. 뭐가 틀렸지요. 저게 틀린 걸 수학적으로 증명하셔야지요.
  • Talin님
  • (2017-04-21 17:53)
가방싸개님//

네, 그만할게요.

그나저나 식 증명은 안해주실거 같네요.
  • 가방싸개님
  • (2017-04-21 18:28)
무슨 식 말이지요? 이미 노인 가설이 왜 시나리오1과 같은 가정인지 제글에 나온 걸 안보신 거 같네요. 선형성이 있으면, 노인가설이든 뭐든 시나리오1에 포함됩니다.
  • Talin님
  • (2017-04-21 19:13)
가방싸개님//

지난 글에서 못보신듯 하니, 위에 적으신 식으로 질문 드리겠습니다.

E[1/M2] = 1/(Mr(x))로 계산하셨죠? 저거 계산하실 때, 어떻게 하셨습니까? 설마 r에다가 괄호치고 그냥 변수만 쓰신건 아니겠죠?
  • 가방싸개님
  • (2017-04-21 19:20)
그 증명이 영어로 씌여서 못읽으신 거 같네요. 논문도 안보셨군요. 저기 증명이 나와 있으니 읽고 오세요. 그 부분이 제일 중요합니다. 그게 증명 안되면 논의가 안되지요. 논문에서 핵심이지요.
  • Talin님
  • (2017-04-21 19:28)
가방싸개님//

논문 6페이지죠?
논문에서는 저 r에 해당하는 값이 상수입니다. 논문 다시 보세요. 변수 x=나이 에 대한거 없습니다.
E[1/X] = 1/np 를 유도해 낼 때, p가 나이에 대한 종속성이 없고, 당연히 종속성이 없기 때문에 나이에 대한 적분항도 없습니다.
저 식이 성립할 수 있는 유일한 경우는 논문 식에서 p가 x에 대해 종속성이 없는 경우입니다.
즉, 나이에 대해 고려하지 않은 결과식으로 나이에 대한 효과를 억지로 넣어서 설명하시는겁니다.
어떻게 생각하시는지요?
  • 가방싸개님
  • (2017-04-21 19:33)
p가 x에 대해 종속항인 게 무슨 뜻이지요. 그건 저 p와 상관이 없지요. 저 p는 미분류표에서의 득표율이 아니라 각 후보별 미분류율입니다. 뭔가 개념을 혼동하시네요. 미분류율은 이미 나와있는 겁니다. 종속항이 아니라 그냥 대입하는 하는 상수지요. 다만 그 상수가 노인연령층 비율이라는 변수와 연관 될지 몰라서 r(x)로 쓴 거지요. 으렇다면 그 상수가 계산되는 분포가 후보별로 선형성이 있지 않는 이상 K값에 영향을 줄 수 없다는 게 논문의 내용이지요. 이건 선거결과를 가지고 선거가 이항분포인지 확인하는 작업일 뿐입니다. 선거에 미친 지지율은 사실 상관 없는 문제지요.
  • Talin님
  • (2017-04-21 19:37)
가방싸개님//

다시 말씀드리는데..... 노인가설에서 말하는건, 저 r이 나이에 대한 상수가 아니라는 겁니다.연령대별로 미분류율이 달라요.
Expectation value에서 그 부분이 들어가야죠. 지금 말씀하시는건, expectation value를 구하는데, 미분류율을 나이에따라 적용하지 않고 전체 인구에 일괄 적용하신거에요.
  • 가방싸개님
  • (2017-04-21 19:41)
다시한번 말씀드리지만 선거는 베르누이 시행입니다. 결국 득표율이 선거결과로 나온 후에 이항분포인지 조사하는 지표가 K값이구요. 각 후보의 득표율은 이미 나와 있는 거구요. 그게 상수로 결정된 뒤 선거가 베르누이 시행이었는지 조사하는 지표가 저 K값이지요. 만약 K값이 1에서 벗어나면 베르누이 시행이 아니었다는 뜻인 거지요.
  • Talin님
  • (2017-04-21 19:52)
가방싸개님//
지금 말씀하시는건... 기대값 계산할 때 연령대를 고려하지 않고 계산해도, 연령대에 대한 영향을 볼수 있다라고 얘기하시는거에요....
저 논리를 사용하시니 시나리오1에 포함된다고 하시는거고요.

저 그만하겠습니다.
  • 가방싸개님
  • (2017-04-21 20:15)
연령대는 K값 계산하는 데 고려 대상이 아니지요. 자꾸 개념을 혼동하시는데. K값은 선거결과를 보고 그 분포가 이항분포인지 조사하는 지표입니다. r값이 어떤 변수의 영향을 받아 그렇게 나왔는 지는 사실상 중요한 문제가 아니지요. 그건 사실 투표용지에 연령을 써 놓지 않는 이상 알 수 없는 거지요. K값에서 알 수 있는 사실은 선거가 베르누이 시행이었는 지 아닌 지만 알 수 있는 겁니다. 그래서 노인 가설이든 뭐든 후보자별 r값이 어떤 이유로든 선형성을 가지지 않는 이상 K값은 변할 수 없는 거지요.
  • 위유위님
  • (2017-04-25 09:00)
가방싸개님
w.ClienS
  • dacoon님
  • (2017-04-21 00:10)
예전에 글 쓰시자마자 읽어보았습니다. 저도 동의합니다.

그런데 논점 이탈이 어마어마어마해져서 노령층 가설은 꺼내지도 못해요.

논지를 최소화 시켜야해서, 노령층 가설 얘기는 한 마디도 안 하고 있습니다 ㅠ
  • 템페스트>님
  • (2017-04-21 00:14)
아... 오유에서 그 얘기 올리신 거 보고, 솔직히 놀랐습니다.
저는 그럴 용기가 없었거든요 (__);;;
  • 라임에이드님
  • (2017-04-21 00:26)
저는 반대로 당연하다고 말하는 사람들이 너무 많아서 일단 데이터를 보여주기로 했었죠...
  • dacoon님
  • (2017-04-21 00:31)
교수님들이나 김어준씨가 얼른 제 메일에 답장이나 해 주셨으면 좋겠습니다. 계속 읽씹하시네요;;
  • 라임에이드님
  • (2017-04-21 00:33)
교수 말고 그 정치학회인가 거긴 어떤가요.
  • Diki님
  • (2017-04-21 00:43)
포스터 하나 가지고 해당 학회에 물어본다고 답 들을 가능성은 없다고 보아도 좋아요. ;
  • dacoon님
  • (2017-04-21 01:06)
논문이 피어리뷰도 거치지 않은 것 같은데, 이거 의도적인거 아닙니까?
  • (2017-04-21 11:11)
dacoon님
저도 메일보냈는데 답장 안옵니다.
김어준씨가 반박하라고 말하더니만
정작 메일보내니까 피드백은 왜 안주는건지;;;
#CLiOS
  • 템페스트>님
  • (2017-04-21 12:03)
Queueue 님//

노인비율을 k값과 비교해서 상관성이 없으니 땡~!
...이라고 말하는 사람이 이해할 만큼 쉽게 써서 보내셨어야죠....;;;

자기 스스로 k값이 뭔지 이해 못하는데
메일이고 반박이고 무슨 소용이..... 에휴;;;;
  • cianx님
  • (2017-04-21 00:15)
저쪽 동네도 과학갤 vs 시사갤 붙었나 보네요ㅎㅎ

끌량은 이과생 사이튼 줄 알았는데, 걍 기기덕후 사이트였단ㅎㅎ
  • 템페스트>님
  • (2017-04-21 00:16)
저는 국문과 졸업생입니다만...;;;;; 흥!
  • 룰라런님
  • (2017-04-21 00:25)
어서 대선 끝나고 수개표좀 했으면 좋겠어요. 세월호 자로 음모론때처럼 다들 언제그랬냐는듯이 버로우하겠죠
  • 마봉길님
  • (2017-04-21 16:28)
다가오는 사태(?)에 대비하여
'보관중인 표에 대한 작업(!)이 이미 끝나서 저런다'라는
정신승리용 마음의 준비를 하고 있는 분들이 수두룩 합니다.

전 이미 포기하고 마음의 평화나 찾으려고 합니다...
  • 현량님
  • (2017-04-21 00:37)
덧글로도 달았었는데 그거 생각나네요.

사람들한테 동전을 10번 던진 결과를 예측하라고 하면 거의 1:1 비율로 예측하지만 실제론 치우친 결과가 자연적으로 발생할 수 있다는 내용이었죠.

뉴턴 하이라이트 확률관련 편에서 읽었던 것 같아요.
  • 템페스트>님
  • (2017-04-21 00:40)
저는 이번에 그런 생각이 들었습니다.
로또 번호가 1,2,3,4,5,6 여섯개 나오면 폭동이라도 일어날 것 같다고...
  • Diki님
  • (2017-04-21 00:41)
하지만 10번이 아니라 천번, 만번에 가까울 수록 실제 값에 가까울 것이라는 또한 통계의 법칙 중 하나이죠.
  • 현량님
  • (2017-04-21 00:53)
그렇죠. 큰수의 법칙이 존재하니까..ㅎㅎ
  • 고약상자님
  • (2017-04-21 01:06)
동전을 천 만번 던졌는데 한쪽 면이 1.5배 더 많이 나올 확률은 얼마나 될까요? 아무리 생각해도 0에 수렴할 것 같은데요? 진심 궁금하네요.
  • 라임에이드님
  • (2017-04-21 01:10)
그냥 동전이나 던지는 방법이 원래 1.5배 더 나올 가능성이 매우 높죠.
  • Likesoft님
  • (2017-04-21 01:20)
고약상자님//
그거는 당연하게도 동전이 양면이 동일하게 생겼다고 가정할 때 인데, 지금 이 경우는 양면이 동일하게 생겼다는걸 당연하다고 가정해야할 이유가 없고, 그걸 당연하다고 가정했다면 왜 당연한건지 그것에 대해서 증명을 해라 라고 말하는겁니다. (당연하다고 가정하고 썼으니 당연하다고 가정한 사람이 왜 당연한건지를 증명하는건 당연한거죠;;;)

즉, 애초에 동전의 양면이 같은 모양인지 아닌지 모르는 상황이라는겁니다(결과만 놓고봤을때는 같은모양이 아닐것이라고 추정하는게 더 나은 방향이라는 거고요)
  • 어부바님
  • (2017-04-21 06:19)
Likesoft님// 음. 그건 아닌것 같습니다.

정상이라면 동전을 던지면 던질수록 대수의 법칙에 의해 5:5로 나와야 한다. 는 누구나 알고 있는 상식 아닌가요?

그런데 실제 던진 결과값을 보니 7:3이 된거죠.

그러면 이 상황은 비정상적이고 그 이유는 여러가지가 있을 수 있겠지만
만약 동전 한쪽을 20%정도 무겁게 만든다면? 이라는 의문을 갖고
실제 그런 동전을 만들어서 던져 보았더니 7:3이 되더라.

이런것 아닌가 합니다.

물론 던지는 방법이나 던지는 사람, 혹은 날씨, 기압등등 많은 가정이 있을 수 있을거고요.

그리고 이 동전 얘기로 한정해서 본다면 정상이라면 동전을 던지면 던질수록 대수의 법칙에 의해 5:5로 나와야 한다. 로 전제 했을때 이것을 먼저 증명하라고 하는것은 어깃장 같습니다.

그리고 더플랜에 대해서 굳이 얘기한다면 그냥 1.5가 나오는게 그런 분류기 조작 말고 다른 원인이 있을 수 있는거니 반드시 조작이라고 볼 수는 없는것 아닌가? 하는 의문이 드는건 당연한것 같습니다. 그래서 저는 더플랜이 조작을 증명한 영화가 아니라고 생각합니다.

물론 1.5가 나왔으니 조작이 자명하다. 라고 이해하는 사람도 있겠죠.
또 김어준의 의도가 그렇게 느껴지도록 영상을 제작한 경향도 일부 보이는것도 사실이고요.

그러나 실제로 그 캐나다 교수 역시 많은 가정을 할 수 있지만 하나의 가설로 분류기의 SW를 조작해보면 이라는 하나의 시나리오로 소개한다. 고 했고요.
저는 영화의 핵심적 메시지는 명확하게 "개표방식을 개선해야 한다"일 뿐이라고 라고 생각합니다.


ps. 그런데 혹시 동전 양면의 모양이 다르면 5:5가 아닌가요? 그러면 전세계의 모든 실제 화폐 동전은 아무리 대수의법칙을 따라도 5:5는 불가능하다고 봐야 하는거에요?
  • 어부바님
  • (2017-04-21 06:53)
ㅇㅇㅇㅇ님// 저는 글쓴 분 주장에 대해 한마디도 하지 않았어요. 저에게 그런말씀을 하실 이유는 없어요.

저는 동전에 국한해서 얘기한거예요.

그래도 저에게 댓글을 달아 주셨으니 한마디 해보자면
충분히 가질 수 있는 생각이라고 봅니다.
서로 물어뜯을 필요가 없는 일인데 간혹 날카롭게 반응 하시는 분들이 계셔서 안타까울 뿐입니다.

그리고 "모양"과 "무게"는 달라서 ps를 단것이고요.

+ 댓글 달고 보니 댓글이 삭제 되었네요. 이름만 가려두겠습니다.
  • Likesoft님
  • (2017-04-21 11:08)
어부바님//
수학적으로 이미 정의해버린, 즉 정해져있는게 아니라면 증명을 위한 어떤 가정을 가져다 쓸 때는 왜 그런 가정이 성립하는지를 이야기해야죠.
양면이 동일하게 만들어진 동전을 던졌을 때 양쪽이 나타나는 비율이 동일해야한다는 것은 우리가 흔히들 알고있지만 그걸 그대로 쓰면 안될일이죠. 왜 그런지를 밝혀야함이 당연한거고요.

게다가 박에 기표한 집단과 문에 기표한 집단이 미분류표를 만들어낼 확률이 동일하다고 가정하고 있는데, 동전과는 달리 그나마 있을 수 있는 직관적인 판단조차도 하기 어려운 상황인데, 그걸 그냥 동일하다고 가정하는 것을 "자명하다"는 식으로 넘어간거죠. 그걸 현실에 적용하기 위한 가정에 대한 검증을 하지 않았습니다.

비교를 동전에다 한지라 그런건데, 동전이 아니라 양면을 가진 어떤 모양을 모르는 물체를 던진다고 가정해보죠. 이 물체를 던졌을 때 어떤 한 면이 나올 확률의 모집단의 평균은 모릅니다. 그런데 던져놓고 보니 한쪽면이 1.5배 더 많이 나왔어요. 지금 더 플랜의 주장은 이 때, 양면이 나올 확률이 동일해야함은 자명하니까 한쪽면이 1.5배 더 많이 나온건 무언가 조작된 것이다! 라고 주장하는 상황인겁니다. 애초에 양쪽이 동일하게 나와야 하는지 조차 알 수 없는 상태인데, 그 양쪽이 나올 확률이 동일한게 자명하다고 주장하면서 나머지를 논리를 끌고나가서 나오는 결론이 조작이다 라는겁니다.

간단하게, 더 플랜에서 인용한 논문은 위의 두 집단의 미분류표를 만들확률이 동일할 때만 유의미한 결과를 갖는 겁니다(즉 현실의 수 많은 현상 중에서 두 집단의 미분류표를 만들확률이 동일할 때만 유의미함). 근데, 현실에서는 두 집단의 미분류표를 만들확률이 동일한지 아닌지 알 수가 없기에, 위의 논문의 결과를 현실에 적용하려면 두 집단의 미분류표를 만들확률이 동일하다는 증명을 먼저 해야한다는겁니다.

근데, 김어준은 지금 그 증명을 너네가 해라 라고 하고있는거고요. 이건 주장하는 사람이 해야함이 자명한건데요. 그렇기에 신이 없음을 증명할 증거가 없으니 신은 존재한다고 주장하는 꼴이라는겁니다. 미분류표를 만들확률이 다름을 증명할 증거가 없으니 미분류표를 만들 확률은 동일하다 라고 말하는거죠. 이건, 말도안되는 억지죠.

그리고 PS에 대해서 저는, 동전의 양면의 모양새가 약간이라도 다르면 무게의 배분이 약간이라도 차이가 날 테고, 그 때문에 자유낙하를 한다면 자연스럽게 회전하면서 어느한쪽이 나올 확률이 더 높아질 수 있다고 생각합니다만... 실제 현실에서는 그걸 무시할만 한 수준이라고 보고 양쪽의 확률을 같다고 이야기하는거겠죠. 수학적으로 이야기하자면, 동전 양면의 무게는 같으며 바람의 영향은 없다고 가정한다. 정도로 언제나 처리하고 있는것일테고요. 현실에 존재하는 대부분의 주화는 애초에 모집단의 평균이 1/2가 아닐 수도 있죠.
  • (2017-04-21 11:15)
Likesoft님
어부바님은 가설 입증책임이 누구에게 있는가에 대한 기존 통설을 완전히 부정하고 계세요.
통계에서는 누구나 알고있는 상식같은건 없습니다. 수학적으로 증명이 되어야 전제로 이용가능하죠
#CLiOS
  • 어부바님
  • (2017-04-21 11:49)
동전얘기 한참 하시길래 "동전얘기로 한정해 본다면" 이라고 해놨는데도 다른 얘기도 한참 하시는군요.

"양면이 동일하게 만들어진 동전을 던졌을 때 양쪽이 나타나는 비율이 동일해야한다는 것은 우리가 흔히들 알고있지만 그걸 그대로 쓰면 안될일이죠. 왜 그런지를 밝혀야함이 당연한거고요."

무슨 말씀인줄 알겠습니다. 님의 생각을 동의하는건 아니지만 존중합니다. 저는 어차피 더플랜의 메시지만 이해하면 된다고 보는 입장이라서 굳이 더이상 논쟁하고 싶지 않습니다. 그럼 오늘 하루 잘 보내시기 바랍니다.
  • Likesoft님
  • (2017-04-21 12:26)
어부바님//
애초에 양면이 동일하게 생긴 동전인지도 알 수 없는상황입니다. 이걸 이해 못하시면 이야기가 진행이 안되죠.

양면이 동일한 동전이라는 가정자체가 이 건에서는 무의미해요. 전 처음부터 양면이 동일한 동전인지도 알 수 없다고 써놨습니다. 어떤걸 읽고 오셨길래 동전을 던지면 5:5가 나옴이 자명하다고 생각하신건지요?
  • 어부바님
  • (2017-04-21 12:41)
Likesoft님// 네. 의견 존중합니다. 다만 동의는 못합니다. 그러니 저도 이야기를 진행 못하겠네요. 그럼 이만.
  • 빅장님
  • (2017-04-21 00:51)
지금쯤이면 알아먹을 사람들은 다 알아들었을 것이고.
아직까지 못알아들은 사람들은 끝까지 못알아들을겁니다.
포기하면 편해요. ㅋ
  • dacoon님
  • (2017-04-21 01:07)
이번 주말까지만 해보고 안되면 포기!
  • 빅장님
  • (2017-04-21 01:10)
한가지 바램은 열정을 갖고 설득을 하시다 게시판 등에서 지속적으로 모욕적인 언사를 듣고 흑화하여 반대 진영으로 가시는 분들을 몇번 보았습니다.
그러지는 말았으면 좋겠습니다...
  • dacoon님
  • (2017-04-21 01:13)
그럴 가능성은 E(k) = 1일 확률입니다 ㅎㅎ
  • Likesoft님
  • (2017-04-21 01:17)
어느 다른분이 제기하셨던 이야기인데,
k값이 1.5가 된 큰 이유가 유효표 인정기준이 변경된 것에 있다는 이야기였습니다...

지난대선에서는 투표용지의 해당 후보의 선 어느 한쪽에라도 기표가 되어있기만 하면 유효표로 인정했다고 하더군요. 그리고 후보자 명단이 표로 되어있었으나 모두 붙어있었고요.
지난대선에서 박근혜 후보는 기호1번이었고 문재인 후보는 기호2번이었는데, 1번인 박후보는 좌, 상, 우 3곳에서 유효표로 인정받을 수 있는 위치가 있었고, 문후보는 상하가 타 후보랑 접해있으므로 무조건 무효표가 되고, 좌 우만 유효표로 인정받을 수 있는 상황이었다고 합니다.

미분류표로 분류되었던 것 중 유효표로 인정받을 확률이 높죠...
  • 라임에이드님
  • (2017-04-21 01:22)
해당 논문에서 전국적으로 같은 분포인데 K=1.5가 나오는 경우는 잘 안맞는다고 배제합니다.
http://www.clien.net/cs2/bbs/board.php?bo_table=park&wr_id=54709097

분석에 문제가 없다고 본다면 약간의 영향은 있을 수 있어도 1.5를 다 설명하지는 않는다고 볼 수 있지요.
  • 템페스트>님
  • (2017-04-21 01:32)
사실 그냥 이름 옆의 네모칸이 아니라
근혜공주님 이름 보고 감격한(웩~) 박사모가
반가운 마음에 박근혜 이름 위에다가 도장 찍어도
미분류 갔다가 유효표로 돌아옵니다

후보 이름이나 기표 부분이 아니라면
조금 찢어지거나, 아예 일부가 찢겨 떨어져 나가도
누구한테 투표했는지 확실하기만 하면
미분류 갔다가 유효표로 돌아오죠.

그런 케이스들까지 포함하면
선 겹침 외에도 온갖 변수가 있었다고 생각할 수 있습니다

다만, 제가 노인가설이 가능성이 높다고 생각하는 건
17대에서는 연령별 지지율 차이가 크지 않다보니
17대 K가 1.0에 가깝고 (3곳)
18대 K는 1.5가 되는 차이를 설명할 수 있기 때문입니다
  • (2017-04-21 01:33)
저도 이게 젤 신빙성 있어 보이더라구요. 일단 전제 자체가 모호한 상황에서 전제, 즉 if를 사실로 가정하고 결과가 이상하다 해버리니...
  • 눈먼레몬님
  • (2017-04-21 01:57)
제가 모공에 그 글 퍼왔다가 알바라는 비아냥 엄청 들었네요...

제가 이해한 바가 맞으면 동전의 앞뒷면과는 달리,
박근혜를 찍은 집단과 문재인을 찍은 집단이 완벽하게 같지 않고,
용지 가설 등 그 외에도 변수가 있으니
E(k)=1이라는 보장이 없다는 건데,
김어준씨 가설의 문제점은 E(k)=1을 전제로 한다는 점이군요..

솔직히 저는 이 분야에 대해서 잘 모르니 뭐가 맞는지는 잘 모르겠지만,
과학의 문제에 정치의 논리를 대입하니 건설적인 토론이 이루어지지 않는건 분명해 보입니다.
  • 어부바님
  • (2017-04-21 06:28)
Likesoft님// 이 가정이 맞다면(혹은 영향을 준다면) 지난 대선의 투표용지 인정 기준을 그렇게 한것은 결과에 대한 의도가 있다고 생각할 수 있다.

라고 볼 수도 있겠네요.
  • Talin님
  • (2017-04-21 16:51)
Likesoft님//
용지가설은... 미분류율이 전국적으로 차이나게 만드는 요인이며, 이건 더플랜에서 언급한 시나리오1에 해당됩니다. 그런데, 이로 인한 가능성은 논문상에서 기각되었죠.
  • 켈로그님
  • (2017-04-21 01:32)
그럴싸하게 말하지만 별로 납득되진 않네요.동일
환경과 조건에서  1번 기표군과 2번기표군이 유의미할 정도의 차이로 미분류를 발생시킬 이유가 없어 보이네요. 당연히 랜덤이어야  맞을것이고.. 노인지지층이 많아 미분류를 많이 발생시켰다는 주장도 말이 안되는게 인주가 덜 선명하게 찍혔거나 조금만 선에 물려도 개표기가 인식을 제대로 하지 못했다는 이야기니까 개표기의 신뢰성에 의문이 들 수 밖에 없고 역대투표 모두 , 또한 이번 대선 역시 보수와 진보 세대간의 대결양상이니 K값은 1.5에 수렴한 결과가 나와야 된다는 뜻이니까요. 별로 그럴것 같진 않네요
  • Likesoft님
  • (2017-04-21 01:37)
"1번 기표군과 2번기표군이 유의미할 정도의 차이로 미분류를 발생시킬 이유가 없어 보이네요. 당연히 랜덤이어야  맞을것이고" 라고 가정을 했으니, 그 가정이 맞다는 것을 증명하라는겁니다...

결국 논문의 내용은 말씀하신 "가정"하에서만 성립하는데, 실제로 현실에서는 그 가정을 적용할 수 있는것이 자명하냐 라는 것을 증명해놓으라는겁니다. 자명하다고 주장하면 자명한게 되는게 아니니까요.

자명하지 않은 이유를 발견하지 못했으니 자명하다... 라는 결론은 신이 존재하지 않는 증거가 없으니 신은 존재한다 라는 것과 다름이 없다는 이야기가 되는거죠.
  • 템페스트>님
  • (2017-04-21 01:39)
인주가 덜 선명하게 찍힌 것이나 선에 걸친 걸
유효표로 분류해 버리면 나중에 시비의 사유가 되므로
미분류 후 각 당 참관인의 확인 하에 분류합니다

분류기(개표기가 아님)의 신뢰성 문제가 아니라
그렇게 하라고 정한 겁니다 그건.

이름 위에다 도장을 찍은 것도 그렇고
찢어진 것도 그렇고
도장을 두번 찍어도
칸 밖에 도장을 잘 나오는지 괜히 한 번 더 찍은것도

전부 미분류로 나오는 표들이고
각 당 참관인들 합의 하에 우효표로 분류합니다
그 과정에서도 탈락한 게 무효표구요.
  • 최태석님
  • (2017-04-21 09:16)
오래 눌러서 번져도 미분류로 간다고 합니다. 근데 어르신들이 확실하게 찍고 싶으셔서 꽤나 오랫동안 누르시는 경향이 있다네요.

https://www.facebook.com/HeavyMetalMorning/posts/1181683818531897?hc_location=ufi
  • 그냥그런이님
  • (2017-04-21 19:17)
최태석님//ㅋㅋㅋㅋㅋ 웃기는 소리네요. 그럼 왜 18대에서만 3프로인가요
  • 최태석님
  • (2017-04-22 08:19)
그냥그런이님// 저 페북 포스팅 제대로 안 보셨죠? 비분류율이 더 높게 나온 지난 총선때 일입니다. 지난 총선도 부정선거였을 수는 있겠네요.
  • 명지바람님
  • (2017-04-21 01:39)
지역별, 지지율별, 미분류발생별, 노령인구별, K값 등을 나누어서 여러 데이터를 회귀분석했을때 서울 강남구와 같은 독특한 데이터를 제거했을 때 전체적으로 결론은 노령인구, 미분류, ㅂㄱㅎ 지지율 등이 밀접하고 K값은 서로 연관된 것을 아직 찾지 못하고 있습니다.

즉 님의 의견처럼 기계오류, 지지자들의 특성 등의 요인으로 k값이 상승했다고 보고 사람이 개입한 흔적을 찾고자 하였지만 보지 못했다는 것입니다.

각 데이터는 기존 제 게시글을 보시기 바랍니다. 서울지역의 이상한 점이 발견 되었지만 강남구 때문에 나온 것이고요.
  • 라임에이드님
  • (2017-04-21 01:43)
거의 다 오셨는데, 노인 vs (박-문 득표) 한번 보시고, 대구경북/광주전라남북/기타를 나누어 해석해도 K값 분포가 유사하게 나타나는지, 그렇지 않다면 이유가 뭐겠는지 생각해보세요.
  • 명지바람님
  • (2017-04-21 02:03)
라임에이드님//
거의 다 오긴 온 것으로 보입니다.
호남과 영남 지역 차이는 이미 투표자 성향이 명백하여 다른 것을 인정하고요.

다른 요인을 찾고자 하는데 예외경우를 빼고 특별한 것, 이상징후는 못봤고요.

금주까지 찾아보고자 합니다.
  • 라임에이드님
  • (2017-04-21 02:10)
제 개인적으로는 (노인-미분류) 회귀식 * 지역별 연령별 출구조사 = 해서 나온 결과에 설득이 된 상태인데, 사람마다 어떤 것을 믿을 것이냐는 다를 수밖에 없겠죠. 더 정확한 결론 내리시길 기대합니다.
  • (2017-04-21 01:41)
K값이 1이 나오려면 이론적으로 1번 후보의 모집단과 2번 후보의 모집단이 완벽하게 동질의 성격을 가진 집단이어야 하는데, 이 경우 1번 집단이 2번 집단에 비해 과도하게 띨띨하면 K값이 차이가 날수도 있습니다. 특히 기표 용지상의 위치도 다르고 하니...저는 K값이 다를수도 있다고 생각합니다. 그리고 이미 국정원 개입만으로도 부정선거가 확실한데 머하러 이런 논란을 일으키는지도 모르겠어요. 이게 오히려 기존의 국정원 개입 부정을 오히려 희석시킬까봐 겁납니다.
  • 빅장님
  • (2017-04-21 02:10)
2번 집단이 과도하게 띨띨한게 맞다는 강력한 증거가 아닐까 생각합니다. ㅋ
  • dacoon님
  • (2017-04-21 02:17)
ㅋㅋㅋㅋㅋㅋㅋ 맞아요 박근혜 지지자들이 과도하게 띨띨하다는걸 데이터가 말하고 있는거에요
  • 빅장님
  • (2017-04-21 02:26)
노파심에 한마디 첨언하자면 한국은 매우 보수적인 국가입니다.
보수쪽이 개또라이짓을 하는 것도 자기들 표만 잘 모으면 되니 그런 짓을 하는거라고 생각합니다.
하지만 진보쪽은 중간의 부동층과 살짝 보수쪽 사람까지 끌어모아야 겨우 당선이 가능합니다.

고로 저쪽 사람들을 또라이 취급하는 것은 가급적 자제해야합니다.
감정적으로 척을 지면 절대 안됩니다.

ps. 제가 지금 2번 집단이 띨띨하다고 한것은 알콜과 클리앙이라는 커뮤니티에 2번 집단에 소속해있는 사람이 거의 없을거라는 개인적인 믿음으로 쓴겁니다. ㅋ
  • 템페스트>님
  • (2017-04-21 02:34)
어휴... 저는 이제부터 진짜 헬게이트가 열릴 거라 생각해요.

더 플랜에서는 결국 , 해킹이 가능하다고 주장했죠
심지어 해커 한 명이 조작해도 된다고 정성스레 포장해서.
검표원들이나 각 당 인원들 따위, 다 속일 수 있다고.

...

이제 '모든' 선거에서
해킹에 의한 조작을 주장할 수 있게 된 거예요....

당장 19대 대선부터....
선거 때마다 K값 따져가며... 하...;;
  • 빅장님
  • (2017-04-21 02:38)
문재인님이 당선되도 동일한 논리로 조작을 주장할 수 있게되죠.
그러려니 할 뿐...
  • wijw1님
  • (2017-04-21 06:49)
"특정 집단이 통계적으로 미분류 유효표를 만드는 비율이 높다"에서 특정 집단이 띨띨하거나, 수준이 떨어진다는 결과를 낼 필요는 없는거 같습니다.

미분류 유효표를 만든 사람도 일단 유효투표를 한건데, 조금 애매하게 기표된것일 뿐입니다.

이런 이야기하면 그분들이 몰려와서 "노인네들이 투표도 못할거 같냐?, 노인네 비하하지 마라"라고 뜬금없이 노인 비하를 하시거든요. (노인네라는 단어가 노인을 낮추어 부르는 말이긴 하지만, 그분들이 하신 행태를 드러내고자 그대로 인용했습니다.)

뭐 빅장님 뒷 댓글을 보면 농담으로 한걸 알겠지만, 진심으로 받아들이는 사람도 있을테니 적습니다.
  • 마봉길님
  • (2017-04-21 16:45)
템페스트>님 //
+1 저도 그게 가장 안타깝고, 그래서 더욱 분통이 터지더군요.
이 황당하고 질 떨어지는 음모론 지지자들은 그들이 무슨짓을 했는지 도무지 깨닫지 못하고 있어요.
정말 안타까운 일입니다.
  • 템페스트>님
  • (2017-04-21 16:48)
마봉길님//
선관위가 말하는 '사회적 책임을 무겁게 느껴야 할 것' 이라는 발언도 그런 의미에서, 상당히 절제했으면서도 굉장히 엄숙한 말인데... 그걸 그냥 협박입네 하며 낄낄거리는 거 보면, 약으로 내린 혈압이....;;;
  • 최태석님
  • (2017-04-21 16:53)
템페스트>님, 마봉길님// +1

부정선거 주장은 일방의 특권이라고 생각하나 봐요.
  • wijw1님
  • (2017-04-21 06:17)
차라리 통계적 무지면 다행일거 같아요.

통계학 박사라는 사람이 저러는거 보면 결론을 세워놓고 연구하는 습관이라도 있나 봅니다.

조작이 없다고 결론내도 새로운 개표결과 검증 방법을 제시한 의의라도 있을텐데...
  • wijw1님
  • (2017-04-21 06:35)
어떤 부분에서 논문이 문제가 있다고 생각했냐하면,

만약 후보자별로 미분류 발생비율이 다르게 나타난다면, 미분류 발생비율에 대해 여러 요인과 회귀분석을 하여 결론을 내고, 그중 어떤 요소가 영향을 많이 주는지 밝히는것이 정상적인 연구 방법일텐데,

왜 그 비율을 취해서 1이라고 가정하고 들어가는지도 이해가 안되고, 그 비율을 취함으로서 다른 요인들의 영향을 검증하기 힘들어진다는 걸 모를 사람들도 아닌데 (논문 저자를 대상으로 하는 이야기입니다) 잘 이해가 안됩니다.

각 지역구 전체의 특성값은 (연령분포, 남녀분포, 학력분포, 소득분포 등)은 쉽게 알 수 있지만, 각 후보자 득표 내부의 분포는 알 방법이 없죠. 비밀투표이니까요.
  • wijw1님
  • (2017-04-21 06:42)
그나저나 다들 하고 싶었던 이야기를 잘 정리해주신거 같아서 고맙습니다.

입증책임과 반증가능성에 대해 글을 써야 하나 고민하던 참인데 저렇게 이해하기 쉽게 글을 쓰는 능력이 부럽군요.
  • (2017-04-21 07:47)
intuitively에서 어처구니가 없었습니다
  • 4동107호님
  • (2017-04-21 09:27)
if valid ballots are unclassified at random 이 부분을 잘못 이해하고 계신 거 같아요. 이건 이 논문에서만 사용되는 가정을 밝힌 부분이 아니라, 당연한 사실을 쓰고 있는 부분이에요. 이과에서는 공리라고 하던가요. 저자가 which is fairf라고 첨언한 걸 봐도 이를 알 수 있죠.
만약 이 논문이 'if valid ballots are unclassified at random'을 특수한 가정으로 전제하였다면 절대 이런 식으로 간단히 언급하고 넘어가지 않을 거에요. 이 가정이 왜 중요한지, 왜 현실을 잘 설명하는지에 대해 충분하게 설명하고 다음 논의로 넘어갔을 거에요.
---------------------------------
링크보고 댓글에서 저랑 같은 생각을 하는 분이 계서서 복붙하는데요
'if valid ballots are unclassified at random'이라는 것은 댓글쓰신분의 논지와 같이 특수가정이 아니라 일반가정아닌가요? 예를 들어 '사람은 모두 죽는다'라고 전제한건데, '사람은 왜 꼭 모두 죽어야하죠? 오래 사는 사람도 있지 않나요?'라는 특수가정 상황으로 이해하고 계시는건 아닌지요?
  • 최태석님
  • (2017-04-21 09:31)
기계가 미분류하는 기준이 있고 기준에 해당되는 기표를 하는 이유가 여럿 있을 건데 그걸 "그냥 원래 랜덤이다" 라고 할 수가 없죠.

이미 나온 통계에서도 그게 원래 랜덤이면 선거구별 연령층 분포와 미분류 발생 비율이 상관관계를 가질 이유가 없죠.
  • wijw1님
  • (2017-04-21 09:36)
만약 유효표의 미분류율이 기기에서 발생해서, 균등하게 나타난다면 각 선거구에서 유효표의 미분류 비율이 균등하게 나와야 합니다.

근데 문제는 이게 통계적으로 반박되었다는 겁니다. (노령인구율과 통계학적 상관관계가 존재함)

직관을 통계로 반박했더니 아무튼 직관이 옳아.. 이런 식의 논리는 설득력이 전혀 없습니다.
  • 4동107호님
  • (2017-04-21 10:02)
제가 논리적으로 교수 수준으로 설명할 수 있거나, 통계학을 잘 아는건 아니라서 저도 찾아보았는데요.

http://www.clien.net/cs2/bbs/board.php?bo_table=park&wr_id=54702285

여기 댓글중에 "Raynor님"의 댓글과 같은 생각이라서요.
--------------------------------------------------------------------------
valid ballot 이 unclassified 될 비율입니다.
invalid ballot 이 unclassified 될 비율이 아니고요.
--------------------------------------------------------------------------
"if valid ballots are unclassified at random"이라는 가정은 당연하다고 생각됩니다만;;;
  • wijw1님
  • (2017-04-21 10:08)
너무 희미하거나, 진하게 기표되거나, 선에 걸친 vaild ballot은 미분류될 확률이 1에 가깝고요.
위의 조건에 해당하지 않는 vaild ballot은 미분류될 확률이 0에 가깝습니다.

기표기 스펙대로면 위와 같은 비율로 미분류될겁니다.
  • wijw1님
  • (2017-04-21 10:13)
그리고 주장하는 쪽에서 입증하는건 당연한겁니다. 직관적으로 당연하다고 하더라도, 그 설명을 요구하면 설명을 해 줘야해요.

"사람은 모두 죽는다"라는 주장에 대해 "오래 사는 사람도 있지 않나요?"라는 반론을 하면,
주장하는 측은 그 반론에 대해 반증하거나, 주장을 입증할 수 있을겁니다.

예를 들어 경험적으로 사람이 200세 이전에 죽는다는 관찰 결과를 통해 반론을 반증하거나,
텔로미어 이야기를 하면서 주장을 설명해야죠.

"사람이 죽는건 당연한거 아니냐?" 이건 학술적 태도가 아닙니다.
  • 4동107호님
  • (2017-04-21 10:16)
wijw1님 // 균등이아니라 "유사값으로 수렴 혹은 근사치로 나와야 한다"이게 맞지 않을까요?
  • wijw1님
  • (2017-04-21 10:18)
균등한 확률로 발생, 다른 요소에 영향을 받지 않음 정도로 해두죠.
  • wijw1님
  • (2017-04-21 10:18)
너무 희미하거나, 진하게 기표되거나, 선에 걸친 vaild ballot은 미분류될 확률이 1에 가깝고요.
위의 조건에 해당하지 않는 vaild ballot은 미분류될 확률이 0에 가깝습니다.

그나저나 이 부분은 어떻게 생각하시나요?
  • 4동107호님
  • (2017-04-21 10:27)
제 수준에서 설명하려고 가정을 적은건데 "사람이 죽는건 당연한거 아니냐?"라는 식의 내용이 의미가  아니라 "사람의 수명은 유한하다"라는 일종의 "학술적" 가정을 이야기 하는 것입니다.

K값의 유의미/무의미가 "학술적"으로 문제가 있다면, 문제인식을 가진 누군가가 반박하는 논문을 발표하거나 "더 플랜"에 준하는 수준의 분석을 통해서 논리적 반박이 이뤄지면 좋겠네요.
결국 이번 대선의 결과가 "K" 값 논쟁을 검증하는데 유의미한 자료가 되어서, 앞으로는 "부정선거"라는 이슈는 아예 없었으면 좋겠다는 생각입니다.
  • wijw1님
  • (2017-04-21 10:29)
링크글과 같은 흐름이 되는군요.

더 논해서 얻을 실익이 없는거 같으니 여기까지 하겠습니다.
  • 4동107호님
  • (2017-04-21 10:32)
너무 희미하거나, 진하게 기표되거나, 선에 걸친 vaild ballot은 미분류될 확률이 1에 가깝고요.
위의 조건에 해당하지 않는 vaild ballot은 미분류될 확률이 0에 가깝습니다.

그나저나 이 부분은 어떻게 생각하시나요?
---------------------------------------------------------------------------------------------------------------------------
이건 어떠한 결론을 염두에 두고 가정하신 다음에 질문을 하시는 것 같은데요. 
무엇을 질문하시는 건지 모르겠네요.
  • wijw1님
  • (2017-04-21 10:34)
valid ballot 이 unclassified 될 비율이 균등하지 않다는 이야기입니다.
  • 4동107호님
  • (2017-04-21 10:43)
너무 희미하거나, 진하게 기표되거나, 선에 걸친 vaild ballot은 당연히 미분류로 될 것이라고 이해가 됩니다만, 위의 조건에 해당하지 않는 valid ballot은 어떤 경우를 말씀하시는 건가요?
  • 템페스트>님
  • (2017-04-21 11:16)
4동107호님//

선관위 오피셜입니다.
http://www.wikitree.co.kr/main/news_view.php?id=99167

저 기사에서 [유효투표 예시] 들이 모두
미분류표가 되었다가, 다시 재분류되어 [유효표]가 되는 경우입니다.
  • Likesoft님
  • (2017-04-21 11:28)
4동107호님//
일단 미분류표가 되는 조건이 있는 상황이니, 박 기표집단과 문 기표집단이 동일하게 '유효한' 미분류표를 랜덤하게 만들어낸다고 가정하려면 해당 조건을 만족해서 유효한 미분류표를 만들어낼 확률이 두 집단에서 정말 동일한가(즉, 유효한 미분류표가 될 기표를 할 확률이 동일한가) 부터 증명을 해야 이 논문은 실제 현상에 적용이 가능하죠.
  • SMGR님
  • (2017-04-21 09:47)
음모론은 종교의 영역이라 이렇게까지 설명해도 못알아듣는 사람들은 많을겁니다.
  • 마봉길님
  • (2017-04-21 16:49)
+1
  • cokagguala님
  • (2017-04-21 12:14)
정작 모공에선..
  • 이래저래어렵님
  • (2017-04-21 13:20)
링크 글을 보다 보니

투표를 정확하게 하는 사람이  97%라고 박수치자는 부분이 인상깊습니다

문맹률이 1%미만인 나라이고
겨우 도장찍는 간단한 투표행위에다가
덮어놓고 1번찍는 사람들에게
그렇게 많은 실수가 나올 것이라고 생각하는게
더 이해하기 어렵네요
  • 템페스트>님
  • (2017-04-21 13:28)
거꾸로 생각해 보지요.

http://www.wikitree.co.kr/main/news_view.php?id=99167

저 기사에서 예시를 든 표들은 모두 [미분류표] 가 됩니다.
그리고 그 미분류표들 중에서 위에쪽은 [미분류표->유효표]
아래쪽은 [미분류표->무효표]가 되지요.

예시에 나온 표들을 '더 많이 만드는' 건 어느 쪽일까요?

*저런식으로 도장 찍는 바보짓을 하는 사람이 있을까 싶지요?
문맹률은 1% 미만인 것도 맞는데요...
70 대 이상에서 비문해율 - 문장을 이해하지 못하는 사람이 20%가 넘습니다.

비문해자라 함은,
[지지하는 후보 이름 옆 네모칸 안에 도장을 살짝 찍으세요] 라는 문장을 이해하지 못한다는 뜻입니다.
  • 이래저래어렵님
  • (2017-04-21 13:48)
위키에 나와있는 예시가 다양하다고 해서
3%가 넘는 미분류표의 숫자로 단정지을 수 없다고 생각합니다
사람과 대면하는 일이 많은 직업인데요
기상천외한 실수등을 많이 봅니다
하지만 그 다양한 사례가 그렇게 많이 겹치지는 않습니다
그냥 각각의 사고사례이긴 한데
3%가 넘는 사고가 일어나지 않을 것 같습니다

그리고 덮어놓고 2번찍는 동네에서는
k값이 0.7에 수렴하는 예도 많아야
하는 것 아닌가 싶습니다
  • 템페스트>님
  • (2017-04-21 13:51)
이래저래어렵님 /

덮어놓고 2를 찍는 동네의 모델 만들어서 한번 계산해 보세요.

1) 노인이 단 1%라도 더 박을 지지한다
2) 노인이 단 1%라도 무효표를 더 만들어낸다

두 개를 전제로 놓고서는 무슨 수를 써도 K>1 이 됩니다.

노인층에서 박2:문8 을 지지하고, 젊은층에서 박1:문9를 지지해도 K>1 이죠.
  • 템페스트>님
  • (2017-04-21 14:02)
이래저래어렵님 /

그리고 미분류율 3%가 일어나지 않을 것 같다 생각하신다구요.
 
[더 플랜]에서 17대 대선 3개 지역구랑 비교하면서
그 때는 K가 1에 가까웠다고 얘기하죠?
 
그 3개 지역구 중 하나인 용인시 수지구 꺼 열어보니 미분류율 4.6% 네요.
자, 그럼 17대 대선도 조작인걸까요? K=1.02 인데?

17대 대선이 조작이 아니라며 18대 대선의 대조군으로 사용하려면
1) 미분류율 4.6%도 정상수치로 보거나
2) K가 1에 가까워야 한다는 전제를 포기하거나
둘 중에 하나는 해야 하는 거 아닌가요?
  • 이래저래어렵님
  • (2017-04-21 14:47)
제가 k값을 잘 이해못하는가 봅니다
덮어놓고 2번 찍는 동네에선 2번이 더 많이 나왔다는 건가요?

17대가 1이고 18대가 1.5니 이례적인건 맞다고 생각하구요
수지꺼 4.6이 전체 선거구의 미분류율이라고도 보기 어렵다고생각합니다
  • 템페스트>님
  • (2017-04-21 15:07)
이래저래어렵님//

아주 단순화시킨 모델 하나 올려드릴께요.

노인층 1만명, 젊은층 1만명.
노인층 지지율 박2 : 문8 , 젊은층 지지율 박1 : 문9
노인층 미분류율 4%, 젊은층 미분류율 2% 가정.

전반적으로 문 후보 지지율이 '매우' 높은 지역 맞죠?

박 후보
노인층 분류표 1,920,  미분류표 80 획득
젊은층 분류표  980,  미분류표 20 획득
총계 분류표    2,900,  미분류표 100 획득
최종 유효표    3,000

문 후보
노인층 분류표 7,680,  미분류표 320 획득
젊은층 분류표 8,820,  미분류표 180 획득
총계 분류표  16,500,  미분류표 500 획득
최종 유효표 17,000

이 때, 박 미분류표 100, 문 미분류표 500
최종 득표율은 박15% : 문85%

K=1.13
  • 템페스트>님
  • (2017-04-21 15:11)
둘째.

17대 대선, 용인시 수지구 모델이 K=1.02 미분류율 4.6% 였습니다. (다른 2개는 못 구하겠네요)

더 플랜에서는 이를 18대 대선과 비교하며
정상적인 경우, 이처럼 K가 1에 가깝게 나오는데
18대는 K=1.5니까 무언가 '인위적인 조작이 있었다' 라고 하죠?.
즉, 17대는 '인위적인 조작이 없었다' 는 대조군입니다.

그렇다면

1) 17대에서 나온 미분류율 4.6% 는 인위적인 조작이 있었던 수치입니까, 없었던 수치입니까?
2) 미분류율 4.6%가 인위적인 조작이 없는데 가능하다면, 18대 3.66%는 인위적인 조작입니까?
3) 비교군이 적다 -용인 1개 뿐이라서 신뢰할 수 없다면, 3개 비교군인 17대 K값은 어떻게 신뢰합니까? 2개 더 많아서?
  • 그냥그런이님
  • (2017-04-21 19:21)
템페스트&gt;님//ㅋㅋㅋ 전체 3%의 미분류를 만들려면 70대 이상의 몇프로의 사람이 잘못 눌러야 하는지 아시나요?? 노인가설이 말도 안된다니깐 은근슬쩍 70대로 올리는것 같은데 울 어머니가 70대 초반이신데 카톡도 잘하시고 가지고 있는 투 표권은 전부 행세하신 프로투표러이시네요. 70대 이상의 분들이 10명중 한 세내명은 그것도 딱 18대에만 그렇게 잘못 누지렀을것이라는 가정이 더 억지 아닌가요?
  • 그냥그런이님
  • (2017-04-21 19:25)
템페스트&gt;님//그렇게 한군대 개표소는 그럴수 있다는겁니다. 그런데 전체를 평균내서 1.5에 가까울 가능성이 어떻게 일반적이냐는거죠. 예를드신것처럼 적어도 250군데에서 한두군데는 튀는게 나와야죠? 어떻게 모든 곳에서 박근혜가 높게 나옵니까 그게 말이 되나요?? 그 특이한 경우를 예를 드셨는데 18대는 전체는 특이한데 개별개별이 특이한곳이 없이 미분류 전부 박근혜가 높게 나온게 이상한겁니다
  • 템페스트>님
  • (2017-04-21 19:51)
그냥그런이//
어머님이 건강하신 건 다행이네요 축하드립니다.
70대 문해율 얘기는 그만큼 젊은 층에게 당연한 게 노인층에서는 당연하지 않다는 뜻으로 부연하여 예시한 겁니다. 왜 70이냐고 물어보면, 60대 이하에서는 연령대별로 1%미만부터 5%까지 증가하지만 70대에서는 20%로 급증하거든요. 그 이유는 70년 전에 무슨 일이 있었는가 되돌아 보시면 될 거구요.
그런 의미에서 노인층의 오류율이 증가할 수 있다는 점을 얘기했고, 딱 한군데 예시하긴 했지만 그건 덮어놓고 2번 찍는 곳에서도 K>1 이상이 되는 걸 보여주려 한 거죠. 노인 오류율이 젊은 층보다 높고, 노인층에서 박을 젊은 층보다 조금만 더 지지하기만 하면 K>1 인 모델이 나온다는 거죠. 원글 분은 그 경우 0.7가량이 나와야 한다고 하시기에.
뭐 부족하다 생각하시면 같은 조건 하에서 모델 돌려가며 K가 1보다 작은 모델을 찾아보시면 되겠죠. 그 모델 예시를 찾으시면 그걸 갖고 다시 한 번 얘기해 봅시다.
  • 템페스트>님
  • (2017-04-21 19:57)
그냥그런이//

그냥 간단히 말씀드려서, 노인가설을 반박하는 건 간단해요.

1)노인층 미분류율이 전체 미분류율보다 단1%라도 더 높고
2) 노인층의 박 지지율이 전체의 박 지지율보다 1%라도 높다
 - ex) 노인 박2:문8 , 전체 박1:문9 등

위 두가지 조건을 충족하고도 K가 1보다 작은 모델을 하나만 만들어 오시면 됩니다. 노인가설은 저 두 조건이 충족되면 K는 항상 1보다 커야 하거든요.
그것만 만들어오시면 여기 노인가설 주장하는 사람들을 다 무릎꿇릴 수 있습니다. 그것부터 한 번 만들어보고 얘기해 봅시다.
  • (2017-04-21 13:35)
진짜 발암 주의 맞군요....
from CV
  • 쓰는님
  • (2017-04-21 13:49)
통계학 박사씩이나 데려다놓고 이런 기초적인 사실을 무시하고 호도하는 건 일부러 그러는 거라고밖에 볼 수 없습니다. 다른 목적이 있는 겁니다.
  • 템페스트>님
  • (2017-04-21 14:03)
솔직히 저도 처음엔 그렇게 생각했는데.... 선관위 반박에 재반박하는 거 보니, 그냥 모르는 거 같습니다.....;;;
  • 마봉길님
  • (2017-04-21 17:33)
쓰는님, 템페스트>님 //

오마이뉴스에 나온 재반박을 보니, 머저리가 될 것이냐, 사기꾼이 될 것이냐에서 머저리가 되는 길을 선택하는 걸로 보여지더군요. 진짜 머저리라서 그러는 게 아니라 손모가지가 날아갈 위기가 오니 벌써부터 쫄아서 혓바닥이 길어지는 전형적인 양아치 수법.
  • wijw1님
  • (2017-04-21 18:26)
+1
  • drylandscape님
  • (2017-04-21 21:03)
쓰는님
+1
w.ClienS
  • 요켠님
  • (2017-04-21 15:21)
어차피 안 들어요 ~
신념의 문제라...
  • 스피드볼님
  • (2017-04-21 19:23)
ㅋㅋ
#CLiOS
  • dir00님
  • (2017-04-21 19:27)
등떠미는 기술에놀아나는 소위 입진보들 보면 재밌잖아요
입으로는 문재인 하는짓은 박근혜 ㅎㅎ
  • (2017-04-21 20:08)
아직도 그런지 모르겠는데..수학 교과서 단원명이 "통계와확률"이였습니다. 맨 마지막 장이였지요. 그래서 그런지 "통계"와 "확률"을 서로 헷갈리는 분이 많은 것 같습니다.
  • 김맛님
  • (2017-04-21 20:44)
우리 고등수학의 목표가 미적분을 할 수 있도록 하는 게 아니라 통계와 확률을 이해할 수 있도록 하는 거였으면 얼마나 좋았을까 싶은 요즘입니다.. 글 읽고 왔습니다. 처음 뵙는 분이지만 존경합니다
  • dacoon님
  • (2017-04-21 21:22)
존경이라뇨 당치않습니다 ㅎㅎㅎ;;; 그냥 고등학교 수준 논리일 뿐인데요.
  • drylandscape님
  • (2017-04-21 21:03)
힐링 포스트!
w.ClienS
  • dacoon님
  • (2017-04-21 21:40)
댓글은 안힐링..
  • 템페스트>님
  • (2017-04-21 22:00)
dacoon /
사이트간 비교하는 게 예의없는 짓이긴 하지만
오유보다는 비교적 힐링되지 읺습니까? ㅋㅋㅋ
물론 여기도 이미 숱허게 신고받고 삭제되긴 했지만 ㅜ
(내 간이 시뮬레이터 물어내라아아아아 ㅜㅜ)
  • dacoon님
  • (2017-04-21 22:12)
페이스북 통계분석연구회 그룹에도 올렸는데, 거기도 비슷해요.

오히려 사람들 프로필까지 다 나오니까 경악스럽습니다.

영화에 출연한 김재광 교수님께 인신공격 오지게 듣고 차단당했습니다 ㅡㅡ; 정신감정 받고오래요.
  • dacoon님
  • (2017-04-21 22:13)
그리고 클리앙의 이과생 비율이 더 높은 것 같습니다.

근데 제가 곰곰히 생각해보니, 이과생 비율이 더 높은건 어떤 세력의 개입이 있었다는 말 같습니다.;;

부디 밤길 조심하세요.
  • 템페스트>님
  • (2017-04-21 22:16)
dacoon//
ㅋㅋㅋ 자 그대도 우리 연판장에 이름을 남기시지요.
정직원 / 알바 구분없이 환영합니다 ㅋㅋㅋㅋㅋㅋㅋ
그나저나 난 국문관데?! 이과생이 많다는 중거를 대시오오오!!!

http://m.clien.net/cs3/board?bo_table=park&bo_style=view&wr_id=54712445
  • dacoon님
  • (2017-04-22 00:42)
ㅋㅋㅋ 이름 찍어놓고 왔습니다.
  • 템페스트>님
  • (2017-04-22 00:54)
ㅋㅋ 인사 남겨놨음! 끝나고 또 모여서 뒷풀이 하자능!
간이 시뮬레이터도 링크 남겨놨으니, 한번 봐 주시라능;;; ㅇ_ㅇ
  • PANG!!님
  • (2017-04-22 01:56)
포스터는 관광하러 가는거죠. 언제부터 논문 취급을 받았나요. ㅎㅎㅎ
  • 여정만리님
  • (2017-04-22 07:38)
저도 처음에 노인층 지지가 많으면 그럴 수 있다라고 했다가 통계모르죠?란 소리듣고 포기했습니다. 어차피 이번 대선끝나면 저절로 결론 나는것이라 욕먹을 필요가 없을 것 같아서요
  • 템페스트>님
  • (2017-04-22 12:40)
심심해서 올려보는, [와우로 풀어보는 K값] ...ㅎㅎ

남성 유저 7,000명, 여성 유저 3,000명이 와우를 플레이 할 경우.
가정1) 남성은 호드유저가 많고 (호7:얼3), 여성은 얼라유저가 더 많다 (호3:얼7)
가정2) 남성유저의 5%, 여성유저의 1%가 공대장을 잡아본 적이 있다
이 때의 호드 - 얼라 공대장 수로 K값을 비교하면?

남 7,000명, 호드 4,900 : 얼라 2,100 . 공대장 5% . 호드공대장 245 : 얼라공대장 105
여 3,000명, 호드  900 : 얼라 2,100 . 공대장 1% . 호드공대장  9 : 얼라공대장  21

이 때, 호드-얼라 비율 대 호드공대장-얼라공대장 K 값은 1.46

...?!
호드 유저에 비해 호드 공대장 비율이 비정상적으로 높다!!!
이것은 조작되었다아아아아아아아아앜!!!!!


...록타르 오가르. 싸우는 자에게 힘과 용기를...!
  • dacoon님
  • (2017-04-23 10:03)
후속글이 신고 누적으로 차단당했네요.

새로 쓴 글 링크합니다. 개인적으로 종결이라고 생각해요.

http://todayhumor.com/?science_63349
  • 어부바님
  • (2017-04-23 10:13)
dacoon님// 문제 없는 글이라면 다시 복원 될거에요.
복원되지 않는다면 어떤 부분이던 문제 있었던 거라고 이해하시면 되고요.
  • wijw1님
  • (2017-04-23 10:34)
관리자에게 메일로 사정 설명해야 풀어줍니다.
  • 템페스트>님
  • (2017-04-23 10:59)
ㅋㅋㅋㅋㅋㅋㅋㅋ 헬로우, 미스터 도킨스.
  • 특이점님
  • (2017-04-23 12:58)
많은 분들이 댓글을 남기셨으나 사안문제를 떠나 팁이나 강좌 게시판에 어울리지 않는 것 같습니다. 팁이나 강좌 내용이 아니고 다른 사이트로 유도하는 링크 정도만 있는 본문글이네요. 자칫 조회수 올리는 유도로 글로 보입니다. 게시판 이동이 필요한것 같습니다. 특히 마지막줄에 "여기저기 퍼가셔도 됩니당" 라고 쓰신부분을 보더라도 조회수 유도 글로 보게 됩니다...
이전글 음성 무제한 요금제[4] 슷히브짭쓰 04-21 00:43
다음글 삼성세탁기 위에 엘지가스건조기 직렬설치[11] 세탁소 04-20 23:56