안녕하세요. 땡스데이터의 도슨트입니다. 어느덧 5월이 가고 6월이 되었네요. 봄과 여름이 엇갈리며 서로 자리를 바꾸는 요즘입니다. 올해는 너무 덥지 않은 여름이길 바랍니다. 올여름에는 장맛비가 오더라도 작년 같은 인명피해가 없길 두 손 모아 기원합니다. 🙏

이번 아티클은 SDGs 연재를 한 회 쉬는 대신 여러분들과 데이터에 관해 이야기하려 합니다. 부담 없이 보실 수 있도록 그림을 많이 넣어 짧게 준비했어요.

아티클의 마지막에는 올해 7, 8월에 있을 땡스데이터 2기 스터디도 소개합니다. 공부에 관심 있는 분들은 모집을 시작하면 신청해주세요. 그럼 생존자 편향과, 앤스컴 콰르텟, 데이터 사우르스에 대한 이야기를 시작하겠습니다!


1. 생존자 편향 (Survivorship bias)

여러분들은 생존자 편향(**Survivorship bias)**이란 말을 들어보셨나요? 아래 비행기 그림을 보면서 이야기해 보겠습니다.

Survivorship-bias.svg

<출처: https://en.wikipedia.org/wiki/Survivorship_bias>

세계 2차 대전 중 미 해군 분석센터 연구원들은 전투를 마치고 귀환한 전투기들의 총탄 자국을 연구해 어디를 어떻게 보강해야 전투기의 귀환율을 높여 공군 전력을 최대로 유지할 수 있을지 분석했다고 합니다. 이때 많은 연구원은 비행기 날개와 몸통, 꼬리날개에 피탄이 집중되니(빨간 점) 해당 부분 중심으로 전투기를 강화(reinforce) 하려 했습니다.

여기서 잠깐 멈추고 비행기 사진을 다시 보면 확실히 좌·우 날개들과 몸통과 꼬리에 빨간 점이 많이 찍혀있습니다. 총탄에 비행기가 피격되면 해당 부분이 파괴돼 제대로 된 비행을 하지 못하고 추락할 것입니다. 피격되더라도 귀환하려면 전투기의 어느 부분을 강화해야 할까요? 빨간 점이 많은 날개 쪽일까요? 5초 정도만 곰곰히 생각해 보시고 아랫 글을 읽어보세요.

<aside> 💡 다시 이야기로 돌아가면, 미 해군이 고용한 통계학자 “아브라함 왈드(Abraham Wald)”는 다른 사람들과 다른 의견을 제시합니다. 귀환율을 높이려면 “비행기 머리 부분인 조종석과 엔진의 장갑을 더 두껍게 하고 튼튼하게 해야 한다”고 주장한 것입니다. 그는 근거를 말했습니다. “날개와 몸통에 총탄을 맞은 비행기들은 어찌 됐든 귀환해 우리 눈앞에 있습니다. 하지만 조종석과 엔진을 피격당한 비행기들은 돌아오지 못했습니다. 조종석과 엔진 부분에 빨간 점이 없는 이유는 그 부분을 피격당한 전투기들이 귀환하지 못했다는 강력한 증거입니다.”

</aside>