캘리포니아의 습한 8월 공기는 변화의 약속으로 가득 차, 거의 맛볼 수 있을 정도로 피부에 와닿았다. 하지만 전국 곳곳의 차가운 데이터 센터와 정책 결정실에서는 이러한 변화를 이해하는 데 사용되는 측정 기준이 완고하게 구식으로 남아 있었다.
핵심은 이거다. 미국은 인종 질문에서 여러 항목에 ‘체크’하는 사람들로 넘쳐난다. 미 국세조사국(U.S. Census)이 ‘하나 이상 표시’ 옵션을 허용한 것은 관료주의의 온정적인 배려 같지만, 이는 우리가 정체성을 이해하는 방식을 근본적으로 뒤흔드는 지각 변동이나 다름없다. 그리고 그 수치들은? 단순한 증감이 아니다. 폭발적으로 증가하고 있다. 2010년 9백만 명에 불과했던 ‘두 개 이상의 인종’ 인구는 2020년 3천 3백 8십만 명으로 엄청나게 불어났다. 이건 잔물결이 아니다. 쓰나미이고, 앞으로도 계속 밀려올 것이다.
하지만 여기서 문제가 생긴다. 수많은 분석가들을 밤잠 설치게 할 근본적인 마찰이다. 찻잔으로 쓰나미를 어떻게 측정할 수 있겠는가? 인간 경험을 분류하고 측정하는 행위 자체가 사람들이 스스로를 어떻게 정의하는지, 그 유동적이고 역동적인 현실을 따라가지 못하고 있다. 전문가들은 개인이 정치 설문 조사에서는 하나의 인종 범주를 선택하고, 건강 설문 조사에서는 다른 범주를 선택하거나, 특정 커뮤니티에 강하게 소속감을 느낄 때는 또 다른 범주를 선택할 수 있다고 지적한다. 결국, 정체성은 돌에 새겨진 것이 아니라, 맥락과 경험의 바람에 취약한 길가에 그린 분필 그림과 같다.
구식 지표의 메아리
이러한 불일치는 단순한 학문적 논쟁거리가 아니다. 데이터 시스템이 경직되고 이분법적인 틀에 기반할 때, 그 결과는 사회적 역학에 대한 우리의 이해를 왜곡하는 맹점을 만들어내며 심오할 수 있다. 생각해 보라. 유권자의 상당 부분을 기존의 인구 통계학적 범주에 깔끔하게 분류할 수 없다면, 선거 결과는 어떻게 분석되는가? 다인종 환자의 유전적 소인이 데이터 프로필이 틀에 맞지 않아 잘못 귀속되거나 간과될 경우, 건강 위험을 어떻게 정확하게 추적할 수 있겠는가?
“인종의 경계는 더욱 유동적으로 변했으며, 우리는 그것이 무엇을 의미하는지 아직 완전히 이해하지 못했습니다.”라고 정치 심리학자 그레고리 레슬리(Gregory Leslie)는 말했다.
정말 그렇다. 수많은 분석의 근간이 되는 인구 조사 데이터가 57가지의 다양한 인종 조합을 하나의, 종종 모호한 ‘다인종’ 범주로 묶어버린다면, 그것은 드러내는 것만큼이나 많은 것을 가릴 수 있다. 흑인과 백인 모두로 자신을 정체화하는 사람의 경험은 일본인과 멕시코인으로 자신을 정체화하는 사람의 경험과 같을 리 없다. 그러나 우리 데이터 시스템은 종종 그들을 같은 개념적 상자에 밀어 넣어, 살아있는 경험의 미묘한 차이를, 그리고 그들이 직면할 수 있는 고유한 어려움과 차별을 말살해 버린다.
왜 이 데이터 격차가 중요한가?
파급 효과는 이미 나타나고 있다. 임상 환경에서 다인종 환자들은 잘못 식별되거나 인종적 미세 공격을 경험했다고 보고했으며, 이는 의료 제공자와의 신뢰 및 참여 관계를 단절시켰다. 의사의 진료실에 들어가서 자신의 정체성 자체가 적절한 치료를 받는 데 장벽이 된다고 느껴지는 상황을 상상해 보라. 이것은 가상이 아니다. 연구에 따르면 이는 지속적인 문제다.
법률 분야에서는 문제가 훨씬 더 교활하다. 법원은 다인종 원고를 단일 소수 집단으로 취급하는 경향이 있으며, 혼혈 출신으로 인해 발생할 수 있는 특정 형태의 차별을 인식하지 못한다. 법률 학자들은 이것이 차별이 여러 정체성의 복잡한 상호 작용인 사건을 기소하기 어렵게 만든다고 주장한다. 시민권을 보호하기 위해 설계된 메커니즘 자체가 의도치 않게 말살의 도구가 될 수 있는 것이다.
그리고 알고리즘도 잊지 말자. 우리 디지털 생활을 점점 더 지배하는 머신러닝 모델은 과거 데이터로 훈련된다. 만약 그 데이터가 결함이 있고, 구식 인종 범주를 기반으로 구축되었다면, 그 알고리즘은 똑같은 편견을 계승하고 영속화하여, 개개인의 자기 정체성을 경직되고 미리 프로그래밍된 가정으로 무시하게 될 것이다.
증폭된 과거의 메아리
미국의 데이터 수집이 인종 문제로 어려움을 겪은 것은 이번이 처음이 아니다. 수세기 동안 정부는 지배적인 사회 계층 구조에 편리하게 부합하는 인종 범주를 할당하곤 했다. 오늘날, 진자(pendulum)는 자기 식별로 기울었다. 훨씬 더 공평한 접근 방식이다. 그러나 과정을 민주화하려는 서두름 속에서, 우리는 그 데이터의 해석과 집계가 여전히 수십 년 뒤처진 프레임워크에 의존한다는 사실을 잊어버린 것 같다. 마치 요리사가 사용하는 모든 재료를 꼼꼼하게 기록해 놓고, 최종 요리는 단순히 ‘음식’이라고만 설명하는 것과 같다. 구체성, 예술성, 현실 - 모든 것이 사라진다.
흥미로우면서도 솔직히 조금 걱정스러운 점은 정치적 소속감이 자기 식별에 어떻게 영향을 미칠 수 있는지이다. 어떤 사람이 특정 정당이나 사회 운동에 강하게 동질감을 느낄 때, 그 그룹의 서사에 부합하는 단일 인종적 정체성에 더 치우칠 수 있다. 이는 우리의 데이터 세트가 객관적인 현실이 아니라, 그날의 정치적 바람에 의해 체계적으로 왜곡될 수 있음을 의미한다. 동일한 인구를 측정하는 두 개의 다른 연구가 개인들이 현재의 소속감에 따라 자신을 어떻게 표현하기로 선택했는지 때문에, 투표 패턴, 사회적 불평등, 또는 인구 집단의 규모에 대한 정반대의 결론을 도출할 수 있다.
결론은 이것이다. 미국의 인종적 정체성은 생동감 있고 끊임없이 변화하는 모자이크지만, 우리의 통계 도구는 여전히 제한적이고 빛바랜 색채 팔레트로 그림을 그리려고 한다. 우리의 데이터 인프라가 현장의 현실을 따라잡을 때까지, 우리는 계속해서 우리 자신을 오해하고 수백만 명을 인구 통계학적 그림자 속에 남겨둘 것이다.