데이터 과학 노트

Zachary’s Karate Club - 사회 네트워크 분석의 고전 본문

Data Science/Graph Neural Networks

Zachary’s Karate Club - 사회 네트워크 분석의 고전

Data Scientist Note 2025. 10. 9. 17:35

Zachary’s Karate Club - 사회 네트워크 분석의 고전

1970년대 초 미국의 한 대학 가라테 동아리에서 벌어진 작은 갈등이 오늘날 사회 네트워크 분석(Social Network Analysis) 의 대표적인 데이터셋이 되었다
이 사건은 인류학자 Wayne W. Zachary 가 기록한 “Zachary’s Karate Club” 으로 불린다


1. 연구의 배경

Zachary는 1970년부터 1972년까지 약 2년 동안 한 대학의 가라테 동아리를 관찰했다
그는 구성원들 간의 개인적 상호작용(우정 관계, 동아리 외 만남 등) 을 체계적으로 기록하여 하나의 사회 네트워크 그래프 로 모델링했다

이 네트워크는 사람(노드)관계(엣지) 로 구성되어 있으며
누가 누구와 자주 어울렸는지를 시각적으로 표현한다


2. 데이터 구조

  • 노드(Node): 총 34명의 동아리 구성원
  • 엣지(Edge): 78개 (상호작용이 관찰된 관계)
  • 그래프 특성: 무향 그래프 (A↔B 관계가 동일하게 취급됨)

일부 데이터 버전에서는 77개의 엣지만 포함되기도 한다
이는 Zachary의 원 논문에서 특정 두 사람(노드 23과 34)의 관계 여부가 불확실하게 기록되었기 때문이다

이 데이터셋은 현재까지도 네트워크 분석, 커뮤니티 탐지, 군집화 알고리즘 성능 평가 등에 널리 사용된다


3. 갈등과 분열

관찰 기간 중, 동아리 내에서 두 인물 간의 갈등이 발생한다

  • 강사 “Mr. Hi”
  • 동아리 회장 “John A”

두 사람은 수업료 조정 문제로 대립하게 되었고
그 결과 구성원들은 점차 두 진영으로 나뉘었다

Zachary는 이 네트워크 구조를 바탕으로
어떤 구성원이 어느 진영으로 갈지 예측하는 모델 을 제시했다
그의 예측은 실제 결과와 거의 일치했으며 단 한 명만이 다른 선택을 했다

그 한 사람은 이미 검은띠 승급 직전이었고
소속을 바꾸면 자격을 잃을 위험이 있었기 때문에 현실적인 이유로 다른 편을 택했다고 한다


4. 학문적 의의

Zachary의 Karate Club 데이터는 이후 네트워크 과학에서 다음과 같은 용도로 활용된다

  • 커뮤니티 탐지(Community Detection) 알고리즘 검증
  • 모듈러리티(Modularity) 기반 군집화 실험
  • 네트워크 흐름(flow)최소 컷(min-cut) 모델 설명
  • 사회적 영향력 및 확산 모델 시뮬레이션

Girvan–Newman 알고리즘, Louvain 방법, Spectral Clustering 등
수많은 알고리즘이 이 데이터로 성능을 테스트했다


5. 네트워크 시각화 예시

아래 그림은 Zachary’s Karate Club 네트워크의 대표적인 시각화다
각 노드는 구성원을 나타내며 색상은 실제로 분열된 두 그룹을 의미한다

Zachary's Karate Club Network


6. 결론

Zachary’s Karate Club은 단순한 사회적 갈등 사례를 넘어
네트워크 구조가 인간 행동을 어떻게 예측할 수 있는가 를 보여준 상징적인 연구다

이 데이터는 50년이 지난 지금도 여전히
그래프 이론, 데이터 과학, 머신러닝, 사회학 등 다양한 분야에서
연구와 교육의 기본 예제로 사용되고 있다


참고 자료

'Data Science > Graph Neural Networks' 카테고리의 다른 글

GNN에서 Spectral과 Spatial의 차이  (0) 2025.10.09