SEOUL NATIONAL UNIVERSITY
검색창 닫기

인문데이터과학 소식

데이터과학으로 다시 그린 조선왕조실록: 조선왕조실록 데이터베이스 예송논쟁 네트워킹 연구 (대학신문 2017.04.09.)
  • 링크 http://www.snunews.com/news/articleView.html?idxno=16855
  • 작성자인문대학
  • 날짜2017-04-17 18:49:35
  • 조회수234

서울대 통계학과 고차원 대용량 자료분석 연구실은 조선왕조실록에 기록된 예송논쟁을 주제로 연구를 진행하고 있다. 이미 데이터화된 조선왕조실록 문건을 기반으로, 연구 초기에는 상소문을 통해 당시 관료들의 네트워크를 분석하는 것을 주제로 카이스트와 공동연구를 진행했다. 그러나 장원철 교수(통계학과)는 “현재 대한민국의 공동법안발의와 달리, 상소문에는 대표자 한 명의 이름만 기재돼 이를 기반으로 한 네트워크 분석이 어려웠다”며 연구 방향을 바꿔야만 했던 상황을 설명했다. 이에 의미 있는 연구를 진행할 수 있는 명확한 주제를 잡아내고, 분석 과정에서의 정확성을 높이기 위해 서울대 국사학과 문중양 교수 연구실의 양선비 박사의 자문을 구하게 됐다.

국사학과와의 연계는 국사학적 지식 없이 데이터만 있어 명확한 연구 방향을 잡기 어려웠던 상황에서 벗어나는 데 큰 도움이 됐다. 국사학과의 도움으로 연구주제는 예송논쟁 시기 관료들 간의 네트워크에 대한 것으로 바뀌게 됐다. 장 교수는 “관료들 간의 네트워크를 통해 역사적으로 알려지지 않은 관료 중에 서인과 남인 각각의 중심인물을 알아보고자 했다”며 연구 목적을 구체적으로 밝혔다. 또 김준식 씨(통계학과 박사과정·16)는 “단순히 데이터로만 결과를 내다보니 이 결과가 정확한지 아닌지 판단해 줄 사람이 필요했다”며 국사학과와의 연계 이유를 설명했다.

관료들 간의 관계를 알아보기 위해 썼던 통계학적 기법이 네트워크 분석 방법론이었다. 사람, 조직, 사물 등을 연결하고 배치해 구조를 만들어 이를 분석하는 것이 네트워크 분석 방법론이다. 김준식 씨는 “새로운 인물이 등장할 때마다 네트워크에 넣어, 각 관료가 포함돼있는 당파, 실제 당파와의 일치성 등을 분석했다”고 말했다. 그러나 데이터 분석만으로는 연구가 진행되기 어려웠다. 정형 자료에 특화돼있는 통계학적 분석 기법은 비정형 자료인 인문학적 데이터와는 잘 맞지 않았다. 또 역사 관련 지식의 부족도 연구의 어려움을 가중했다. 그는 “여러 사람 사이의 네트워크를 바탕으로 중요한 인물이 나타났어도 그 인물이 실제로 역사적으로 중요한 인물인지 알 수는 없었다”며 정확한 분석을 위한 역사전공과의 연계 필요성을 재차 강조했다.

현재 예송논쟁 시기의 관료들의 네트워크 연구는 여전히 진행 중이다. 오차를 줄이기 위해 조선왕조실록의 원자료라고 할 수 있는 승정원일기의 분석도 병행하고 있다. 특정 관점의 편집이 이뤄졌을 조선왕조실록을 가공된 데이터로 보고, 역사적 사실을 빠짐없이 기록한 승정원일기를 가공되지 않은 원 데이터로 보는 것이다. 상대적으로 오류가 적은 원 데이터의 분석과 가공된 데이터 분석을 비교할 때 나타나는 차이점을 통해 오류를 줄일 수 있다. 이 분석의 결과는 조선왕조실록에 대해 보편적으로 알려진 데이터에 대한 검증과 동시에 그동안 연구되지 않았던 분야의 새로운 해석을 만들 수 있는 기회가 될 수 있다.

본 그래프는 네트워크 중심성을 분석하는 다양한 방법론을 도식적으로 보여준다. 연결된 선분이 가장 많은 점을 중심으로 보는 방법(Highest Degree Centrality), 한 점에서 다른 점들 사이 거리를 각 점마다 합했을 때 그 합이 제일 작은 점을 중심으로 보는 방법(Best Closeness Centrality) 등의 방법이 분석의 과정에서 활용된다.

사진제공: 서울대 통계학과 고차원 대용량 자료분석 연구실

이현정 기자  hyundog96@snu.ac.kr

목록

수정요청

현재 페이지에 대한 의견이나 수정요청을 관리자에게 보내실 수 있습니다.
아래의 빈 칸에 내용을 간단히 작성해주세요.

닫기