INTERVIEW



The National Library of Korea’s Collections, Data, And The LOD Project (KR)



Go to the website


비/물질 컬렉션을 위한 도서관의 장서개발과 관리

국립중앙도서관은 국내 대표 국공립도서관으로서 국내외 도서관 자료의 개발, 수집, 제공, 보존관리를 하고 있다. 특히  2011년부터 도서관의 서지정보와 주제명, 저자명 데이터를 대상으로 기존의 (KOR)MARC 형태 또는 DBMS 형태의 데이터를 RDF 형식으로 변환하여 웹상에 Linked Open Data (LOD) 형식으로 발행하는 서비스를 제공하고 있다. 그리고 국내외 도서관 사서, 연구자 등과 함께 관련 쟁점과 활용 방안에 대해 논의하고자 2014년부터 매년 컨퍼런스를 개최하고 있다. 국립중앙도서관 국가서지과 최윤경 사무관과의 인터뷰를 통해 도서관의 실물 자료와 데이터, 서지정보와 이를 활용한 LOD 프로젝트에 대해 이야기를 나눴다.



HS: 도서관 장서와 소장자료 중에는 흔히 알고 있는 일반 서적 외에도 지도와 사진, 악보 및 음악 관련 자료, 마이크로형태 자료, 시청각 자료 등 다양한 형태의 자료들이 포함되어 있습니다. 도서관이 자료를 수서하고 소장하는 기준은 무엇인지, 그 범위는 어떻게 되는지 궁금합니다.

국립중앙도서관은 국가 도서관으로 납본법에 따라 자료를 수집하고 있습니다. 그래서 일반적인 도서관(공공 기관, 대학교 등)에서 자료를 선정하는 ‘수서’ 방식과는 차이가 있습니다. 우선 ISBN을 부여받은 자료들을 납본 받고 있고, 일부 기증이나 구입(고서나 근대문헌)의 방식으로도 자료를 수집하고 있습니다. 자료를 수집하는데 있어 유형의 구분은 없고, 모든 형태의 자료(실물 자료, 온라인 자료)를 모두 포함하고 있습니다.

HS: 도서관에서 수집한 자료 중에 지도나 사진, 음악 관련 자료들은 국립중앙박물관이나 국립현대미술관 등 타 기관의 소장품 유형과 중복될 수도 있을 것 같아요. 실제로 분야별로 나뉘어 국공립 도서관/미술관 건립이 된 것이 그리 오래된 일이 아니라는 점을 감안할 때, 반세기 가까운 시간동안 대부분의 지류 자료는 대부분 국립중앙도서관에서 수서하고 보존했을 것이라 예상되는데요. 도서관 내, 분야별 전문가가 상주해 계시는지, 혹은 타 기관과 교류 및 협력(자료이관, 공동연구 등) 등을 통한 협업이 이뤄지고 있나요?

제 생각엔 실물 자료 측면에서는 중복자료는 거의 없을 것 같아요. 그리고 오래된 자료들은 판본도 중요하기 때문에, 제목이나 저작이 동일하다고 같은 자료로 간주되지 않는 것으로 알고 있습니다. 물론 도서관 내에 사서뿐만 아니라 고문헌을 관리하는 학예직 직원이 근무하고 있습니다. 이분들이 역사적인 자료들을 별도로 관리를 하고 계시지만 음악이나 사진 등 자료 유형이나 장르에 따라 특화된 전문 사서는 없습니다


국내외 타 도서관 중에는 전시장을 운영하여 다각도로 소장 자료를 소개하고 있습니다. 저처럼 책(아티스트 북)을 소재로 연구하고 전시를 기획하는 이에게 도서관의 이런 행보는 관심을 갖지 않을 수 없는데요. 국립중앙도서관에도 디지털 전시장이 마련되어 있는데 도서관 내 전시 전문인력이 계신가요?

국립중앙도서관 내 전시는 대부분 외주 용역을 통해 전시를 발주하고 운영하고 있습니다. 물론 일부 전시는 자체적으로 기획하기도 하는데, 관내에 전시 기획이나 운영 관련 전문인력은 별도로 두고 있지 않습니다.

HS: 현재 도서관 자료는 한국십진분류법(KDC)에 따라 주제별로 분류하여 소장됩니다. 그러나 책의 형태와 주제가 점점 더 다양해지고 있고, 특히 2010년대 국내에서 독립출판물 붐이 일면서 KDC의 주류로 구분하기 어려운 책들이 다수 소장되었을 것이라 예상됩니다. 현재 수서 대상을 정하거나 장서를 분류하는데 어려움은 없는지, 있다면 어떤 방식으로 보완하고 계시는지 궁금합니다.

수서 대상을 별도로 제한하지 않기 때문에 도서 수집에 어려움은 없습니다. 그보다 출판된 자료를 모두 납본 받는 것이 더 중요합니다. 또한 자료의 내용과 형식 측면에서 주제명 표목(주제어, 통제어휘)을 부여하고 있어서 분류기호의 한계점을 보완하고 있습니다. 그리고 청구기호를 구성하는 분류기호 이외에 제 2분류 기호도 부여하고 있습니다.

HS: ‘장서개발지침(2021 개정판)을 참고하면서 ‘하이브리드형 정보자료(일반자료+온라인 자료)’가 눈에 띄었습니다. 물질적, 비물질적 매체를 동시에 활용한 자료를 의미하는 것 같은데 구체적으로 어떤 자료들이 여기에 해당되나요? 이러한 자료들은 이용자에게는 어떤 방식으로 열람 서비스가 제공되는지 여쭤보고 싶습니다.

일반자료는 종이로 된 도서, 비도서자료(CD, DVD, 지도, 악보 등) 등이고, 온라인 자료는 실물이 없이 원격으로 이용 가능한 자료입니다. 온라인 자료는 디지털 파일 형태로 납본 또는 수집해서 시스템에 탑재하는 방식으로 관리되며, 이용자들은 원격으로 이를 열람하게 됩니다.

HS: 그런데 온라인 자료들은 현재 도서관과 협약을 맺은 기관의 지정 PC에서만 이용 가능하도록 안내 중입니다. 원격으로 서비스를 이용할 수 있다고 해도 물리적인 제한이 있어 쉽게 이용하기 어렵습니다.

이는 저작권 문제 때문입니다. 국립중앙도서관에서 보유한 대부분의 온라인 자료들은 저작권이 소멸되지 않았습니다. 따라서 저작권자의 권리를 보호해야 하는 자료에 대해서는 협약 기관(보통 도서관)의 지정 PC에만 이용 가능합니다. 이는 저작권법에서 도서관 간 망전송은 가능하다고 명시되어 있기 때문입니다. 반면 저작권 제한이 없는 자료는 어디에서든 접근할 수 있도록 열람 제한이 없습니다.



<세책과 방각본 고문헌>전, 2016, 국립중앙도서관 1층 전시실



데이터를 개방하고 공유가치를 실현할 LOD 프로젝트


HS: 국립중앙도서관은 2011년부터 LOD(Linked Open Data) 플랫폼을 연구하기 시작했으며, 2014년부터 매회 컨퍼런스를 개최하는 것으로 알고 있습니다. 해외 소재 타 기관과 비교해도, 꽤 이른 시기부터 도서관은 LOD 관련 사업을 진행해왔는데요. 당시 이를 시작하게 된 계기나 배경은 무엇인가요? 현재까지 어떠한 성과들이 있었는지, 그동안 괄목할만한 사례가 있다면 소개부탁드립니다.

너무 오래 전 일이기도 하고 그 동안 사업 담당자도 많이 바뀐 상황이라서 제가 자세히 말씀드리긴 좀 어렵습니다. 그러나 과거 정부에서 ‘정부 3.0’이란 정책을 발표했고, 그 기조에 따라서 ‘개방’, ‘공유’, ‘협력’이란 키워드가 중요하게 다뤄졌습니다. 국립중앙도서관은 문화체육관광부의 소속기관(정부기관)이기 때문에 이러한 정부 기조에 맞게 데이터 개방 정책과 서비스 방식을 고민했고, 그 일환으로 LOD 프로젝트를 실행한 것으로 알고 있습니다.

HS: 도서관이 LOD 사업을 시작한 이후 10년이 넘는 시간이 지났지만, 현재까지 방대한 양의 메타데이터를 지속적으로 만들고 이를 LOD로 발행하는 기관은 국내에서 국립중앙도서관이 거의 유일하다고 생각됩니다. 데이터간 인터링킹이 활발히 이뤄져야 보다 의미있는 LOD 프로젝트가 만들어진다는 점을 감안할 때, 이러한 상황은 조금 아쉬운데요. 그간 진행해오신 LOD 프로젝트 중 국내 기관간, 또는 해외 기관과 협력 진행된 프로젝트가 있는지 궁금합니다.

개인적인 견해를 말씀드리자면, LOD사업을 추진할 때 여기에 적합한 기관이 되려면 많은 데이터를 생산하면서, 동시에 이를 표준화된 방식으로 관리해야 하며, 다른 기관에서도 사용할 만한 가치가 있는 데이터를 보유해야한다는 점입니다. 그래서 외국에서도 주로 국가도서관 중심으로 LOD를 제공하고 있습니다.
그리고 메타데이터를 LOD로 제공하느냐와 링크드 데이터 기반으로 메타데이터를 구축하느냐는 조금 다른 문제입니다. 저희 도서관은 현재 도서관 표준 언어로 데이터를 만들고 있고, 이 데이터를 웹 환경에서 제공할 수 있도록 LOD로 변환하고 있습니다. 카카오에서 저희 LOD를 사용하고 있고, 외국 도서관에서도 우리 LOD로 인터링킹을 하고 있다고 알고 있습니다. 그러나 이를 도서관의 공식적인 프로젝트라고 말씀드리기가 어렵습니다. 기관 간 협력(MOU 등)을 통해 협력한 공식적인 사례로는 EADL(동아시아 디지털도서관) 프로젝트가 있습니다. 현재는 일본 국립국회도서관과 주로 협력하고 있지만, 향후에는 동아시아 국가도서관으로 확대할 계획입니다.

East Asia Digital Library 
HS: 도서관은 매회 LODAC 컨퍼런스를 개최하여 국내 유관기관 전문가 분들이 활발히 교류할 수 있도록 장을 마련하고 있습니다. 이외에도 도서관의 서지정보를 활용하여 프로젝트를 진행하려는 저와 같은 외부인을 위한 프로그램이나 안내 창구 등이 있을까요? 

도서관에서 개인 연구자를 위한 공식 프로그램은 아직 없습니다. 이와 관련해서 서비스 부서에서는 디지털 스칼라십 서비스를 운영할 계획이 있습니다. 특정 단체나 프로젝트에서 서지데이터를 제공받을 수는 있을 거 같은데, 이것도 일원화된 창구는 아직 없고, 개별 부서에 문의해야 하는 상황입니다. LOD는 디지털정보기획과에, LOD의 원천 데이터가 되는 서지데이터에 대한 문의는 제가 속한 국가서지과에 하셔야 합니다. 저희도 이러한 데이터 서비스를 하기 위한 일원화된 창구나 프로그램이 필요하다고 생각하고 있습니다.

HS: 올 해 진행된 LODAC 2022 에서 ‘국가서지 2030’에 대해 말씀해주셨습니다. 모든 서지정보를 LOD로 발행하는 것을 골자로 하고 있는데 구체적으로 어떤 내용을 담고 있나요?

간략히 말씀드리면 지금까지는 도서관 표준 언어에 맞게 국가서지를 작성하고, 이를 웹 환경에 맞는 링크드데이터로 변환(발행)하는 방식이었습니다. ‘국가서지 2030’은 도서관 서지 데이터의 구조와 시스템 자체를 링크드 데이터로 전환하는 것입니다. 서지를 작성하면서 인터링킹 등을 통한 외부 데이터를 활용할 기회를 높이고, 작성된 서지도 바로 웹에서 노출 가능하도록 합니다.


현재 저희가 채택한 언어는 도서관 간 데이터 공유를 목적으로 개발되었기 때문에, 도서관 이외의 분야에서는 활용가치가 떨어집니다. 이러한 부분을 보완하기 위해 LOD를 제공하고 있지만, 연 1회 발행하면 최신성도 떨어지고, 링크드 데이터의 장점을 완전히 반영하지는 못하고 있기 때문에 서지 데이터 생산 기반 자체를 바꾼다고 보시면 됩니다.

HS: 사무관님께서 꽤 오랜시간 도서관의 LOD 사업을 위해 힘쓰신것으로 알고 있습니다. 그동안 사업을 진행해오시면서 개인적으로 기억에 남는 사례가 있으실까요? 또한 도서관 내 LOD 사업의 향후 계획은 무엇인지 궁금합니다.


저는 LOD를 만들기 위한 원천 데이터에 대한 표준화 업무를 수행하고 있습니다. 그래서 실제 데이터에 대한 이해가 높아서 이와 관련된 발표를 해왔습니다. LOD 사업은 현재 데이터 변환 발행에 초점을 두고 있는데 저는 이 변환 규칙을 관리하는 것을 더 중요하게 생각하고, 그런 부분에서 LOD 사업 담당자와 협력하고 있습니다. 앞으로는 (장기적으로) 국가서지가 링크드 데이터 구조로 전환될 수 있도록 서지 데이터를 구성하는 다양한 용어들을 통제 및 어휘화하고 이를 링크드데이터로 발행하도록 LOD 사업 담당자에게 협업할 계획입니다.




  • 인터뷰 진행: 2022. 9. 26.
  • 인터뷰 발행일: 2023.1.10.
  • 인터뷰 협조: 최윤경 (국립중앙도서관 국가서지과 사무관)




© 2025 ALL THE RIGHTS Reserved by HOMEAGE TO THE SQUARE