책을 내면서
인류의 역사에서 우리만이 가지고 있는 문자언어 자료가 도서관이나 박물관 등에 소장되어 현전한다. 이 자료들을 검색하여 특정한 분류 기준에 따라 분류한 다음 목록을 만드는 작업은 우리의 정체성 확립뿐만 아니라 우리 스스로가 문화적 자긍심을 가질 수 있게 해준다. 게다가 이러한 목록 작업은 언어학 측면에서도 특히 언어 자료를 기반으로 연구하는 데 있어 기본적으로 마련해야 할 필수적인 정보를 제공해 준다. 또한 언어 자료 목록은 언어 자료의 빅 데이터를 구축할 때에도 반드시 갖추어야 하는 필수적인 것이다.
언어학자는 언어학의 연구 방법이나 일반언어학의 특정한 이론을 적용하여 체계적으로 자신의 모어인 개별 언어를 연구하기에 어려운 연구 환경에 놓여 있는 경우가 대부분이다. 보통 개인 연구자의 연구 공간, 연구 협업자나 조력자 등의 연구인력 환경, 컴퓨터 등의 연구 도구뿐만 아니라 연구자의 연구 수행 능력의 수준은 언어라는 연구 대상의 양적인 크기에 어울리지 않는 경우를 쉽게 찾아볼 수 있다. 게다가 소수의 예문을 근거로 연역법적인 방법으로 고안한 일반언어학 이론의 보편성이나 경제성도 아직까지 우리를 만족시키는 수준에 도달한 것은 아니다.
언어를 과학적으로 연구하기 위해서 우리는 연역법 또는 귀납법, 종합적이거나 분석적 방법, 공시적 연구 방법이나 통시적 연구 방법 등을 선택할 수 있다.
언어 자료를 근거로 객관적이고도 귀납법적인 새로운 연구 방법을 고안하는 작업을 먼저 수행한 다음 그 방법을 적용하여 연구한 체계적인 결과물을 바탕으로 새로운 이론을 제시하는 것이 보다 효과적일 것이다. 만약 새로운 패러다임을 창조할 수 있는 능력을 갖춘 사람이 슈퍼 컴퓨터나 양자 컴퓨터를 사용할 수 있는 연구 환경에서라면 예전보다 보편성이나 경제성이 높은 새로운 연구 방법이나 독창적인 이론을 보다 효율적으로 정확하게 제시할 수 있을 것이다. 어쩌면 현재 우리의 연구 환경에서는 이러한 복잡한 과정을 거치지 않고 어쩔 수 없이 몇몇 예문이나 시기나 대상이 제한적인 기존의 소규모 비균형 말뭉치에 의존하여 관찰한 결과를 바탕으로 가설을 제기하는 방법을 선호할 수밖에 없을 것이다.
무엇보다 먼저 방대한 규모의 언어 자료를 연구할 수 있는 환경을 마련하는 것이 필요하다. 언어는 혼자 연구하기보다는 서로 다른 개별언어를 연구하는 전공자 또는 컴퓨터 언어학 등 언어학의 하위 분야의 전공자들과 협업하여 연구하는 것이 효과적이다. 게다가 언어학 이외의 전공자들과 협업도 필요하다. 공동으로 모여서 연구하고 토론할 수 있는 환경이 마련되어야 하며 적용할 연구 방법이나 이론의 선택과 보완 작업이 이루어져야 한다. 공동 연구와 개인 연구의 결과물에 관한 토론의 활성화 방안도 마련되어야 할 것이다.
공공 기관에서 이루어지는 언어 자료 목록의 작성, 언어 자료 수집, 언어 말뭉치 구축, 연구 과정, 도구 프로그램, 연구 결과물 보관과 관리, 연구 인력 양성 등에 관한 모든 사항은 연구자들이 공유할 수 있어야 할 것이다. 그리하여 기록물과 목록을 활용하는 여러 분야들이 연계할 수 있도록 해야 한다.
언어 자료는 음성언어 자료와 문자언어 자료, 그리고 이 둘의 복합 자료이다. 언어 자료의 목록을 작성한 다음 언어 자료를 수집하여 필요한 부분을 디지털 정보로 구축하는 작업을 수행해야 할 것이다. 일정한 연구 방법이나 선택한 특정한 이론에 따라 체계적으로 연구한 결과물이 충분히 축적되어 있고, 수집한 언어 자료를 새로운 연구 방법을 적용하여 체계적으로 연구를 진행해 나간다면 보다 발전적인 결과를 얻을 수 있을 것이다.
여기에 제시하는 한국어의 한자 및 한문 표기 자료의 목록은 한국학자료센터와 한국학중앙연구원 장서각 한국고문서자료관, 국립중앙도서관, 서울대학교 규장각 한국학연구원 등의 홈페이지가 구축되어 있지 않았다면 그리고 홈페이지의 원문 이미지와 텍스트 보기의 작업이 없었다면 작성이 불가능했을 것이다. 각 기관의 홈페이지의 내용을 구축한 여러 사람들의 노고에 고마움을 표시하지 않을 수 없다.
필자는 이 책의 이용자들을 위해 나름대로 최선을 다해 원고를 충실하게 작성했다고 생각하지만 그럼에도 불구하고 새롭게 발견될 자료, 빠진 자료나 부족한 부분도 찾을 수 있을 것이다. 독자 여러분들이 보완하면서 사용하시길 바란다. 그리고 여기에 소개한 귀중한 자료들은 인류의 유형문화의 소중한 유산으로 영원히 안전하게 관리하여 남겨지기를 바란다.
아무튼 이 책이 빅 데이터나 대규모 균형 말뭉치를 구축할 때 또는 이두 사전, 구결 사전, 향찰 사전, 차자 사전 등을 편찬할 때 그리고 한국어학뿐만 아니라 경제사, 고기록학, 고고학, 고문헌학, 고문서학, 고전문학, 교육학, 금석학, 문서학, 문헌 정보학, 민속학, 번역학, 법제사, 사회학, 서예학, 서지학, 언어학, 역사학, 정보학, 한문학 등 한국학의 여러 관련 분야의 연구를 수행할 때에 기초 자료로 활용할 수 있기를 바라면서 글을 맺는다.
2024년 12월
박형익