국어사 말뭉치의 활용 현황과 향후 과제

Improving the Construction and Utilization of Korean Historical Corpora

초록

이 글에서는 국어사 말뭉치가 어떻게 활용되어 왔는지를 살펴보고, 앞으로 국어사 말뭉치를 구축하는 데 있어 고려해야 할 사항과 함께 국어사 말뭉치 활용 방안에 대한 관견을 제시하고자 하였다. 인문학의 다른 분야에 비하면 국어사 분야의 전산화는 비교적 이른 편이었으나, 주로 원시말뭉치가 구축되었고 단순 검색이나 사전 편찬에 활용되는 데 그쳤다. 앞으로 구축에 있어서는 국제적인 표준에 의거하여, 시공간의 제약을 받지 않는 방식으로 말뭉치의 구축과 보완이 활발하게 이루어져야 한다. 활용에 있어서는 국어사 및 인접분야 연구나 어휘역사정보 구축은 물론이고, 더 나은 형태소 분석기와 콘코던서의 개발, 머신러닝/딥러닝 학습 등을 위해 활용할 필요가 있다. 구축․보완되는 말뭉치의 접근과 사용은 오픈 사이언스․오픈 데이터라는 관점에서 반드시 개방적으로 이루어져야 한다.

키워드

국어사말뭉치옛말사전어휘역사정보XMLTEI일본어역사말뭉치오픈 사이언스오픈 데이터어듸메kohico광학문자인식다언어언어모델history of Korean languagecorpuspre-modern Korean dictionaryinformation for lexical historyXMLTEICorpus of Historical Japanese (CHJ)open scienceopen dataeoduimekohicooptical character recognition (OCR)multilingual language model
제목
국어사 말뭉치의 활용 현황과 향후 과제
제목 (타언어)
Improving the Construction and Utilization of Korean Historical Corpora
저자
허인영
DOI
10.14727/khl.2023.36.111
발행일
2023-04
유형
Y
저널명
국어사연구
36
페이지
111 ~ 143