상세 보기
국어사 말뭉치의 활용 현황과 향후 과제
Improving the Construction and Utilization of Korean Historical Corpora
초록
이 글에서는 국어사 말뭉치가 어떻게 활용되어 왔는지를 살펴보고, 앞으로 국어사 말뭉치를 구축하는 데 있어 고려해야 할 사항과 함께 국어사 말뭉치 활용 방안에 대한 관견을 제시하고자 하였다. 인문학의 다른 분야에 비하면 국어사 분야의 전산화는 비교적 이른 편이었으나, 주로 원시말뭉치가 구축되었고 단순 검색이나 사전 편찬에 활용되는 데 그쳤다. 앞으로 구축에 있어서는 국제적인 표준에 의거하여, 시공간의 제약을 받지 않는 방식으로 말뭉치의 구축과 보완이 활발하게 이루어져야 한다. 활용에 있어서는 국어사 및 인접분야 연구나 어휘역사정보 구축은 물론이고, 더 나은 형태소 분석기와 콘코던서의 개발, 머신러닝/딥러닝 학습 등을 위해 활용할 필요가 있다. 구축․보완되는 말뭉치의 접근과 사용은 오픈 사이언스․오픈 데이터라는 관점에서 반드시 개방적으로 이루어져야 한다.
키워드
국어사; 말뭉치; 옛말사전; 어휘역사정보; XML; TEI; 일본어역사말뭉치; 오픈 사이언스; 오픈 데이터; 어듸메; kohico; 광학문자인식; 다언어언어모델; history of Korean language; corpus; pre-modern Korean dictionary; information for lexical history; XML; TEI; Corpus of Historical Japanese (CHJ); open science; open data; eoduime; kohico; optical character recognition (OCR); multilingual language model
- 제목
- 국어사 말뭉치의 활용 현황과 향후 과제
- 제목 (타언어)
- Improving the Construction and Utilization of Korean Historical Corpora
- 저자
- 허인영
- 발행일
- 2023-04
- 유형
- Y
- 저널명
- 국어사연구
- 호
- 36
- 페이지
- 111 ~ 143