알림마당

한글(한국어)세계화운동연합

HANGUL GLOBALIZATION MOVEMENT UNION

한글 자료실

28. 한글, 컴퓨터 코드는 어떻게 구성되었는가?

  • 한글세계화운동연합
  • 2018-04-03 22:31:00
  • 114.199.135.148
1바이트로 처리될 수 있는 영문자와는 달리 한글(음절)은 글자의 특성상 2바이트 이상의 부호 체계로 구성된다. 국가 표준화한 것이 KSC 5601이다. 국제표준화기구의 정보 교환용 부호 체계인 ISO 2022에 맞추어 1987년 처음 제정된 이 표준은 ‘완성형 한글 코드’로 불리며, 사용 빈도가 높은 한글 2,350자와 한자 4,888자 및 특수 문자 986자로 구성되어 있다.

 

이 체계는 제정 이후 행정 전산망 등에서 사용되었고, <윈도 95> 등 개인용 컴퓨터 운영 체계의 코드로도 사용될 정도로 힘을 가지게 되었다. 완성형 한글은 모든 한글 글자를 전부 지원하지는 못하며, 그 구성 방법도 한글 음절의 조합 원리에 맞지 않기 때문에, 민간에서 사용되던 코드 체계를 발전시켜 1992년 소위 ‘조합형 한글 코드’를 복수 표준화하였다.

 

조합형은 초성·중성·종성자들에 일정한 값(5비트로 정해짐)을 정해 두고, 여기에 한글 구분 비트를 보태어, 그 값들을 조합한 2바이트 값을 코드값으로 가진다. 이 부호계는 일부 문서처리기(워드프로세서)에서 내부 정보 처리 부호계로 사용되고 있다.

 

한편 세계 각국의 모든 문자를 한 체계 안에서 사용하기 위한 연구가 계속되어 ISO 10646-1이라는 국제표준부호계가 마련되었고, 우리 나라에서도 1995년 이를 국내표준(KS C 5700)으로 받아들였다.

 

이 부호계에서 한글 음절자 11,172자는 완성형으로 처리되며, 한글 옛 글자를 포함한 자소도 들어 있기 때문에 조합의 과정을 거쳐 거의 모든 한글 음절자를 구현할 수 있다. 이외에도 우리 문헌에 등장하는 구결자도 처리할 수 있으며, 한자도 2만여 자까지 쓸 수 있다. 장차 이 부호계는 컴퓨터 사용 환경에 등장하여 정보 처리나 정보 교환 등에서 편리하게 사용될 것으로 예상된다.

 

국가 표준으로써는 학술적인 용도로 사용하기에 충분하지 않기 때문에 민간에서 정보처리용으로 만들어 사용하는 부호계도 있다. (주)한글과컴퓨터사의 문서 처리기인 <글>의 부호계가 그 대표적인 것이다.

 

이 부호계는 KSC 5601-1992 조합형 체계를 기반으로 하여, 여기에 ISO 10646-1의 확장 기호를 비롯하여 한글 옛 글자와 소위 ‘확장 한자’ 10,880자까지 포함하고 있다. <글>은 문서 처리용으로만이 아니라 우리 문헌 자료의 입력 및 처리용으로도 사용되고 있다. 한국정신문화연구원의 ≪17세기 국어사전≫은 바로 이 체계로 입력 처리되고 출판까지 이루어졌다.

 

통일을 대비하여 ≪국어대사전≫을 편찬하고 있는 국립국어연구원에서는 이와는 별도로 모든 글자를 4바이트 체계로 처리하는 시스템을 개발하여 사전 편찬용으로 활용하고 있다.

 

<출처: 한국민족문화대백과>

 
게시글 공유 URL복사