지구상에는 수많은 국가와 민족이 있는 만큼 수많은 언어와 문자가 존재합니다.
이러한 언어와 문자를 컴퓨터상에서 표현할 때 서로 다른 문자집합(Character set)과 인코딩(encoding)방식을 사용하게 됩니다. 이로 인해 국가간, 기관간 자료의 상호교환이나 동시 여러개의 언어를 입력하고자 할 때 문제가 됩니다.
우리나라는 KSC5601문자집합을 사용하고 있으나 중국은 GB2312, 일본은 JISX0212를 사용하고 있습니다.
따라서 각국에서 작성한 문서나 자료를 서로 교환하여 보고자 할때 글자가 깨져보이는 문제가 발생합니다.
이로 인해 이를 통합하고자하는 노력이 유니코드(UNICODE)로 나타나게 됩니다. 유니코드는 16bit영역안에 모든 문자를 표현하게 됩니다. 따라서 이론적으로 65536개만큼의 문자를 표현할 수 있습니다.
이러한 세계 표준 문자집합을 만들려고 하는 시도는 국제표준화기구(ISO)에서도 있었습니다. 다행히 이는 1991년에 하나로 통일됩니다. 이 표준안의공식명칭은 ISO/IEC 10646입니다.