Information Communication Technology/기타

Binary Code-Binary Code

반응형

유니 코드 (Binary Code)

유니 코드는 Uni Code로 불리며 1987년 베커와 콜린스, 데이비스가 문자 집합을 통일되게 만들면서 생겨난 국제 다 언어 문자 인코딩 시스템이다.

컴퓨터 전문가, 언어 학자와 같은 그룹이 다양한 문자 표준이 되기 위해 만들어 졌으며 텍스트 인코딩에 널리 사용된다.

Unicode는 세계 각국의 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 코드 규약의 이름이고 목적은 문자 인코딩 방법들을 모두 Uni code로 바꾸는 것이다.

8비트 문자 코드인 영어 문자 집합의 시발점인 ASCII 코드의 한계점을 유니코드는 보안했다. ASCII 코드로 표현 가능한 문자의 종류의 경우의 수는 128가지이고, 오류를 검사하는 parity bit 한 칸을 추가하여 8bits로 binary code화해서 바이트 단위의 전송이 가능하며 16bits로 확장해서 여러 나라, 즉 모든 세계의 모든 언어, 문자를 표현하는 표준 코드이다. 하지만 문제가 있다.

ASCII 코드로 여러 각국의 언어들을 표현해야 하는 점이다. 8bits로 표현할 수 있는 256자는 영어를 사용하는 나라나 라틴 권 나라 등에서는 8bits로 표현 가능하나 한국, 중국, 아랍 권 등의 다양한 문자들을 8bits 표현하는 데는 한계가 존재한다. 중국은 문자가 1만개가 넘는다. 또한 각각의 나라마다 동일한 코드 값에 다른 글자를 쓰는 방법으로는 국제와 국제간의 올바른 자료 교환이 가능하기 않기 때문에 코드를 16bits 형식으로 넓혀서 대략 65,000자의 영역 안에 모든 나라의 모든 글자를 표시할 수 있도록 하는 표준안이다. 이러한 유니코드에도 단점이 존재한다. 데이터의 용량이 늘어난다는 단점이 존재하여 주로 문서 교화, 통신 분야에서 사용된다. 그럼에도 유니코드를 이용하면 프로그램을 만들면 모든 세계의 글자를 사용하고 처리할 수 있기 때문에 효율적이고 많은 장점을 볼 수 있다. 그렇기에 다국어 환경에 능하다. Uni 코드 인코딩 방식은 UTF-8, UTF-16, UTF-32 인코딩이 있다. 문자 인코딩 표준은 각 문자의 id와 숫자 값 도는 코드 포인트 뿐만 아니라 값이 비트로 표현되는 방식도 정의된다. Uni 코드 표준은 동일한 데이터를 바이트로 그리고 워드 또는 더블 워드 방식으로 세 가지 인코딩 형식을 정의된다. UTF-8은 HTML과 같은 유사한 프로토콜에 널리 사용되며 유니 코드 문자를 바이트의 가변 길이 인코딩으로 변환하는 방법이다. UTF-16은 문자에 대한 효율적인 엑세스와 경제적인 storage 사용의 균형을 유지해야하는 환경에서 사용된다. UTF-32는 고정 너비, 문자에 대한 단일 코드 단위 액세스가 필요한 경우에 사용된다. UTF-8, UTF-16, UTF-32 세 가지 인코딩 방법들은 각 문자에 대해 최대 32bits의 데이터가 필요하다. 이 외에도 다양한 문자 인코딩 방식들이 존재한다.

반응형

'Information Communication Technology > 기타' 카테고리의 다른 글

Binary Code-Hamming Code  (0) 2022.10.25
Binary Code-EBCDIC  (0) 2022.10.25
Docx word 문서 PDF로 저장하기  (0) 2022.10.24
OneDrive 동기화 백업 해제  (0) 2022.10.23
한글 문서 PDF로 저장  (0) 2022.10.23