시스템 프로그래밍

2-1 Windows의 유니코드(UNICODE)

CalebHong 2022. 5. 4. 11:15

문자셋의 종류와 특성

* SBCS(Single Byte Character Set)

 - 문자를 표현하는데 1바이트 사용

 - 대표적인 예는 ASCII 코드

 

* MBSC(Multi Byte Character Set)

 - 문자열을 구성하는 내용에 따라 다른 크기의 바이트 사용

 - 예를 들어 한글은 2바이트, 영문은 1바이트 사용

 - 문자열에 영어와 한글이 섞여 있을 경우 개발자의 실수 여부가 있음

 

* WBCS(Wide Byte Character Set)

 - 문자를 표현하는데 2바이트 사용

 - 대표현인 예는 UNICODE

 - 실수 여부를 해소

 

WBCS 기반의 프로그래밍

* WBCS를 위한 3가지

 1) char를 대신하는 wchar_t

 2) "ABC" 를 대신하는 L"ABC"

 3) WBCS 기반의 문자열 입출력 함수 사용

 

* WBCS 기반 문자열 선언 예

 - wchar_t str[] = L"ABC";

 

* 매개변수 전달인자 유니코드화

int wmain(int argc, wchar_t* argv[])