728x90 java encoding2 [Java] java의 인코딩 Unicode, UTF-8, EUC-KR Unicode 이전 글에서 본 문제점을 해결하기 위해 국제 표준화 기구(IOS)는 표준화작업을 진행하였다. 유니코드는 유니코드 컨소시엄에서 표준을 제정하고, 문자 집합, 문자열 인코딩, 문자열 처리 방식, 문자 정보 데이터베이스 등을 제공한다. 유니코드의 경우 각 나라별로 자신의 언어가 속하고 있는 고유한 공간을 할당받는다. 한글의 경우에는 0xAC00부터 시작하여 11172 자의 공간을 차지한다. 모든 글자는 사전 순서대로 매핑되어있다. 즉, 유니코드는 숫자와 글자 키와 값이 1:1로 매핑된 형태의 코드이다. 저장 효율을 위해 언어에 따라 하나의 문자를 표현하는데 1~4byte를 사용한다. 이로인해 유니코드는 26개국에서 같은 데이터를 공유할 수 있게 되어, 표준 인코딩 기법이 되었다. 이전에 사용하던.. 2022. 7. 22. [Java] java의 인코딩 ASCII Code, Extend ASCII Code ASCII Code 아스키 코드는 1963년 미국 ANSI에서 표준화한 정보교환용 7비트 부호체계이다. 최상위 비트는 0으로 고정되어있고, 7bit를 사용하여 1Byte로 구성되어있다. 영어 알파벳과 특정 문자에 대해서 숫자와 1:1 매핑을 시켜놓은 것으로 한글을 포함한 다른 언어를 나타낼 수 없다. 그래서 유니코드가 등장했다. Extended ASCII Code ASCII 문자와 추가 문자를 포함하는 8 비트 부호체계이다. 2^8 = 256 개의 문자를 표현할 수 있다. ASCII control charachets : code 00~31 주변 기기들을 제어할 때 사용. ASCII Printable characters : code 32~127 인쇄 가능한 문자로 문자, 숫자, 구두점, 기타 기호 등을 나.. 2022. 7. 19. 이전 1 다음 728x90