티스토리 뷰

Programming/JAVA

JAVA 한글 인코딩 글자별 변환

다루사무 2020. 12. 24. 01:21
반응형

글짜깨진모양을 보고 인코딩 변환을 파악하는 방법

1. ???가 많이 있으면 두번 인코딩되었다는 것이다.

2. A깨진게 있으면 euc-kr로 해야 한다.

3. ؽºÆ 등 분수표시 발음기호가 있으면 ==> "EUC-KR" 대신 "8859_1" 로 바꾼다.
  즉 "문자열".getBytes("EUC-KR") 에서 EUC-KR 이 아니라
  "8859_1" 로 하여야 한다.

4. 네모,마름모 글자가 많다.<가령: ���由고�� >
  UTF-8의 원문의 데이터를 MS949,euc-kr,로 읽어서 그렇다.

5. 검정색 마름모 물음표 들어간 문자가 많다면<가령: ◆와?의 결합 >
   원문은 euc-kr인데 UTF-8으로 보고 읽어서 그렇다.
   이클립스를 닫고 euc-kr로 다시 열면 된다.
   charset=UTF-8으로 되있으면 euc-kr로 울트라에디터에서 바꾼다.

6. 쩔징쨌짱 등의 된소리 글자로 보인다.
   이경우는 울트라에디터의 오류에 의한 글자이다.
   즉, UTF-8이 아닌 AnsiAscii포맷의 글자를 읽어올때 UTF-8방식으로 읽어버린 후
   유니코드로 저장해 버린경우이다. 이경우 다시 복구하려면? 대책이 없을 듯,아마도, bak파일 찾아서 고쳐야 한다.
   울트라에디터로 열었을때 한글부분이 하얗게 보이거나 점으로보인 후 저장하면 그렇게 될 수 있다.
   특히 UTF-8이 아닌 데 encode=UTF-8이라고 포함된 글자가 있으면 그러한 현상이 발생되는 듯 하며 음...
   이런 문제를 고치기 위해서는 다른 편집기를 이용해야 할 듯 함.

7. 물음표 거꾸로된것과 느낌표 거꾸로된 글자가 있다.
   Ansi ascii인데 울트라에디터에서 유니코드로 읽어서 그렇다.
   이경우 저장하면 6처럼 된다.
   notepadplusplus를 이용하여 ansi폴더에 있는 실행파일 클릭하여 열어서 바꾸고 저장하면된다.

'Programming > JAVA' 카테고리의 다른 글

JAVA split 시 공백 포함  (0) 2019.02.11
json-lib 2.3과 필요 의존 라이브러리  (0) 2018.11.06
JEUS , WebtoB 기본  (0) 2015.01.02
BASE64 인코딩 디코딩  (0) 2014.12.18
자바로 경고창 띄우기  (0) 2014.01.07
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
글 보관함