유니코드 정규화 | NFC·NFD·자소 분리 해결
유니코드 텍스트를 NFC, NFD, NFKC, NFKD 형식으로 정규화하여 맥(Mac) 한글 자소 분리 현상과 텍스트 비교 오류를 해결하세요. 100% 브라우저 로컬 처리.
이 도구 사용 방법
- 1
원하는 정규화 형식을 선택하세요 (일반적인 웹 사용에는 NFC 권장).
- 2
텍스트를 입력 영역에 붙여넣으세요.
- 3
도구가 즉시 텍스트를 선택한 형식으로 변환합니다.
- 4
결과를 복사하세요. 통계에서 바이트 크기 변화도 확인할 수 있습니다.
사용 사례 및 예시
'맥(Mac) vs 윈도우' 파일 이름 문제 해결
macOS는 NFD(분해형)를 사용하는 반면 윈도우/리눅스는 NFC(결합형)를 사용합니다. 파일 이름을 NFC로 정규화하여 자소 분리 현상을 해결하고 호환성을 확보하세요.
데이터베이스 검색 및 인덱싱
인덱싱 전에 모든 사용자 입력과 저장된 데이터를 단일 형식(주로 NFC)으로 정규화하여 일관된 검색 결과를 보장하세요.
사용자 입력 정리
NFKC/NFKD를 사용하여 호환성 문자(예: ℍ를 H로, ½을 1/2로)를 분해하여 파싱 및 필터링을 용이하게 하세요.
정규화 형식 이해하기
NFC (정준 결합): 웹(W3C) 및 리눅스의 표준입니다. 가능한 경우 문자와 발음 구별 부호를 단일 코드 포인트로 결합합니다 (예: '한' = U+D55C).
NFD (정준 분해): macOS 파일 시스템에서 사용됩니다. 문자와 발음 구별 부호를 별도의 코드 포인트로 분리합니다 (예: '한' = ㅎ + ㅏ + ㄴ).
NFKC/NFKD (호환성): NFC/NFD와 유사하지만 호환성 문자도 정규화합니다 (예: 'fi' 합자를 'fi'로 변환). 주의: 이 변환은 손실이 발생할 수 있습니다.
자주 묻는 질문
Q.왜 텍스트가 똑같이 보이는데 비교하면 다르다고 나오나요?
A. 유니코드는 동일한 문자를 여러 방식으로 표현할 수 있습니다(예: 'é'를 단일 코드 포인트로 또는 'e' + '´'로). 정규화는 이러한 표현을 하나로 통일합니다.
Q.어떤 형식을 사용해야 하나요?
A. 대부분의 웹 애플리케이션과 데이터베이스에는 NFC가 표준 권장 사항입니다. macOS 파일 시스템을 구체적으로 다루는 경우 NFD를 사용하세요.
Q.NFKC는 모든 텍스트에 안전한가요?
A. 아니요. NFKC는 '호환성' 정규화이며 텍스트의 의미를 변경할 수 있습니다(예: 고유한 수학 기호를 일반 문자로 변환). 주의해서 사용하세요.
관련 도구
더 많은 개발자 도구를 둘러보세요
유니코드 이스케이프 인코더·디코더 | \uXXXX & \u{XXXXXX}
텍스트를 유니코드 이스케이프(\uXXXX 또는 \u{XXXXXX})로 인코딩하거나 텍스트로 디코딩합니다.
UTF-8 UTF-16 변환기 | 텍스트 인코딩·엔디안(LE/BE)
텍스트를 UTF-16 Hex 표현(LE/BE)으로 변환합니다.