문자 집합 감지기 | 인코딩 확인·BOM·UTF-8
파일의 문자 인코딩(UTF-8, UTF-16, ASCII 등)을 자동으로 감지하고 BOM(Byte Order Mark) 포함 여부를 확인하세요. 글자 깨짐(Mojibake) 해결을 위한 무료 도구.
이 도구 사용 방법
- 1
파일을 업로드 영역에 드래그 앤 드롭하거나 클릭하여 선택하세요.
- 2
도구가 즉시 파일 헤더와 내용을 분석합니다.
- 3
감지된 인코딩, 신뢰도 점수 및 BOM 존재 여부를 확인하세요.
- 4
이 정보를 사용하여 에디터나 애플리케이션에서 파일을 올바르게 여세요.
사용 사례 및 예시
깨진 텍스트(Mojibake) 수정
손상된 파일이 실제로 UTF-8인지, ISO-8859-1인지, 아니면 Windows-1252인지 확인하여 올바르게 디코딩할 수 있습니다.
데이터 파이프라인 검증
고객에게 보내기 전에 시스템에서 생성된 파일이 올바른 인코딩과 BOM 설정을 가지고 있는지 확인하세요.
코드베이스 마이그레이션
모든 것을 UTF-8로 변환하기 전에 소스 코드 파일을 스캔하여 레거시 인코딩을 식별하세요.
문자 집합 감지 원리
바이트 분석: 도구는 파일의 원시 바이트 패턴을 읽어 인코딩을 추측합니다.
BOM 확인: 시작 부분에서 BOM(Byte Order Mark)을 찾습니다 (예: UTF-8의 경우 `EF BB BF`).
유효성 검사: UTF-8, ASCII 및 기타 일반적인 인코딩 규칙에 대해 바이트 시퀀스를 검증합니다.
자주 묻는 질문
Q.내 파일이 서버로 업로드되나요?
A. 아니요. 분석은 자바스크립트를 사용하여 브라우저에서 전적으로 이루어집니다. 파일 데이터는 기기를 벗어나지 않습니다.
Q.모든 인코딩을 감지할 수 있나요?
A. UTF-8, UTF-16, ASCII와 같은 일반적인 인코딩을 안정적으로 감지합니다. 레거시 단일 바이트 인코딩(예: Windows-1252 대 ISO-8859-1)의 경우 감지는 최선의 추정치입니다.
Q.BOM이란 무엇인가요?
A. BOM(Byte Order Mark)은 텍스트 파일의 시작 부분에 있는 숨겨진 문자로, 인코딩과 엔디안을 식별합니다. UTF-8에서는 선택 사항이지만 Windows 파일에서는 일반적입니다.
관련 도구
더 많은 개발자 도구를 둘러보세요
UTF-8 ISO-8859-1 변환기 | Latin-1·인코딩·글자 깨짐
텍스트를 ISO-8859-1 Hex 표현으로 변환합니다.
UTF-8 UTF-16 변환기 | 텍스트 인코딩·엔디안(LE/BE)
텍스트를 UTF-16 Hex 표현(LE/BE)으로 변환합니다.