텍스트 유사도 검사기 | 문자열 비교 및 레벤슈타인 거리 계산

텍스트브라우저에서 실행(업로드 없음)

정밀 비교 수학적 모델을 사용하여 두 텍스트가 얼마나 유사한지 수치화합니다.

측정 지표 레벤슈타인 거리 · 자카드 지수 · 유사도 %

💡 실시간 모드: 입력하는 대로 자동으로 결과가 업데이트됩니다.

Text 1

Text 2

출력

Loading…

Levenshtein 거리와 같은 알고리즘을 사용하여 두 텍스트 입력 간의 유사도를 계산하세요.

이 도구 사용 방법

다시 쓰거나 의역한 내용이 원본 소스와 너무 가까운지 확인하세요.

중복된 데이터베이스 항목이나 유사한 코드 조각을 식별하세요.

기계 번역 결과와 참조 번역을 비교하여 품질을 평가하세요.

레벤슈타인 거리(Levenshtein Distance): 한 단어를 다른 단어로 바꾸는 데 필요한 최소한의 단일 문자 편집(삽입, 삭제 또는 대체) 횟수입니다.

자카드 유사도(Jaccard Similarity): 두 집합의 교집합 크기를 합집합 크기로 나눈 값으로, 유한 샘플 집합 간의 유사성을 측정합니다.

이 도구는 이러한 지표를 결합하여 포괄적인 유사도 점수를 제공합니다.

A. 두 시퀀스 간의 차이를 측정하는 지표입니다. 쉽게 말해, 한 단어를 다른 단어로 바꾸기 위해 몇 번의 수정이 필요한지를 나타냅니다.

A. 네, 기본적으로 'Apple'과 'apple'은 다른 것으로 간주됩니다. 비교하기 전에 텍스트를 소문자로 변환하여 일관성을 유지할 수 있습니다.

A. 브라우저에서 실행되므로 기기의 메모리에 따라 다릅니다. 매우 긴 텍스트(MB 단위)의 경우 속도가 느려질 수 있습니다.