[python]programmers-뉴스클러스터링(자카드 유사도)
2018 KAKAO BLIND RECRUITMENT 문제 : 뉴스 클러스터링 입력되는 두개의 문자열의 자카드 유사도를 계산하는 문제이다. 입력되는 문자열을 두글자씩 끊어야 한다(HELLO -> HE, EL, LL, LO) 예를들어 입력된 문자열을 두글자씩 끊었을 때 str1 = {aa, aa, ab, bb, bc}, str2 = {aa, aa, ab, ab, bb}라고 해보자. str1 | str2 (합집합) = {aa, aa, ab, ab, bb, bc} str1 & str2 (교집합) = {aa, aa, ab, bb} 일반 집합의 합/교집합 결과와 다르게, 만약 aa가 두 문자열에 두번 나타나면 aa 두개가 합집합, 교집합에 들어간다. 만약 str1에는 ab가 2개, str2에는 ab가 하나라면, 교..
2020. 11. 30.