타니모토 계수는 두 집합간의 유사도를 측정한다.
하지만 아이템에 선호도의 점수는 보지 않으며 아이템이 존재하는지(선호하는지) 여부만 체크하게 된다.
Mathematical Expression
Code
c는 a와 b의 교집합이다.
def tanimoto(a,b):
c=[v for v in a if v in b]
return float(len(c))/len(a)+len(b)-len(c)
Result
결과값이 0이면 유사한 아이템이 전혀 없다는것이고 1이면 100% 아이템이 유사하다는 의미다.
타니모토 계수는 여러집합군중에서 유사한 집합을 분류하고 그 집합내의 유사도를 구하여 유사한 집합간의 아이템을 추천해주는곳에 사용될 수 있다.