deep understanding

남의 말만 옮긴다는 생각이 든다면 당신은 아직 전문가가 아니다.

http://www.polyu.edu.hk/obe/students/files/deep.pdf

스크린샷 2014-09-23 오후 4.38.15

Advertisements

[Math] 유사도 계산

두 특징 Vector의 유사도를 수치화 시키기 위해서는 어떻게 해야 할까?

Vector의 내적에 대해 알아 보도록 하자.

a, b 두 벡터의 내적은 다음과 같다.

\mathbf a \cdot \mathbf b = |\mathbf a| \cdot |\mathbf b| \cos \theta

cosine 함수는 다음과 같은데

두 vector가 같은 방향을 바라보고 있으면(각도가 0 degree)

내적이 가장 큰 값이 나올 것이다. (max value of inner product between a and b)

서로 다른 방향을 보고 있다면 (각도가 180 degree) 내적은 음수가 나올 것이며 가장 작은 값을 가지게 된다.

각 vector a, b에 대한 정규화(normalize) 된 unit vector의 내적은 -1부터 1까지 값을 가지게 된다.

정규화된 두 벡터의 유사도로 정의할 수 있다.

[Search] sphinx install on Ubunto

스핑크스 설치
http://www.semicolon.co.za/mysql_tutorials/installing-sphinx-full-text-search-on-linux.html

-> 오류가 나면 해당하는 폴더가 만들어 지지 않아서 그런 것이다.

mysql server 설치
ㅇ apt-get install mysql-server

sphinx.conf에 index를 걸어야 하는 query에 대해 지정한 뒤에

1. indexer 실행

2. searchd(데몬)이 실행 되어있는지 확인 한 뒤에
search $param

을 통해서 indexing이 정상적으로 동작하는지 확인한다.