#search-algorithm
#learning-to-rank
#information-retrieval
웹에는 수많은 문서가 있고, 우리는 이제 세상에 존재하는 거의 모든 정보를 검색할 수 있게 되었습니다. 그래서 더 중요해진 질문은 “그 많은 정보 중에서 내가 원하는 정보를 어떻게 찾을 것인가”입니다. 단순하게 생각하면, 내가 검색한 플라톤이라는 키워드를 포함하는...
더 읽기 →
#tf-idf
#bm25
#word2vec
#rnn
#transformer
자연어 처리(NLP)는 텍스트를 숫자로 표현하고, 그 숫자 사이의 관계를 학습해 의미 있는 결과를 만드는 분야입니다. 이 글에서는 TF-IDF와 BM25 같은 전통적인 검색 기법부터 Word2Vec, RNN, Attention, Transformer까지 큰 흐름을...
더 읽기 →
#paper-review
#self-attention
#speaker-recognition
이 글은 논문 Self-attention encoding and pooling for speaker recognition을 바탕으로 작성한 리뷰입니다. 개요 발성 데이터에서 모든 프레임이 똑같이 중요한 것은 아닙니다. 어떤 프레임은 화자를 구분하는 데 더 큰 정보...
더 읽기 →