본문 바로가기
AI/NLP

임베딩 기법

by okso6441 2022. 3. 20.
  TF-IDF Word2Vec FastText
그룹 백오브워즈 PMI  
특징 빈도 분포  
설명 해당 문서에만 나타나는 단어인지 판단
빈도Xlog(전체 문서 수/해당단어)
단어 쌍이 얼마나 자주 같이 등장
CBOW > < Skip-gram
네거티브 학습 
서브샘플링
Word2Vec 유사
n-gram
오타/미등록 단어 강건

'AI > NLP' 카테고리의 다른 글

(text) 데이터 증강 - Back translation(역번역)  (0) 2022.03.24
서브샘플링  (0) 2022.03.20
네거티브 학습  (0) 2022.03.20