| TF-IDF | Word2Vec | FastText | |
| 그룹 | 백오브워즈 | PMI | |
| 특징 | 빈도 | 분포 | |
| 설명 | 해당 문서에만 나타나는 단어인지 판단 빈도Xlog(전체 문서 수/해당단어) |
단어 쌍이 얼마나 자주 같이 등장 CBOW > < Skip-gram 네거티브 학습 서브샘플링 |
Word2Vec 유사 n-gram 오타/미등록 단어 강건 |
'AI > NLP' 카테고리의 다른 글
| (text) 데이터 증강 - Back translation(역번역) (0) | 2022.03.24 |
|---|---|
| 서브샘플링 (0) | 2022.03.20 |
| 네거티브 학습 (0) | 2022.03.20 |