워드 투 벡터 (Word2Vec)
텍스트를 수치화시키기 위해 기존 마이닝, 학습시키기 위해서 인코딩 방법을 사용 그 중, 원-핫 인코딩은 단어 집합의 크기를 벡터의 크기로 표현하고, 표현하고자 하는 단어의 인덱스에 1 값을 부여하고 나머지는 0으로 표현하는 벡터 표현 방식 예를 들면, 단어 집합이 다음과 같이 있다고 치자. "고양이, 예쁨, 강아지, 귀여움, ... 기타, 플레이 " 중략된 단어를 포함하여 단어가 100개가 있을 때, 고양이 하나의 단어 하나에 대한 원 핫 인코딩은 다음과 같다. [ 1 0 0 0 0....(중략).... 0 0 0 ] 맨 처음 고양이에 대한 인덱스 1이고 나머지는 0으로 표현 예쁨을 표현하기 위한 원핫 인코딩은 다음과 같다 [ 0 1 0 0 0 ... (중략) ... 0 0 0] ※ 이렇게 데이터 표현을..