이렇게 표현된 원-핫 벡터는 만약 단어가 20,000개라면 1개만 1이고, 19,999개의 0으로 표현되므로 희소 벡터*이고 벡터를 저장하기 위해 필요한 공간이 계속 늘어나므로 공간의 낭비가 발생하고 컴퓨터의 성능이 저하됩니다. 다른 말로 단어의 갯수만큼 차원 벡터가 만들어 진다고 표현할 수 있습니다.
또 다른 문제는 단어의 유사도를 표현하지 못한다는 것입니다. 사과, 복숭아, 레몬, 바나나라는 4개의 단어에 대해 원-핫 인코딩을 진행해 각각 [1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0], [0, 0, 0, 1]이라는 원-핫 벡터를 생성했다고 하면, 사과와 복숭아가 유사하고, 레몬과 바나나가 유사하다는 것을 표현할 수 없습니다.