편집 기록

프로필 김민혁님의 편집

날짜2022.10.07
word2vec에 관련된 질문입니다.

python

nlp

word2vec
안녕하세요 물어볼 수 있는 곳이 처음이라 질문이 많아요 알려주시면 감사해요. 영화리뷰를 가지고 평점을 예측하는 것을 만들어보고 있는데 x_train = 리뷰 데이터 y_train = 평점 데이터를 사용했습니다.

train 데이터와 test 데이터를 따로 만들었을 때 토크나이저를 각자의 데이터를 사용해서 하는게 맞나요?

word2vec을 처음 사용해보는데 train과 test의 리뷰 데이터를 토큰화 시켜 패딩을 진행하여 train = (4352,188) test= (1089,188) 이란 행렬값으로 word2vec에 넣으면 오류가 생기고 패딩을 안한 값을 넣어야만 돌아가는데 word2vec은 패딩을 하고 돌리면 실행이 안되나요?

그래서 정수로 바꾼 값으로 word2vec을 돌리면 x_train의 행 데이터가 4352 -> 6513으로 늘어나는데 그럼 y_train의 행 숫자와 달라져서 rnn과 같은 모델에 넣질 못하느데 어떻게 해결하나요
프로필 nowp님의 편집

날짜2022.10.07
word2vec에 관련된 질문입니다.

python

nlp

word2vec
안녕하세요 물어볼 수 있는 곳이 처음이라 질문이 많아요 알려주시면 감사해요. 영화리뷰를 가지고 평점을 예측하는 것을 만들어보고 있는데 x_train = 리뷰 데이터 y_train = 평점 데이터를 사용했습니다.

train 데이터와 test 데이터를 따로 만들었을 때 토크나이저를 각자의 데이터를 사용해서 하는게 맞나요?

word2vec을 처음 사용해보는데 train과 test의 리뷰 데이터를 토큰화 시켜 패딩을 진행하여 train = (4352,188) test= (1089,188) 이란 행렬값으로 word2vec에 넣으면 오류가 생기고 패딩을 안한 값을 넣어야만 돌아가는데 word2vec은 패딩을 하고 돌리면 실행이 안되나요?

그래서 정수부여만 된 값으로 word2vec을 돌리면 데이터가 4352 -> 6513으로 늘어나는데 그럼 y_train 의 행이 달라져서 rnn과 같은 모델에 넣질 못하느데 어떻게 해결하나요
프로필 김민혁님의 편집

날짜2022.10.07
word2vec에 관련된 질문입니다.

python
안녕하세요 물어볼 수 있는 곳이 처음이라 질문이 많아요 알려주시면 감사해요 영화리뷰를 가지고 평점을 예측하는 것을 만들어보고 있는데 x_train = 리뷰 데이터 y_train = 평점 데이터를 사용했습니다.

train 데이터와 test 데이터를 따로 만들었을 때 토크나이저를 각자의 데이터를 사용해서 하는게 맞나요?

word2vec을 처음 사용해보는데 train과 test의 리뷰 데이터를 토큰화 시켜 패딩을 진행하여 train = (4352,188) test= (1089,188) 이란 행렬값으로 word2vec에 넣으면 오류가 생기고 패딩을 안한 값을 넣어야만 돌아가는데 word2vec은 패딩을 하고 돌리면 실행이 안되나요?

그래서 정수부여만 된 값으로 word2vec을 돌리면 데이터가 4352 -> 6513으로 늘어나는데 그럼 y_train 의 행이 달라져서 rnn과 같은 모델에 넣질 못하느데 어떻게 해결하나요

편집 기록

편집 기록

프로필 김민혁님의 편집

날짜2022.10.07

word2vec에 관련된 질문입니다.

python

nlp

word2vec

프로필 nowp님의 편집

날짜2022.10.07

word2vec에 관련된 질문입니다.

python

nlp

word2vec

프로필 김민혁님의 편집

날짜2022.10.07

word2vec에 관련된 질문입니다.

python