Skip to content

AIHub-Cinemaster/movie-csv-preprocess

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

추천 시스템 데이터 전처리

추천 시스템을 이용하기 위하여 유저별 여러 영화에 대한 별점(rating)이 필요한데 해당 데이터가 MovieLens 데이터 밖에 없었다.
우리 프로젝트는 기본적으로 TMDB api를 사용하기 때문에 MovieLens 데이터의 영화 ID와 TMDB api 데이터의 영화 아이디를 매칭하는 csv를 새로 만들어 준다.

ratings_small.csv

movieLens 데이터로써 유저별 여러 영화의 별점을 매긴 데이터

image

links.csv

movieLens 데이터의 imdbid와 TMDB 데이터의 tmdbID를 연결하는 데이터
image

rating_tmdb_link.csv

pd.merge(links_df, ratings_df, on="movieId", ) 를 통해 위의 두 데이터를 movieId기준으로 merge를 진행한다
이 데이터가 최종 데이터고 추천 시스템에 사용한다

image

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages