Skip to content

케글의 스마트폰 정보 데이터셋을 활용하여 데이터 분석 및 회귀 모델 학습, 이를 활용하여 서비스를 제안하는 프로젝트입니다.

Notifications You must be signed in to change notification settings

cbnuLeehyunwoo/Smartphone-Insight

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 

Repository files navigation

충북대학교 오픈소스개발프로젝트


오픈소스 API를 활용한 데이터 수집 및 분석을 목표로 한 기말 프로젝트

⏲ 프로젝트 기간

2024.11.12 ~ 2024.12.08

📁📋 데이터셋: 2017~2024년 11월 까지의 스마트폰 정보(제조사, 가격, RAM, OS, CPU.. 등등)

https://www.kaggle.com/datasets/jakubkhalponiak/phones-2024

이상치 처리 및 결측치 제거:

  1. 태블릿 데이터 제외
  2. cubot사의 Cubot KingKongX 스마트폰 제외(배터리 크기가 너무 크게 출시됨, 평균값의 두배 이상)
  3. CPU 데이터가 사진처럼 문자열로 되어있었기 때문에
    image
    정규 표현식을 통해 CPU의 총 클럭을 숫자로 변환하는 과정에서 문자로만 표현된 행들에 대한 처리를 고민하다가 제외하기로 결정(36개 데이터) image

데이터 분석

가격과 변수들 간의 관계를 회귀선을 포함한 산점도로 표현

  1. 가격과 CPU 성능과의 관계
    image

  2. 가격과 배터리 간의 관계
    image

  3. 가격과 스마트폰 무게와의 관계 image

  4. 가격과 화면 크기와의 관계
    image

  5. 가격과 램의 관계
    image

  6. 가격과 저장공간의 관계
    image

OS 별로 그룹화하여 각 컬럼의 평균을 막대그래프로 표현 iOS, Android, Others iOS, Android 외의 OS는 표본이 너무 적기 때문에Others 그룹으로 그룹화(Harmony OS, EMUI)

  1. OS별 개수
    image

  2. OS별 평균 램
    image

  3. OS별 평균 OS
    image

  4. OS별 평균 CPU 속도
    image

  5. OS별 평균 가격
    image

  6. OS별 가격 표준편차
    image

머신러닝

종속변수: ram, storage, battery, weight, cpu_speed, display_size
독립변수: price_usd
단항회귀 그래프 및 성능평가
image image

다항회귀 그래프(2차) 및 성능평가
image image

다항회귀의 성능이 더 우수한 것을 알 수 있으며 Project_Machine.py 파일에는 현재 다항회귀가 구현되어있음

응용 방향 설계

어플리케이션 Smartphone-insight 설계 제안 본 애플리케이션은 출시된 스마트폰의 정보를 기반으로 다음과 같은 기능을 수행한다

  1. 스마트폰 스펙을 입력하면 해당 조건에 맞는 스마트폰 추천
  2. 스펙과 가격을 입력하면 해당 가격의 합리성 여부 분석, 합리적이지 않다면 합리적인 제품들 추천
  3. 향후 출시될 스마트폰의 가격 예측

About

케글의 스마트폰 정보 데이터셋을 활용하여 데이터 분석 및 회귀 모델 학습, 이를 활용하여 서비스를 제안하는 프로젝트입니다.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages