Skip to content

Kaggleのタイタニック生存予測。特徴量エンジニアリングにより、テスト精度82.6%を達成。

Notifications You must be signed in to change notification settings

yuki-path-journey/Titanic_Survival_Analysis_Feature_Engineering

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

Titanic_Survival_Analysis_Feature_Engineering

Kaggleのタイタニック生存予測。特徴量エンジニアリングにより、テスト精度82.6%を達成。

🚢 タイタニック生存予測分析:特徴量エンジニアリングによる精度向上

🌟 プロジェクト概要

KaggleのTitanic生存予測チャレンジを通して、データ分析における**「特徴量エンジニアリング」**の重要性を証明することを目的としました。

🎯 達成した成果

  • 予測精度(テストデータ): 82.6% を達成 (目標80%クリア)。
  • 独自ロジック: 敬称、客室デッキ、家族サイズといった当時の社会的背景を考慮した特徴量を構築。

💡 最も重要な結論

ロジスティック回帰の係数分析により、当時の**「女性・子供優先」という社会的な救助ルール**が、データ分析によって明確に裏付けられました。

💻 使用技術とツール

  • Python, Pandas, Scikit-learn (Random Forest, Logistic Regression)
  • Google Colab (分析環境), Gemini (分析サポート)

🔗 詳細な分析プロセス

分析の全コードと考察(Chapter 1〜5)は、以下のNotebookファイルをご覧ください。 Titanic_Analysis.ipynb


(あなたのGitHub ID)

About

Kaggleのタイタニック生存予測。特徴量エンジニアリングにより、テスト精度82.6%を達成。

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published