Skip to content
View GalinaDaub's full-sized avatar
🎯
Focusing
🎯
Focusing

Block or report GalinaDaub

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
GalinaDaub/README.md

Здравствуйте 👋 Рада приветствовать Вас в моём профиле.

Вашему вниманию представляю мои наиболее интересные работы:

Проекты Описание Инструменты
Определение возраста по фотографиям покупателей (CV) В данном проекте построим нейросеть, определяющую возраст человека по фото. В процессе выполнения работы мы построим графики и исследуем возраст и его распределение, выведем примеры фотографий, а в конце построим функции для загрузки выборок и тренировки модели, с помощью с помощью отдельного gpu-тренажёра получим метрику mae равной 7. pandas, matplotlib, keras
Определение тарифа для телеком-компании В данном проекте мы выберем для телеком-компании лучший из двух тарифов. В процессе выполнения работы мы будем выводить таблицы, строить сводные таблицы и соединять таблицы друг с другом, всё это будем дополнять красочными и понятными графиками, а в конце воспользуемся статистикой - построим гипотезы и подтвердим их. pandas, matplotlib, scipy
Определение токсичных комментариев В начале проекта мы используем библиотеки re и nltk для очистки текста от лишних знаков и лемматизации, затем разделим выборки на трейн и валид, и с помощью TF-IDF проведём векторизацию текста. Обучим несколько моделей машинного обучения (в нашем проекте это логистическая регрессия, случайный лес и две модели градиентного бустинга), метрикой качества моделей будет F1. pandas, nltk, re, TF-IDF, sklearn, lightgbm, catboost, optuna
Определение токсичных комментариев с BERT В начале проекта мы создадим токенайзер и модель с помощью библиотеки transformers, затем произведём разбивку текста на эмбеддинги. Обучим несколько моделей машинного обучения (в нашем проекте это логистическая регрессия, случайный лес и две модели градиентного бустинга), метрикой качества моделей будет F1. pandas, pytorch, transformers, BERT, tqdm, sklearn, lightgbm, catboost, optuna
Выбор локации для скважины В данном проекте мы будем искать самую безубыточную локацию для разработки месторождения нефти. Для поиска лучшей локации мы будем использовать модель машинного обучения - линейную регрессию. . В проекте будем делать сводные таблицы, выводить графики, категоризировать признаки для анализа скважин, создадим и обучим модель линейной регрессии на тренировочной выборке, затем получим предсказания на валидационной. Метрикой в данном проекте будет RMSE. Также мы воспользуемся статистикой - рассчитаем прибыль каждой локации, максимальный риск убытков и 95%-й доверительный интервал. pandas, numpy, matplotlib, scipy, sklearn, Bootstrap

Pinned Loading

  1. just_funny just_funny Public

    Репозиторий для проектов с выдуманными целями и задачами. Просто для развлечения и от нечего делать :)

    Jupyter Notebook

  2. YaPracticum YaPracticum Public

    Здесь будут собраны самые интересные проекты, выполненные мной в процессе обучения в Яндекс Практикуме.

    Jupyter Notebook 1 1