Галина Дауб GalinaDaub

Здравствуйте 👋 Рада приветствовать Вас в моём профиле.

⚡ Вашему вниманию представляю мои наиболее интересные работы: ⚡

Проекты	Описание	Инструменты
Определение возраста по фотографиям покупателей (CV)	В данном проекте построим нейросеть, определяющую возраст человека по фото. В процессе выполнения работы мы построим графики и исследуем возраст и его распределение, выведем примеры фотографий, а в конце построим функции для загрузки выборок и тренировки модели, с помощью с помощью отдельного gpu-тренажёра получим метрику mae равной 7.	pandas, matplotlib, keras
Определение тарифа для телеком-компании	В данном проекте мы выберем для телеком-компании лучший из двух тарифов. В процессе выполнения работы мы будем выводить таблицы, строить сводные таблицы и соединять таблицы друг с другом, всё это будем дополнять красочными и понятными графиками, а в конце воспользуемся статистикой - построим гипотезы и подтвердим их.	pandas, matplotlib, scipy
Определение токсичных комментариев	В начале проекта мы используем библиотеки re и nltk для очистки текста от лишних знаков и лемматизации, затем разделим выборки на трейн и валид, и с помощью TF-IDF проведём векторизацию текста. Обучим несколько моделей машинного обучения (в нашем проекте это логистическая регрессия, случайный лес и две модели градиентного бустинга), метрикой качества моделей будет F1.	pandas, nltk, re, TF-IDF, sklearn, lightgbm, catboost, optuna
Определение токсичных комментариев с BERT	В начале проекта мы создадим токенайзер и модель с помощью библиотеки transformers, затем произведём разбивку текста на эмбеддинги. Обучим несколько моделей машинного обучения (в нашем проекте это логистическая регрессия, случайный лес и две модели градиентного бустинга), метрикой качества моделей будет F1.	pandas, pytorch, transformers, BERT, tqdm, sklearn, lightgbm, catboost, optuna
Выбор локации для скважины	В данном проекте мы будем искать самую безубыточную локацию для разработки месторождения нефти. Для поиска лучшей локации мы будем использовать модель машинного обучения - линейную регрессию. . В проекте будем делать сводные таблицы, выводить графики, категоризировать признаки для анализа скважин, создадим и обучим модель линейной регрессии на тренировочной выборке, затем получим предсказания на валидационной. Метрикой в данном проекте будет RMSE. Также мы воспользуемся статистикой - рассчитаем прибыль каждой локации, максимальный риск убытков и 95%-й доверительный интервал.	pandas, numpy, matplotlib, scipy, sklearn, Bootstrap

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Галина Дауб GalinaDaub

Block or report GalinaDaub

Здравствуйте 👋 Рада приветствовать Вас в моём профиле.

Pinned Loading

Uh oh!