⚡ Вашему вниманию представляю мои наиболее интересные работы: ⚡
| Проекты | Описание | Инструменты |
|---|---|---|
| Определение возраста по фотографиям покупателей (CV) | В данном проекте построим нейросеть, определяющую возраст человека по фото. В процессе выполнения работы мы построим графики и исследуем возраст и его распределение, выведем примеры фотографий, а в конце построим функции для загрузки выборок и тренировки модели, с помощью с помощью отдельного gpu-тренажёра получим метрику mae равной 7. | pandas, matplotlib, keras |
| Определение тарифа для телеком-компании | В данном проекте мы выберем для телеком-компании лучший из двух тарифов. В процессе выполнения работы мы будем выводить таблицы, строить сводные таблицы и соединять таблицы друг с другом, всё это будем дополнять красочными и понятными графиками, а в конце воспользуемся статистикой - построим гипотезы и подтвердим их. | pandas, matplotlib, scipy |
| Определение токсичных комментариев | В начале проекта мы используем библиотеки re и nltk для очистки текста от лишних знаков и лемматизации, затем разделим выборки на трейн и валид, и с помощью TF-IDF проведём векторизацию текста. Обучим несколько моделей машинного обучения (в нашем проекте это логистическая регрессия, случайный лес и две модели градиентного бустинга), метрикой качества моделей будет F1. | pandas, nltk, re, TF-IDF, sklearn, lightgbm, catboost, optuna |
| Определение токсичных комментариев с BERT | В начале проекта мы создадим токенайзер и модель с помощью библиотеки transformers, затем произведём разбивку текста на эмбеддинги. Обучим несколько моделей машинного обучения (в нашем проекте это логистическая регрессия, случайный лес и две модели градиентного бустинга), метрикой качества моделей будет F1. | pandas, pytorch, transformers, BERT, tqdm, sklearn, lightgbm, catboost, optuna |
| Выбор локации для скважины | В данном проекте мы будем искать самую безубыточную локацию для разработки месторождения нефти. Для поиска лучшей локации мы будем использовать модель машинного обучения - линейную регрессию. . В проекте будем делать сводные таблицы, выводить графики, категоризировать признаки для анализа скважин, создадим и обучим модель линейной регрессии на тренировочной выборке, затем получим предсказания на валидационной. Метрикой в данном проекте будет RMSE. Также мы воспользуемся статистикой - рассчитаем прибыль каждой локации, максимальный риск убытков и 95%-й доверительный интервал. | pandas, numpy, matplotlib, scipy, sklearn, Bootstrap |