Репозиторий содержит файлы, используемые для реализации курса по Анализу текстов в ИТМО.
Лекции и вспомогательные материалы приведены в директории lectures.
Ресурсы для выполнения лабораторных работ расположены в директории tasks, каждой лабораторной работе соответствует отдельный каталог. Общие указания к выполнению лабораторных работ приведены в файле README.md, расположенном в директории tasks. Инструкции к выполнению отдельных лабораторных работ приведены в файлах README.md, расположенных в директориях /tasks/task-<TASK_NUMBER>, где <TASK_NUMBER> - номер соответствующей лабораторной работы:
- Сегментация и аннотация текста
- N-grams
- Векторизация текста
- Классификация текстов или Тематическое моделирование
- Поиск по векторной БД
- Question Answering
Результаты выполнения лабораторных работ оформляются в виде проектов и размещаются в отдельных директориях внутри каталога projects (также см. указания по выполнению лабораторных работ). В качестве названия директории испоьзуется название соответствующего проекта, которое необходимо указывать в соответствии с конвенцией kebab-case. Соответствие между названием проекта и ФИО студента задается в следующей таблице:
| Project name | Student name |
|---|---|
| emoji-labeller | Иванов Иван Иванович |
| news-topic-classification | Гораш Вячеслав Игоревич |
| aj-news-clusterization | Федотовских Евгений Александрович |
| ag-news-classification | Веснин Дмитрий Владимирович |
| twitter-bullying-classification | Шерман Марк Леонидович |
| pg-news-dataset | Беликов Павел Геннадьевич |
| news_nlp | Строкова Анастасия Владиславовна |
| newsgroups-classification | Герасимчук Михаил Юрьевич |
| fake-news-classifier | Артемьев Алексей Дмитриевич |
| gp-news-classification | Проскурин Глеб Егорович |
| nlp-news-topicks | Расковалова Алёна Дмитриевна |