Методы анализа больших данных (Syllabus) 2025/Lesson ML: различия между версиями
Материал из Поле цифровой дидактики
Patarakin (обсуждение | вклад) Нет описания правки |
Patarakin (обсуждение | вклад) |
||
| Строка 34: | Строка 34: | ||
:Следующая статья; | :Следующая статья; | ||
stop | stop | ||
@enduml | |||
</uml> | |||
=== Диаграмма процесса очистки текста === | |||
<uml> | |||
@startuml | |||
partition "Очистка текста" { | |||
:Исходный текст; | |||
:Приведение к нижнему регистру; | |||
:Удаление URL и спец. символов; | |||
:Токенизация; | |||
:Удаление стоп-слов; | |||
:Стемминг; | |||
:Очищенные токены; | |||
} | |||
@enduml | @enduml | ||
</uml> | </uml> | ||
Версия от 08:46, 14 ноября 2025
Урок по анализу данных с использованием методов машинного обучения
D1

D 2

Диаграмма процесса очистки текста

