Озеро данных

Материал из Поле цифровой дидактики


Описание Data lake — это огромное хранилище, которое принимает любые файлы всех форматов. Источник данных тоже не имеет никакого значения. Озеро данных может принимать данные из продуктовых каталогов, банковских программ, датчиков или умных устройств.
Область знаний Информатика, Робототехника
Авторы
Поясняющее видео
Близкие понятия неструктурированные данные, Датасет, База данных
Среды и средства для освоения понятия Hadoop

Ключевое отличие озер данных от обычных баз данных — структура. В базах данных хранятся только четко структурированные данные, а в озерах — неструктурированные, никак не систематизированные и неупорядоченные.