Awash in Data
Описание книги | Есть базовые идеи и способы мышления, которые вы можете испытать прямо сейчас — и это то, что, как мы надеемся, даст вам эта книга. Мы будем использовать наборы данных среднего размера — максимум несколько тысяч случаев за раз, вместе с несколькими методами здравого смысла и платформой данных с функцией перетаскивания, чтобы помочь вам получить представление о том, как пахнет наука о данных, за неимением лучшего термина. Когда вы закончите, вы сможете использовать этот «тест на запах», чтобы распознать проблему науки о данных; вы будете иметь лучшее представление о том, что вошло в данные, которые вы видите и используете, что сделает вас более критичным и компетентным гражданином; и вы сможете лучше изучать науку о данных всерьез, если захотите. |
---|---|
Область знаний | Социология, Большие данные, Статистика, Моделирование |
Год издания | 2021 |
Веб-сайт где можно прочитать книгу или статью | https://codap.xyz/awash/ |
Видео запись | |
Авторы | Erickson |
Среды и средства, на которые повлияла книга | CODAP |
В ситуации с наукой о данных — особенно если вы новичок — вы часто не знаете, что делать. У вас слишком много данных, и они сбивают с толку. Даже если вы не в буквальном смысле в лодке, вы завалены данными. Таким образом, эта книга о том, как справляться с «завалом»: развивать навыки и перспективы, подходящие для работы с наукой о данных. Мы рассмотрим методы поиска закономерностей и историй в океане данных — для успокоения морей и наполнения наших парусов.
Перемещение данных. Это методы работы с данными в контексте науки о данных. Одним из примеров является фильтрация, то есть рассмотрение подмножества ваших данных. Рассмотрение подмножества позволяет вам сосредоточиться на чем-то одном; это уменьшает масштаб проблемы. Часто это хороший способ сделать шаг, когда вы не знаете, что делать. Уменьшая объем данных и давая вам действие, которое нужно предпринять, фильтрация уменьшает это завал.