Books (dataset)
Материал из Поле цифровой дидактики
Версия от 22:12, 19 февраля 2024; Patarakin (обсуждение | вклад)
Описание датасета | 1000 самых популярных книг проекта Гутенберг - имя автора, дата публикации, дата рождения, смерти средняя длина предложений, сложность чтения и т.д. |
---|---|
Описание полей |
|
Форматы данных | CSV, JSON |
Область знаний | Психология, Социология |
Веб-сайт - ссылка на датасет | https://corgis-edu.github.io/corgis/datasets/csv/classics/classics.csv |
Примеры использования датасета | |
Год создания датасета |
This dataset is a collection of the top 1000 most popular books on Project Gutenberg, as determined by downloads. Each book has information about its authorship, publication date, congressional classication, and a few other fields. It also has some simple, computed statistics based on common metrics such as sentiment analysis, Flesch Kincaid Reading level, and average sentence length.
Исходный файл
Описание столбцов в таблице:
- bibliography.title
- bibliography.author.name
Фильтр в Snap!
Получаем данные
- get_web_data
Таблица книг отсортированных по параметрам Rank, Readability, Readability, Comprehension_Difficulty, Polarity, Subjectivity
Таблица
Имя | Ссылка | Год рождения |
---|