Обсуждение участника:Виталий Егоров

Материал из Поле цифровой дидактики

VOSviewer [Запрос: Sport AND Men in business]

https://app.vosviewer.com/?json=https%3A%2F%2Fdrive.google.com%2Fuc%3Fid%3D1Uhf3lPoyOwy13dTQ1uj0CJgPKKwcDrHG

Городские проекты. Город Москва

https://mm.tt/map/3663574038?t=74hhBdkrwy

Анализ датасета выживших на борту Титаника

https://web.stanford.edu/class/archive/cs/cs109/cs109.1166/problem12.html

1. Демографические данные (Demographics):

- Sex (Пол): Мужской (male), Женский (female).

- Age (Возраст): Числовой признак, но его часто группируют в категории (дети 0-12, подростки 13-19, взрослые 20-59, пожилые 60+). Есть пропущенные значения (NaN), но в предоставленном срезе их нет.

2. Социально-экономический статус (Socio-Economic Status):

- Pclass (Класс билета): 1, 2, 3. Прямой индикатор благосостояния и социального положения.

- Fare (Плата за билет): Числовой признак, сильно коррелирующий с Pclass. Можно преобразовать в категории (дешевый, средний, дорогой).

3. Семейные отношения (Family Relations):

- Siblings/Spouses Aboard (Братья/Сестры/Супруги на борту): Количество.

- Parents/Children Aboard (Родители/Дети на борту): Количество.

- Производный признак: Часто создают FamilySize (сумма этих двух столбцов + 1 (сам пассажир)) и IsAlone (был ли пассажир один).

4. Идентификационные данные (Identification):

- Name (Имя): Титулы (Mr., Mrs., Miss., Master., Dr., Rev. и т.д.), которые являются мощной категориальной переменной, указывающей на пол, возраст и социальный статус.