Обсуждение участника:Виталий Егоров
VOSviewer [Запрос: Sport AND Men in business]
https://app.vosviewer.com/?json=https%3A%2F%2Fdrive.google.com%2Fuc%3Fid%3D1Uhf3lPoyOwy13dTQ1uj0CJgPKKwcDrHG
Городские проекты. Город Москва
https://mm.tt/map/3663574038?t=74hhBdkrwy
Анализ датасета выживших на борту Титаника
https://web.stanford.edu/class/archive/cs/cs109/cs109.1166/problem12.html
1. Демографические данные (Demographics):
- Sex (Пол): Мужской (male), Женский (female).
- Age (Возраст): Числовой признак, но его часто группируют в категории (дети 0-12, подростки 13-19, взрослые 20-59, пожилые 60+). Есть пропущенные значения (NaN), но в предоставленном срезе их нет.
2. Социально-экономический статус (Socio-Economic Status):
- Pclass (Класс билета): 1, 2, 3. Прямой индикатор благосостояния и социального положения.
- Fare (Плата за билет): Числовой признак, сильно коррелирующий с Pclass. Можно преобразовать в категории (дешевый, средний, дорогой).
3. Семейные отношения (Family Relations):
- Siblings/Spouses Aboard (Братья/Сестры/Супруги на борту): Количество.
- Parents/Children Aboard (Родители/Дети на борту): Количество.
- Производный признак: Часто создают FamilySize (сумма этих двух столбцов + 1 (сам пассажир)) и IsAlone (был ли пассажир один).
4. Идентификационные данные (Identification):
- Name (Имя): Титулы (Mr., Mrs., Miss., Master., Dr., Rev. и т.д.), которые являются мощной категориальной переменной, указывающей на пол, возраст и социальный статус.
