Выборка: различия между версиями
Patarakin (обсуждение | вклад) Нет описания правки |
Patarakin (обсуждение | вклад) Нет описания правки |
||
| (не показано 13 промежуточных версий этого же участника) | |||
| Строка 5: | Строка 5: | ||
* Количественная характеристика выборки — сколько случаев выбираем, другими словами объём выборки. | * Количественная характеристика выборки — сколько случаев выбираем, другими словами объём выборки. | ||
|Field_of_knowledge=Педагогика, Социология, Экономика, Статистика | |Field_of_knowledge=Педагогика, Социология, Экономика, Статистика | ||
|similar_concepts= | |similar_concepts=Переменная (статистика), Генеральная совокупность | ||
|Environment=CODAP, R | |||
}} | }} | ||
Выборка — часть генеральной совокупности, выбранная для исследования. Это подмножество единиц генеральной совокупности, отобранное специальным методом и предназначенное для характеристики всей генеральной совокупности. | Выборка — часть генеральной совокупности, выбранная для исследования. Это подмножество единиц генеральной совокупности, отобранное специальным методом и предназначенное для характеристики всей генеральной совокупности. | ||
| Строка 12: | Строка 13: | ||
: Объем выборки (<math>n</math>) — количество результатов измерений, взятых для исследования. | : Объем выборки (<math>n</math>) — количество результатов измерений, взятых для исследования. | ||
=== Основные параметры выборки === | |||
# Среднее арифметическое: <math>M</math> или <math>\bar{x}</math> | # Среднее арифметическое: <math>M</math> или <math>\bar{x}</math> | ||
# Дисперсия: <math>S^2</math> | # [[Дисперсия]]: <math>S^2</math> | ||
# Стандартное отклонение: <math>S</math> | # [[Стандартное отклонение]]: <math>S</math> | ||
# [[Математическое ожидание]] <math>M(X) = \sum_{i=1}^{n} x_i \cdot p_i</math> | |||
{{#ask: [[Дисперсия]] OR [[Стандартное отклонение]] OR [[Математическое ожидание]] | ?Description }} | |||
; Простая случайная выборка (Simple Random Sampling) | ; Простая случайная выборка (Simple Random Sampling) | ||
| Строка 41: | Строка 46: | ||
* <math>p</math> — ожидаемая доля признака в генеральной совокупности | * <math>p</math> — ожидаемая доля признака в генеральной совокупности | ||
* <math>e</math> — допустимая ошибка | * <math>e</math> — допустимая ошибка | ||
== Sample Size (Размер выборки, n) == | |||
; Определение | |||
:Количество наблюдений в [[датасет]]е. | |||
; Интерпретация: | |||
* Большой n → более надежные результаты, узкие доверительные интервалы | |||
* Маленький n → менее надежные результаты, широкие доверительные интервалы | |||
'''Математическая зависимость''': | |||
<math>\text{Стандартная ошибка} = \frac{\text{stdev}}{\sqrt{n}}</math> | |||
Если увеличить n в 4 раза → стандартная ошибка уменьшится в 2 раза | |||
; Минимальный размер выборки: | |||
* Для [[бутстрэп]]а: n ≥ 30 | |||
* Для хороших результатов: n ≥ 100 | |||
* Для очень надежных результатов: n ≥ 1000 | |||
Текущая версия от 20:11, 9 января 2026
| Описание | Вы́борка или вы́борочная совоку́пность — часть генеральной совокупности элементов, которая охватывается экспериментом (наблюдением, опросом). Это подмножество единиц генеральной совокупности, отобранное специальным методом и предназначенное для характеристики всей генеральной совокупности.
|
|---|---|
| Область знаний | Педагогика, Социология, Экономика, Статистика |
| Авторы | |
| Поясняющее видео | |
| Близкие понятия | Переменная (статистика), Генеральная совокупность |
| Среды и средства для освоения понятия | CODAP, R |
Выборка — часть генеральной совокупности, выбранная для исследования. Это подмножество единиц генеральной совокупности, отобранное специальным методом и предназначенное для характеристики всей генеральной совокупности.
- Объем выборки
- Объем выборки ([math]\displaystyle{ n }[/math]) — количество результатов измерений, взятых для исследования.
Основные параметры выборки
- Среднее арифметическое: [math]\displaystyle{ M }[/math] или [math]\displaystyle{ \bar{x} }[/math]
- Дисперсия: [math]\displaystyle{ S^2 }[/math]
- Стандартное отклонение: [math]\displaystyle{ S }[/math]
- Математическое ожидание [math]\displaystyle{ M(X) = \sum_{i=1}^{n} x_i \cdot p_i }[/math]
| Description | |
|---|---|
| Дисперсия | Дисперсия (англ. variance) — мера разброса значений случайной величины относительно её математического ожидания. Дисперсия характеризует степень изменчивости экономических показателей вокруг их среднего значения. |
| Математическое ожидание | Математическое ожидание (англ. expectation value, expected value) — мера среднего значения случайной величины, равная сумме произведений всех возможных значений случайной величины на соответствующие им вероятности. |
| Стандартное отклонение | Стандартное отклонение (среднеквадратическое отклонение, англ. standard deviation) — квадратный корень из дисперсии случайной величины.
|
- Простая случайная выборка (Simple Random Sampling)
Простая случайная выборка — это статистический метод, при котором каждый элемент генеральной совокупности имеет известную и равную вероятность отбора. При простой случайной выборке каждый элемент отбирается независимо от других элементов.
- Ключевые характеристики простой случайной выборки
- Равная вероятность отбора: каждая единица генеральной совокупности имеет одинаковую вероятность быть выбранной
- Независимость отбора: выбор одного элемента не влияет на вероятность выбора других элементов
- Случайность процесса: отбор осуществляется с помощью таблиц случайных чисел или генераторов случайных чисел
- Формула вероятности отбора
Для простой случайной выборки без возвращения вероятность отбора каждого элемента равна:
[math]\displaystyle{ P = \frac{n}{N} }[/math]
где [math]\displaystyle{ n }[/math] — размер выборки, [math]\displaystyle{ N }[/math] — размер генеральной совокупности.
- Формула размера выборки
Для определения минимального размера простой случайной выборки используется формула:
[math]\displaystyle{ n = \frac{z^2 \cdot p \cdot (1-p)}{e^2} }[/math]
где:
- [math]\displaystyle{ z }[/math] — значение стандартного нормального распределения для заданного уровня доверия (например, 1.96 для 95%)
- [math]\displaystyle{ p }[/math] — ожидаемая доля признака в генеральной совокупности
- [math]\displaystyle{ e }[/math] — допустимая ошибка
Sample Size (Размер выборки, n)
- Определение
- Количество наблюдений в датасете.
- Интерпретация
- Большой n → более надежные результаты, узкие доверительные интервалы
- Маленький n → менее надежные результаты, широкие доверительные интервалы
Математическая зависимость: [math]\displaystyle{ \text{Стандартная ошибка} = \frac{\text{stdev}}{\sqrt{n}} }[/math]
Если увеличить n в 4 раза → стандартная ошибка уменьшится в 2 раза
- Минимальный размер выборки
- Для бутстрэпа: n ≥ 30
- Для хороших результатов: n ≥ 100
- Для очень надежных результатов: n ≥ 1000
