Выборка: различия между версиями
Patarakin (обсуждение | вклад) Новая страница: «{{Понятие |Description=Вы́борка или вы́борочная совоку́пность — часть генеральной совокупности элементов, которая охватывается экспериментом (наблюдением, опросом). ; Характеристики выборки: * Качественная характеристика выборки — что именно мы выбираем...» |
Patarakin (обсуждение | вклад) Нет описания правки |
||
| (не показано 14 промежуточных версий этого же участника) | |||
| Строка 1: | Строка 1: | ||
{{Понятие | {{Понятие | ||
|Description=Вы́борка или вы́борочная совоку́пность — часть генеральной совокупности элементов, которая охватывается экспериментом (наблюдением, опросом). | |Description=Вы́борка или вы́борочная совоку́пность — часть генеральной совокупности элементов, которая охватывается экспериментом (наблюдением, опросом). Это подмножество единиц генеральной совокупности, отобранное специальным методом и предназначенное для характеристики всей генеральной совокупности. | ||
; Характеристики выборки: | ; Характеристики выборки: | ||
* Качественная характеристика выборки — что именно мы выбираем и какие способы построения выборки мы для этого используем. | * Качественная характеристика выборки — что именно мы выбираем и какие способы построения выборки мы для этого используем. | ||
* Количественная характеристика выборки — сколько случаев выбираем, другими словами объём выборки. | * Количественная характеристика выборки — сколько случаев выбираем, другими словами объём выборки. | ||
|Field_of_knowledge=Статистика | |Field_of_knowledge=Педагогика, Социология, Экономика, Статистика | ||
|similar_concepts= | |similar_concepts=Переменная (статистика), Генеральная совокупность | ||
|Environment=CODAP, R | |||
}} | }} | ||
Выборка — часть генеральной совокупности, выбранная для исследования. Это подмножество единиц генеральной совокупности, отобранное специальным методом и предназначенное для характеристики всей генеральной совокупности. | |||
; Объем выборки | |||
: Объем выборки (<math>n</math>) — количество результатов измерений, взятых для исследования. | |||
=== Основные параметры выборки === | |||
# Среднее арифметическое: <math>M</math> или <math>\bar{x}</math> | |||
# [[Дисперсия]]: <math>S^2</math> | |||
# [[Стандартное отклонение]]: <math>S</math> | |||
# [[Математическое ожидание]] <math>M(X) = \sum_{i=1}^{n} x_i \cdot p_i</math> | |||
{{#ask: [[Дисперсия]] OR [[Стандартное отклонение]] OR [[Математическое ожидание]] | ?Description }} | |||
; Простая случайная выборка (Simple Random Sampling) | |||
Простая случайная выборка — это статистический метод, при котором каждый элемент генеральной совокупности имеет известную и равную вероятность отбора. При простой случайной выборке каждый элемент отбирается независимо от других элементов. | |||
; Ключевые характеристики простой случайной выборки | |||
#Равная вероятность отбора: каждая единица генеральной совокупности имеет одинаковую вероятность быть выбранной | |||
#Независимость отбора: выбор одного элемента не влияет на вероятность выбора других элементов | |||
# Случайность процесса: отбор осуществляется с помощью таблиц случайных чисел или генераторов случайных чисел | |||
; Формула вероятности отбора | |||
Для простой случайной выборки без возвращения вероятность отбора каждого элемента равна: | |||
<math>P = \frac{n}{N}</math> | |||
где <math>n</math> — размер выборки, <math>N</math> — размер генеральной совокупности. | |||
; Формула размера выборки | |||
Для определения минимального размера простой случайной выборки используется формула: | |||
<math>n = \frac{z^2 \cdot p \cdot (1-p)}{e^2}</math> | |||
где: | |||
* <math>z</math> — значение стандартного нормального распределения для заданного уровня доверия (например, 1.96 для 95%) | |||
* <math>p</math> — ожидаемая доля признака в генеральной совокупности | |||
* <math>e</math> — допустимая ошибка | |||
== Sample Size (Размер выборки, n) == | |||
; Определение | |||
:Количество наблюдений в [[датасет]]е. | |||
; Интерпретация: | |||
* Большой n → более надежные результаты, узкие доверительные интервалы | |||
* Маленький n → менее надежные результаты, широкие доверительные интервалы | |||
'''Математическая зависимость''': | |||
<math>\text{Стандартная ошибка} = \frac{\text{stdev}}{\sqrt{n}}</math> | |||
Если увеличить n в 4 раза → стандартная ошибка уменьшится в 2 раза | |||
; Минимальный размер выборки: | |||
* Для [[бутстрэп]]а: n ≥ 30 | |||
* Для хороших результатов: n ≥ 100 | |||
* Для очень надежных результатов: n ≥ 1000 | |||
Текущая версия от 20:11, 9 января 2026
| Описание | Вы́борка или вы́борочная совоку́пность — часть генеральной совокупности элементов, которая охватывается экспериментом (наблюдением, опросом). Это подмножество единиц генеральной совокупности, отобранное специальным методом и предназначенное для характеристики всей генеральной совокупности.
|
|---|---|
| Область знаний | Педагогика, Социология, Экономика, Статистика |
| Авторы | |
| Поясняющее видео | |
| Близкие понятия | Переменная (статистика), Генеральная совокупность |
| Среды и средства для освоения понятия | CODAP, R |
Выборка — часть генеральной совокупности, выбранная для исследования. Это подмножество единиц генеральной совокупности, отобранное специальным методом и предназначенное для характеристики всей генеральной совокупности.
- Объем выборки
- Объем выборки ([math]\displaystyle{ n }[/math]) — количество результатов измерений, взятых для исследования.
Основные параметры выборки
- Среднее арифметическое: [math]\displaystyle{ M }[/math] или [math]\displaystyle{ \bar{x} }[/math]
- Дисперсия: [math]\displaystyle{ S^2 }[/math]
- Стандартное отклонение: [math]\displaystyle{ S }[/math]
- Математическое ожидание [math]\displaystyle{ M(X) = \sum_{i=1}^{n} x_i \cdot p_i }[/math]
| Description | |
|---|---|
| Дисперсия | Дисперсия (англ. variance) — мера разброса значений случайной величины относительно её математического ожидания. Дисперсия характеризует степень изменчивости экономических показателей вокруг их среднего значения. |
| Математическое ожидание | Математическое ожидание (англ. expectation value, expected value) — мера среднего значения случайной величины, равная сумме произведений всех возможных значений случайной величины на соответствующие им вероятности. |
| Стандартное отклонение | Стандартное отклонение (среднеквадратическое отклонение, англ. standard deviation) — квадратный корень из дисперсии случайной величины.
|
- Простая случайная выборка (Simple Random Sampling)
Простая случайная выборка — это статистический метод, при котором каждый элемент генеральной совокупности имеет известную и равную вероятность отбора. При простой случайной выборке каждый элемент отбирается независимо от других элементов.
- Ключевые характеристики простой случайной выборки
- Равная вероятность отбора: каждая единица генеральной совокупности имеет одинаковую вероятность быть выбранной
- Независимость отбора: выбор одного элемента не влияет на вероятность выбора других элементов
- Случайность процесса: отбор осуществляется с помощью таблиц случайных чисел или генераторов случайных чисел
- Формула вероятности отбора
Для простой случайной выборки без возвращения вероятность отбора каждого элемента равна:
[math]\displaystyle{ P = \frac{n}{N} }[/math]
где [math]\displaystyle{ n }[/math] — размер выборки, [math]\displaystyle{ N }[/math] — размер генеральной совокупности.
- Формула размера выборки
Для определения минимального размера простой случайной выборки используется формула:
[math]\displaystyle{ n = \frac{z^2 \cdot p \cdot (1-p)}{e^2} }[/math]
где:
- [math]\displaystyle{ z }[/math] — значение стандартного нормального распределения для заданного уровня доверия (например, 1.96 для 95%)
- [math]\displaystyle{ p }[/math] — ожидаемая доля признака в генеральной совокупности
- [math]\displaystyle{ e }[/math] — допустимая ошибка
Sample Size (Размер выборки, n)
- Определение
- Количество наблюдений в датасете.
- Интерпретация
- Большой n → более надежные результаты, узкие доверительные интервалы
- Маленький n → менее надежные результаты, широкие доверительные интервалы
Математическая зависимость: [math]\displaystyle{ \text{Стандартная ошибка} = \frac{\text{stdev}}{\sqrt{n}} }[/math]
Если увеличить n в 4 раза → стандартная ошибка уменьшится в 2 раза
- Минимальный размер выборки
- Для бутстрэпа: n ≥ 30
- Для хороших результатов: n ≥ 100
- Для очень надежных результатов: n ≥ 1000
