Главная страница

МетодичкаМС. Методические указания и контрольные задания для студентов факультета агрономии и лесного хозяйства по направлению подготовки 110400 Агрономия


НазваниеМетодические указания и контрольные задания для студентов факультета агрономии и лесного хозяйства по направлению подготовки 110400 Агрономия
АнкорМетодичкаМС.doc
Дата11.11.2016
Размер363 Kb.
Формат файлаdoc
Имя файлаMetodichkaMS.doc
ТипМетодические указания
#1530
страница1 из 3
Каталог
  1   2   3


Министерство сельского хозяйства РФ

ФГБОУ ВПО

«Вологодская государственная молочнохозяйственная академия

имени Н.В.Верещагина»
Кафедра статистики и информационных технологий

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Методические указания

и

контрольные задания
для студентов факультета агрономии и лесного хозяйства

по направлению подготовки 110400 Агрономия

Вологда - Молочное

2013
УДК 519.22 (07)

ББК 22.171 р 30

Т338
Составитель –

Старший преподаватель
кафедры статистики и информационных технологий
Н.А. Кучанская
Рецензент –

Т338 Математическая статистика: Методические указания и контрольные задания/ Сост. Н.А. Кучанская. – Вологда–Молочное: ИЦ ВГМХА, 2013. – 32 с.

Методические указания и контрольные задания по курсу «Математическая статистика» предназначены для студентов факультета агрономии и лесного хозяйства заочной формы обучения.

УДК 519.22 (07)

ББК 22.171 р 30

Введение

Задача любой науки состоит в выявлении и исследовании закономерностей, которым подчиняются реальные явления и процессы. Найденные закономерности имеют не только теоретическую ценность, они широко применяются на практике – в планировании, управлении и прогнозировании.

Математическая статистика – раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений с целью выявления статистических закономерностей.

Если теория вероятностей изучает закономерности случайных явлений на основе абстрактного описания действительности (теоретической вероятностной модели), то математическая статистика оперирует непосредственно результатами наблюдений над случайным явлением, представляющем выборку из некоторой конечной или бесконечной гипотетической генеральной совокупности. Используя результаты, полученные теорией вероятностей, математическая статистика позволяет не только оценить значения искомых характеристик, но и выявить степень точности выводов, получаемых при обработке исходных данных.

Данные методические указания и контрольные задания по курсу «Математическая статистика» предназначены для студентов агрономического факультета заочной формы обучения, включают контрольные задания и вопросы, а, также примеры решения задач и вопросы к зачёту.


1 Содержание разделов дисциплины
Тема 1. Вариационные ряды.

Задачи математической статистики. Виды вариационных рядов. Графическое изображение вариационного ряда. Средние величины. Структурные характеристики. Показатели вариации. Начальные и центральные моменты вариационного ряда. Асимметрия и эксцесс.
Тема 2. Выборочный метод.

Генеральная и выборочная совокупности. Понятие оценки параметров распределения. Свойства статистических оценок. Точечная и интервальная оценки. Доверительные интервалы для оценки математического ожидания нормального распределения. Доверительный интервал для генеральной доли.
Тема 3. Проверка статистических гипотез.

Статистическая гипотеза и общая схема её проверки. Проверка гипотезы о числовом значении математического ожидания нормального распределения. Проверка гипотез о виде распределения. Критерии согласия Пирсона и Колмогорова.
Тема 4. Исследование взаимосвязей между признаками.

Задачи корреляционного анализа. Парный коэффициент корреляции. Виды уравнений регрессии, линейное уравнение регрессии. Множественное уравнение регрессии.
2 Указания по выполнению отдельных задач
Задачи 1 – 20 посвящены теме: «Вариационные ряды».

Для решения этих задач полезно использовать следующие формулы:

1) средняя арифметическая

=, (2.1)

где k – число интервалов,

xi - середина i-го интервала,

fi - частота i-го интервала,

n=- число элементов совокупности;

2) дисперсия

=; (2.2)

3) среднее квадратическое отклонение

; (2.3)

4) коэффициент вариации

; (2.4)

5) При вычислении медианы и моды потребуются следующие формулы:

, (2.5)

где нижняя граница медианного интервала;

накопленная частота в интервале, предшествующем медианному;

частота медианного интервала;

длина интервала.

В качестве медианного берут интервал, накопленная частота которого содержит в себе половину единиц совокупности.

, (2.6)

где нижняя граница модального интервала;

частота модального интервала;

частота в предыдущем интервале;

частота в интервале, следующим за модальным.

Модальным является интервал с наибольшей частотой.
Пример 1. На основании следующих данных составьте ранжированный, а затем дискретный вариационный ряд: 7; 2; 2; 1; 5; 3; 5; 2; 6; 1; 4; 4; 3; 7; 6; 2; 5; 1; 4; 6. Найдите среднее значение, моду и медиану.

Ранжированный ряд будет иметь вид:

1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7.

Составим дискретный вариационный ряд:

xi

1

2

3

4

5

6

7

fi

3

4

2

3

3

3

2

Для определения среднего значения воспользуемся формулой (2.1):



Модальным является значение признака, обладающее максимальной частотой:

Max(fi)=4=f2, следовательно, Мо2=2.

Для определения медианы следует найти накопленные частоты:





Первой из всех накопленных частот больше, чем стала следовательно, Ме4=4.

Пример 2. На основании данных таблицы 2.1 найдите числовые характеристики интервального вариационного ряда. Сделайте выводы.

Таблица 2.1 – Распределение времени обработки детали (мин) рабочими завода.

Интервал

1 - 3

3 - 5

5 - 7

7 - 9

9 - 11

Число рабочих

5

12

11

9

3

Для определения числовых характеристик воспользуемся расчётной таблицей:

Интервал

Частота, fi

Середина интервала, xi

xi·fi





1 – 3

3 – 5

5 – 7

7 – 9

9 - 11

5

12

11

9

3

2

4

6

8

10

10

48

66

72

30

66,6125

33,67

1,3475

49,7025

56,7675

5

17

28

37

40

Итого

40

-

226

207,1

-

Для достижения требуемой точности все вычисления производились с помощью программы Excel.

На основании выше приведённых формул получаем:

  1. средняя арифметическая (формула (2.1))



  1. дисперсия (формула 2.2)

D=207,1/40=5,1775.

  1. среднее квадратическое отклонение (формула (2.3))



  1. коэффициент вариации (формула (2.4))



  1. мода (формула (2.6))

Модальным является интервал с наибольшей частотой. В нашем случае это интервал (3;5), следовательно,



  1. медиана (формула (2.5))

Накопленные частоты находятся следующим образом: Половина единиц рассматриваемой совокупности накопленная частота первой из всех других накопленных частот стала больше 20, поэтому соответствующий ей интервал (5;7) является медианным. Таким образом,



Таким образом, среднее время обработки детали 5,65 мин, разброс (рассеивание) времени обработки около среднего значения составляет 2,27 мин. Значение коэффициента вариации больше 33%, что говорит о том, что совокупность не является однородной (вариация времени обработки детали значительная). Наиболее часто встречаемое время обработки детали 4,75 мин, 50% рабочих обрабатывают деталь более, чем за 5,55 мин, а остальные 50% рабочих – менее, чем за 5,55 мин.
Следующие 10 заданий охватывают тему «Выборочный метод».
Пример 3. По данным 9 измерений высоты овса найдены средняя результатов измерений 88 и «исправленное» среднее квадратическое отклонение =6. Найдите границы, в которых с надёжностью 0,99 заключено истинное значение измеряемой величины.

Среднее квадратическое отклонение результатов измерений неизвестно, поэтому для определения границ истинного значения воспользуемся доверительным интервалом:

,

где выборочная средняя результатов измерений, – «исправленное» среднее квадратическое отклонение, n- объём выборки, найдём по таблице значений t-критерия при и =n-1=8 степеням свободы.

. Тогда искомый доверительный интервал примет вид: .

После вычислений получим: .
Пример 4. Определите вероятность того, что допущенная при выборочном обследовании погрешность в оценке среднего процента выполнения месячного плана рабочим цеха не превысит 2%, если было обследовано 25 рабочих и известно, что процент выполнения плана любым рабочим есть нормально распределённая случайная величина с =8%.

Для определения вероятности воспользуемся доверительным интервалом, покрывающим средний процент выполнения месячного плана:

,

где средний процент выполнения плана, выборочное значение среднего процента, погрешность оценивания.

Искомая вероятность равна ,

где , функция Лапласа.

В условиях нашей задачи 0,02; 0,08; n=25, тогда =1,25. Значение функции Лапласа находим по таблице.

Таким образом, искомая вероятность =
=2·0,3944=0,7888.
Задачи 31 – 40 составлены по теме «Проверка статистических гипотез», а именно: проверка гипотезы о числовом значении математического ожидания нормального распределения.

Выдвигается гипотеза Н0 о том, что а=а0 относительно гипотезы Н1 возможны три случая: 1) параметр а равен числу, которое больше числа а0; 2) параметр а равен числу, которое меньше а0;
3) параметр а не равен числу а0.

Если генеральное среднее квадратическое отклонение σ известно, то при проверке гипотезы Н0 используется критерий:

U= , по которому вычисляется Uфакт. Затем по таблице значений функции Лапласа определяется Uкр.

Рассмотрим три вида конкурирующей гипотезы Н1:

1) Н1: а>а0.

При такой гипотезе Ф(uкр) находится из соотношения ,

где Ф(uкр) – функция Лапласа, заданный уровень значимости. По таблице значений функции Лапласа находим Uкр.

Если UфактUкр, то гипотезу Н0 принимают.

2) Н1: а<а0.

В этом случае Uкр определяется аналогично.

Если Uфакт -Uкр, то гипотезу Н0 принимают.

3) Н1: аа0.

Здесь Ф(uкр) вычисляется из равенства: .

Если -UкрUфактUкр, то гипотезу Н0 принимают.
Пример 5. Установлено, что средний вес зерна (стандарт) должен быть равен 0,05 г. Выборочная проверка n=100 зёрен показала, что средний вес равен 0,047 г. На основе проведённых исследований можно считать, что вес таблетки есть нормально распределённая случайная величина со средним квадратическим отклонением 0,001 г. На уровне значимости 0,05 выяснить, можно ли считать полученное в выборке отклонение от стандарта случайным.

Проверяемая гипотеза Н0: а=0,05 г, конкурирующая
Н1: а=0,047 (а<а0).

Поэтому здесь имеет место случай, когда в конкурирующей гипотезе параметр а равен числу, меньшему а0.

Вычисляем Uфакт==.

Находим Ф(uкр) из соотношения =0,45. По таблице значений функции Лапласа находим Uкр=1,645.

Uфакт<-Uкр, значит, гипотезу Н0 отвергаем. Другими словами, полученное в выборке отклонение от стандарта неслучайно.
Если генеральное среднее квадратическое отклонение σ неизвестно, то при проверке гипотезы Н0 используется критерий:

, по которому вычисляется tфакт. Затем по таблице значений критерия Стьюдента определяется tкр.

Рассмотрим три вида конкурирующей гипотезы Н1:

1) Н1: а>а0.

При такой гипотезе tкр находится по числу степеней свободы ν=n-1 и вероятности, равной (2·α),

где, заданный уровень значимости. По таблице значений критерия Стьюдента tкр.

Если tфактtкр, то гипотезу Н0 принимают.

2) Н1: а<а0.

В этом случае tкр определяется аналогично.

Если tфакт - tкр, то гипотезу Н0 принимают.

3) Н1: аа0.

Здесь tкр находится по числу степеней свободы ν=n-1 и вероятности α.

Если -tкрtфактtкр, то гипотезу Н0 принимают.
Пример 6. Произведены хронометрические измерения времени выполнения технологической операции у 11 работниц и получено среднее время её выполнения 48 с, выборочная дисперсия Dвыб=6,1 с. На уровне значимости 0,01 решить, можно ли принять за нормативное время 50 с?

Проверяемая гипотеза Н0: а=50 c, конкурирующая
Н1: а<50 c. Для вычисления фактического значения критерия необходимо найти «исправленное» среднее квадратическое отклонение . Воспользуемся следующей формулой:

.

Находим фактическое значение критерия:



Критическое значение tкр определяем по таблице Стьюдента с ν=11-1=10 и вероятностью 2·α=2·0,01=0,02.

tкр=2,764, -2,56<-2,764, следовательно, нулевую гипотезу принимаем и математическое ожидание а=50.
Теме «Исследование взаимосвязей между признаками» соответствуют задачи 41 – 50.
Пример 7. С помощью парного коэффициента коэффициента корреляции установите наличие связи между признаками. Найдите параметры уравнения регрессии зависимости урожайности зерновых y (ц/га) от количества внесённых минеральных удобрений х (кг/га).

Таблица 2.2 – Исходные данные

х

14

16

18

19

20

22

25

27

32

36

у

13,5

14,1

14,2

14,6

15,2

15,5

15,7

15,4

16,3

17,5

Связь между двумя признаками определяется с помощью коэффициента парной корреляции, вычисляемого следующим образом:



Для решения воспользуемся расчётной таблицей:



х

у

х2

у2

х·у

1

14

13,5

196

182,25

189

2

16

14,1

256

198,81

225,6

3

18

14,2

324

201,64

255,6

4

19

14,6

361

213,16

277,4

5

20

15,2

400

231,04

304

6

22

15,5

484

240,25

341

7

25

15,7

625

246,49

392,5

8

27

15,4

729

237,16

415,8

9

32

16,3

1024

265,69

521,6

10

36

17,5

1296

306,25

630

Итого

229

152

5695

2322,74

3552,5








Таким образом, связь между урожайностью зерновых и количесивом внесённых минеральных удобрений прямая и довольно тесная. Параметры уравнения регрессии зависимости урожайности от количества внесённых удобрений вида y=a0+a1·x найдём следующим образом:





Уравнение регрессии будет иметь вид:

ух=11,5586+0,159·х.

Коэффициент регрессии а1=0,159 показывает, что при увеличении количества внесённых удобрений на 1 кг/га, урожайность зерновых увеличится на 0,159 ц/га.
  1   2   3

перейти в каталог файлов
связь с админом