Статистика (домашнее задание №3)2
Цена, руб. | 300 |
Номер работы | 38487 |
Предмет | Статистика |
Тип работы | Контрольная |
Объем, стр. | 9 |
Оглавление | Домашнее задание №3 Группа 4 срок сдачи: в распечатанном виде на последнем занятии 1. Дайте количественную оценку взаимосвязи между двумя качественными признаками, каждый из которых может принимать только 2 значения. Первый признак – это пол респондентов, участвовавших в опросе. Второй признак Вам нужно определить по таблице, представленной в файле «Данные_группа_4». Номер признака соответствует Вашему номеру в списке группы. В таблице с данными представлены реальные результаты опроса людей в России в 2015 году. В ходе опроса люди отвечали на вопросы интервьюера. Ответы респондентов кодировались цифрами 1 и 2. Пояснения, что означают эти цифры, представлены в описании признака вместе с вопросом. Если в Вашем столбце в какой-либо ячейке данные отсутствуют, это означает, что человек по какой-либо причине не ответил на этот вопрос. Это так называемые пропущенные данные (missing values). Их учитывать в анализе не нужно, они должны быть исключены из рассмотрения. Итак, Ваше первое задание рассчитать на основе имеющихся данных такой показатель, как коэффициент ассоциации. Обратите внимание, что для этого Вы должны будете сначала представить данные опроса в таблице сопряженности, которая показывает распределение значений двух признаков. Коэффициент ассоциации используется для количественной оценки взаимосвязи между качественными признаками, которые могут принимать только 2 значения. Если коэффициент ассоциации по модулю больше 0,5, то считается, что можно сделать вывод о наличии связи. В нашем случае это будет означать, что ответы респондентов на второй вопрос различаются в зависимости от пола респондентов, то есть пол и ответ на второй вопрос связаны между собой. 2. В том случае, если качественный признак может принимать более 2 значений, использовать коэффициент ассоциации нельзя. В этом случае для оценки взаимосвязи может использоваться показатель, который называется коэффициент взаимной сопряженности Пирсона. На листе Вопр2 в файле Excel представлена информация о значениях 2 признаков. Первый признак Возраст может принимать 5 значений (1 – возраст респондента от 16 до 23 лет, 2 – от 24 до 35, 3 – от 36 до 45, 4 – от 46 до 60, 5 – от 61 и старше). Второй признак Интернет может принимать 2 значения (1 -респондент пользуется интернетом, 2 – не пользуется). Вам необходимо выбрать для анализа только те наблюдения, которые соответствуют Вашему номеру в списке группы. Необходимо определить значение Коэффициента взаимной сопряженности Пирсона и сделать вывод о наличии или отсутствии связи между признаками. 3. Расчет коэффициента ранговой корреляции Спирмена Определите взаимосвязь между объемом продаж компаний (Sales) и объемом расходов на НИОКР (R&D) на основе данных за 2013 год. Исходные данные для анализа находятся здесь: http://iri.jrc.ec.europa.eu/documents/10180/354280/Scoreboard%202014%20Ranking%20world%20top%202500%20companies Вам необходимо отобрать из списка 20 компаний, которые являлись лидерами по объему расходов на НИОКР в мире в 2013 г. (признак - R&D 2013 (€million)). Для этих 20 компаний также определите значение объема продаж в 2013 г. (признак – Sales 2013). На основе полученных данных рассчитайте значение рангового коэффициента корреляции Спирмена. Сделайте вывод о наличии или отсутствии связи между объемом продаж и объемом расходов на НИОКР. 4. Расчет коэффициента корреляции Пирсона Для выполнения задания скачайте с сайта Банка России данные относительно курса российского рубля по отношению к иностранной валюте. Название иностранной валюты, которая Вас интересует, Вы найдете в файле Excel, который прилагается к заданию. Каждому студенту соответствует своя иностранная валюта. Информацию относительно курса рубля относительно иностранной валюты Вы можете найти на сайте Банка России по адресу: http://cbr.ru/currency_base/dynamics.aspx Вам необходимо скачать данные с информацией о значениях курса за период с 10 января 2017 г. по 15 декабря 2017 г. Ваши данные о значениях курса должны быть отсортированы в порядке возрастания даты. Сначала данные за 10 января, потом 11 января, 12 января и т.д. Затем для каждого дня (кроме первого) определите, как изменился курс по сравнению с предыдущей датой в процентах. Например, для 12 января нужно взять значение курса за этот день и разделить на значение курса в предыдущий день (в данном случае – 1 января). Затем нужно умножить полученное значение на 100 и вычесть 100. Так мы получим информацию о темпах прироста показателя в процентах. Пример расчета: Дата Значение курса Темп прироста 10 янв 2017 50 11 янв 2017 60 20% Определите аналогичным образом темпы прироста значений курса во все последующие дни. Вы получите ряд наблюдений, который состоит из n-1 наблюдений (где n – это количество дней в вашем исходном ряде). Теперь на основе расчета коэффициента корреляции Пирсона проверим, связаны ли между собой изменения курса за предшествующий и следующий день. Для этого, чтобы рассчитать коэффициент корреляции нам нужно указать 2 диапазона значений. Первый диапазон – это показатель темпов прироста курса по сравнению с предыдущим днем Второй диапазон – это фактически первый диапазон только со сдвигом на 1 день назад Пример: Первый диапазон Второй диапазон Темп прироста курса 12 января по сравнению с 11 января, % Темп прироста курса 11 января по сравнению 10 января, % Темп прироста курса 13 января по сравнению с 12 января, % Темп прироста курса 12 января по сравнению с 11 января, % и т.д. и т.д. … … Темп прироста курса 15 декабря по сравнению с 14 декабря, % Темп прироста курса 14 декабря по сравнению с 13 декабря, % Всего в первом и втором диапазоне ячеек у Вас должно получиться n-2 наблюдения. На основе информации об этих двух диапазонах определите значение коэффициента корреляции Пирсона и сделайте вывод о том, как связаны между собой динамика курса рубля в предыдущий и последующий торговые дни. 5. Оценка регрессионной модели Рассмотрим тираж издания и тариф на размещение рекламы (цена строки одноразового рекламного объявления). Соответствующие данные для нескольких крупных газет приведены в таблице Тираж, экземпляров Цена одной строки рекламы, долл. США Wall Street Journal 2081995 62,65 New York Daily 1374858 43,48 USA Today 1284613 39,50 Los Angeles Times 1057536 39,61 New York Times 970051 41,47 New York Post 963069 41,07 Philadelphia News 828236 38,82 Chicago Tribune 779259 38,05 Washington Post 768288 38,78 San Francisco Chronicle 691771 37,25 Chicago Sun 663693 35,53 Detroit News 657015 39,18 Detroit Free Press 645623 37,83 Long Island Newsday 533384 32,81 Kansas City Times 528777 30,17 Miami Herald 514702 36,08 Cleveland Plain Dealer 492002 31,58 Milwaukee Journal 486426 33,77 Houston Chronicle 443592 31,03 Baltimore Sun 349182 31,77 а) Постройте диаграмму рассеяния для зависимости тарифа на размещение рекламы от тиража газеты. б) Найдите уравнение регрессии, позволяющее прогнозировать тариф на размещение рекламы на основании тиража газеты. в) Проверьте, является ли связь между тарифом на размещение рекламы и тиражом газеты статистически значимой. Г) Какой прогноз можно дать относительно стоимости рекламы для газеты с тиражом 600 тыс. экземпляров? |
Цена, руб. | 300 |
Заказать работу «Статистика (домашнее задание №3)2»
Отзывы
-
20.11
Виктория, большое вам спасибо! Очень быстро все, даже не ожидала ))
Екатерина -
11.11
Сергей, большое Вам спасибо, защитила на отлично! Сказали, хорошая работа. Этого бы не было без Ваше
Наталья -
01.11
Это все благодаря вам. Я уже по вашим материалам тут все изучаю. Спасибо огромное вам и автору! Гос
Оксана