Регрессионный анализ один из самых популярных методов статистического исследования. Часто его применяют для обработки данных из таблиц, поэтому в программе Excel есть все необходимое для проведения анализа данного типа.
Как провести регрессионный анализ данных в Excel
Для проведения анализа данного типа вам потребуется выполнить определенные действия. Чтобы вам было удобно воспринимать информацию список действий и важных особенностей будет поделен на смысловые блоки.
Подключения пакета анализа
Для того, чтобы использовать формулы и функции, отвечающие за регрессионный анализ данных требуется для начала включить его поддержку в настройках программы. По умолчанию она отключена, поэтому нужных инструментов в верхней панели вы не найдете. Подключение производится по следующей инструкции:
- Откройте документ с табличными данными и нажмите по кнопке “Файл” в верхней левой части интерфейса программы.
- Перейдя в окошко настроек программы нажмите по кнопке “Параметры”, что расположена в левом меню.
- В открывшемся окне “Параметры” нажмите по пункту “Надстройки”. Он расположен в левой части окна.
- В самой нижней части окна найдите и воспользуйтесь строкой “Управление”. Там, из контекстного меню выберите пункт “Надстройки Excel”.
- Нажмите кнопку “Перейти” для получения списка надстроек.
- Появится окошко с доступными надстройками Excel. Там установите галочку у пункта “Пакет анализа”. Нажмите “Ок”, чтобы эта надстройка добавилась в рабочую область программы.
Теперь во вкладке инструментов “Данные” будет доступен инструмент “Анализ данных“, что будет находится в блоке инструментов “Анализ” в правой части интерфейса.
Чтобы вы лучше могли понимать, как пользоваться данным инструментом, рассмотрим основные виды регрессий, которые представляет инструмент:
- Параболическая;
- Степенная;
- Логарифмическая;
- Экспоненциальная;
- Показательная;
- Гиперболическая;
- Линейная регрессия.
Собственно, последний вид анализа мы рассматриваем в этой статьей, поэтому ниже пойдет речь исключительно о нем.
Настройка линейного регрессионного анализа
Для работы вам потребуется таблица с заполненными данными, с которых вам нужно получить некоторую статистику. Например, возьмем таблицу, где представлена средняя температура за день и количество покупателей в определенном магазине, а также дни недели. На основе анализа попробуем выяснить, как температура на улице и день недели способны повлиять на посещаемость магазина.
Читайте также:
Считаем среднее значение в Microsoft Excel
Удаляем пустые строки в Excel
Настройка автофильтра в программе MS Excel
Вставляем таблицу из Word в Excel
Общее уравнение, которое будет использовано для проведения анализа выглядит следующим образом: У = а0 + а1х1 +…+акхк:
- Где Y — это переменная, влияние внешних факторов на которую мы рассматриваем. В рассматриваемом примере это количество покупателей.
- Где X — это фактор или факторы, оказывающие влияние на данную переменную.
- Где A — это различные коэффициенты регрессии.
- Индекс K обозначает общее количество факторов регрессии.
Давайте рассмотрим процесс регрессионного анализа на конкретном примере:
- Откройте таблицу с заполненными данными. Перейдите во вклакду “Данные”. Там воспользуйтесь инструментом “Анализ данных”, который появится после выполнения предыдущей инструкции.
- Выберите наиболее подходящий для вашей задачи тип анализа. В нашем случае это “Регрессия”. Нажмите по ней и затем “Ок” для перехода к настройке анализа.
- В появившемся окне настроек обязательными для заполнения являются два поля: “Входной интервал Y” и “Входной интервал X”. Они заполняются следующим образом:
- “Входной интервал Y”. Сюда укажите диапазон адресов ячеек, где указаны данные, влияние на которые нам нужно изучить. В рассматриваемой таблице это будет “Количество покупателей”. Адрес нужных ячеек можно как вписать вручную, так и выделить их в самой таблице.
- “Входной интервал X”. Сюда укажите значение данных ячеек, которые должны оказывать влияние на Y. В нашем случае это ячейки со средней дневной температурой на улице.
- Остальные данные оставляйте заполненными по умолчанию. Если вам нужно что-то настроить дополнительно, то конечно, можете внести свои корректировки.
- Завершив заполнение окна с настройками регрессионного анализа нажмите “Ок” для получения результата.
Изучение полученного результата
Результаты анализа по умолчанию будут выведены на отдельный лист. К сожалению, неопытному пользователю может быть достаточно сложно их разобрать, так как вряд ли там будет написано что-то вроде “средняя температура оказывает такое-то влияние”. Вот перечень параметров, на которые вам требуется обратить внимание и их расшифровка:
- R-квадрат. Основный показатель, на который требуется обратить внимание. В нем вы видите качество рассматриваемой модели, то есть качество всего анализа. Значение выше 0.7 является приемлемым, следовательно, анализу можно доверять.
- Пересечение строки “Y-пересечение” и столбца “Коэффициенты”. В этом блоке указывается значение Y, которое предположительно будет без влияния посторонних факторов. В нашем случае это количество покупателей.
- Пересечение граф “Переменная X1” и “Коэффициенты” указывает на уровень зависимости Y от X. В рассматриваемом примере это зависимость количества посетителей от средней дневной температуры. Значение выше 1 считается высоким показателем.
Как видите, нет никаких проблем в проведении регрессионного анализа с помощью инструментов Excel. Однако адекватно обработать и привести в читабельный вид полученные результаты сможет только специально подготовленный человек.