2 Метод фостера − стюарта
Проверка разности средних не является единственным способом проверки гипотез о наличии тренда средней динамического ряда. Рассмотрим метод разработанный Ф. Фостером и А. Стюартом который дает более надежные результаты, чем остальные. Этот метод позволяет также обнаружить тренд в значении дисперсии уровней, что, как будет показано далее, немаловажно для прогностического анализа. Ф. Фостер и А. Стюарт предложили по данным исследуемого ряда определять величины ut и lt. Значения ut и lt находятся путем последовательного сравнения уровней. Если какой-либо уровень ряда превышает по своей величине каждый из предыдущих уровней, то величине ut присваивается значение 1, в остальных случаях она равна 0. Таким образом,
Если же уровень меньше всех предыдущих, то lt присваивается значение 1. Таким образом,
После того как ut и lt найдены, определяются две характеристики S и d:
Суммирование в формулах (6) и (7) производится по всем членам ряда.
Нетрудно найти, что St принимает значения 0 и 1: St = 0 в случае, если yt не является ни наибольшим, ни наименьшим уровнем среди всех предшествующих уровней, в противном случае St = 1. Легко определить, что S может находиться в пределах 0 ≤ S ≤ n – 1. (Здесь, как и выше, п означает число членов ряда.) Если все уровни равны (нулевая дисперсия), то S = 0, если же они монотонно растут, или падают, или колебания их чередуются, систематически увеличиваясь или падая, то S = п – 1 .
В свою очередь величина dt принимает значения 0; 1 и –1. Найдем теперь пределы для d: нижний предел равен – (п – 1), верхний составляет п – 1. Нижний предел соответствует монотонно убывающему, а верхний – монотонно растущему ряду. Авторы данных характеристик не рассматривают условий, когда значение d равно 0. Между тем именно здесь кроется известная слабость рассматриваемого метода. В самом деле, если все уровни равны, то ∑ut = 0, ∑lt = 0 и d = 0. Кроме того, d = 0 и тогда, когда ∑ut = ∑lt. Что касается первой ситуации, то она соответствует полному отсутствию тренда. Вторая же может наблюдаться и тогда, когда ряд охватывает два периода с противоположными тенденциями. Кроме того, d = 0 и в случае, когда подъемы и падения уровней чередуются. Если уровни симметрично располагаются вокруг горизонтальной линии, то величина d = 0 действительно соответствует отсутствию тренда в средней. Однако при определении d не принимаются во внимание величины отклонений от горизонтальной линии. Поэтому мыслима такая ситуация, при которой отклонения с одним знаком будут систематически выше отклонений с другим знаком. В этом случае тенденция средней к росту (падению) не отразится на величине d.
Показатели S и d асимптотически нормальны и имеют независимые распределения. Они существенно зависят от порядка расположения уровней во времени. Показатель S применяется для обнаруживания тенденций изменения дисперсии, d − для обнаруживания тенденций в средней. После того как для исследуемого ряда найдены фактические значения d и S, проверяется гипотеза о том, можно ли считать случайными разности d – 0 и S – . Гипотезы можно проверить, применяя t -критерий Стьюдента, т. е.
где – математическое ожидание величины S, определенное для случайного расположения уровней во времени; – средняя квадратическая ошибка величины S; – средняя квадратическая ошибка величины d.
Необходимые для такой проверки значения , и табулированы авторами метода (таблица 1).
Таблица 1 Значения средней и стандартных ошибок ,
Метод Фостера – Стьюарта
Этот метод обладает большими возможностями и даст более надежные результаты по сравнению с предыдущим. Кроме тренда самого ряда (как говорят, тренда в среднем), он позволяет установить наличие тренда дисперсии временного ряда: если тренда дисперсии нет, то разброс уровней ряда постоянен; если дисперсия увеличивается, то ряд «раскачивается» и т.д.
Реализация метода также содержит четыре этана.
На первом этапе производится сравнение каждого уровня исходного временного ряда, начиная со второго уровня, со всеми предыдущими, при этом определяются две числовые последовательности:
На втором этапе вычисляются величины s и d:
Нетрудно заметить, что величина s, характеризующая изменение временного ряда, принимает значения от – (n – 1) (ряд монотонно убывает) до (и – 1) (ряд монотонно возрастает). Величина d характеризует изменение дисперсии уровней временного ряда и изменяется от 0 (все уровни ряда равны) до (п – 1) (ряд монотонный или с чередованием подъемов и падений уровней).
Третий этап заключается в проверке гипотез: можно ли считать случайными:
- 1) отклонение величины d от величины μ – математического ожидания величины d для ряда, в котором уровни расположены случайным образом;
- 2) отклонение величины s от нуля.
Эта проверка проводится с использованием расчетных значений t-критерия Стьюдента для дисперсии и для средней:
где μ – математическое ожидание величины d, определенной для ряда, в котором уровни расположены случайным образом;
– среднеквадратическое отклонение для величины d;
– среднеквадратическое отклонение для величины s.
Для удобства имеются табулированные значения величин μ, и ; фрагмент этих значений представлен в табл. 4.5.
Таблица 4.5
На четвертом этапе расчетные значения и сравниваются с табличным значением t-критерия Стьюдента с заданным уровнем значимости . Если расчетное значение меньше табличного, то гипотеза об отсутствии соответствующего тренда принимается; в противном случае тренд есть. Например, если больше табличного значения , а меньше , то для данного временного ряда имеется тренд в среднем, а тренда дисперсии уровней ряда нет. Пример определения наличия тренда методом Фостера – Стьюарта будет приведен в параграфе 4.4.
Перейдем к вопросу сглаживания временных рядов экономических показателей. Очень часто уровни экономических рядов динамики колеблются, при этом тенденция развития экономического явления во времени скрыта случайными отклонениями уровней в ту или иную сторону.
С целью более четко выявить тенденцию развития исследуемого процесса, в том числе для дальнейшего применения методов прогнозирования на основе трендовых моделей, производят сглаживание (выравнивание) временных рядов.
Методы сглаживания временных рядов делятся на две основные группы:
- 1) аналитическое выравнивание с использованием кривой, проведенной между конкретными уровнями ряда так, чтобы она отображала тенденцию, присущую ряду, и одновременно освобождала его от незначительных колебаний;
- 2) механическое выравнивание отдельных уровней временного ряда с использованием фактических значений соседних уровней.
Методы аналитического выравнивания на основе кривых роста рассматриваются в главе 5. Суть методов механического сглаживания заключается в следующем. Берется несколько первых уровней временного ряда, образующих интервал сглаживания. Для них подбирается полином, степень которого должна быть меньше числа уровней, входящих в интервал сглаживания; с помощью полинома определяются новые, выравненные значения уровней в середине интервала сглаживания. Далее интервал сглаживания сдвигается на один уровень ряда вправо, вычисляется следующее сглаженное значение и т.д. Самым простым методом механического сглаживания является метод простой скользящей средней.
Сначала для временного ряда определяется интервал сглаживания т(т< п). Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нужно сохранить более мелкие колебания. При прочих равных условиях интервал сглаживания рекомендуется брать нечетным. Для первых т уровней временного ряда вычисляется их средняя арифметическая; это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень вправо, повторяется вычисление средней арифметической и т.д. Для вычисления сглаженных уровней ряда у применяется формула
где (при нечетном т); для четных т формула усложняется.
В результате такой процедуры получаются п – т + 1 сглаженных значений уровней ряда; при этом первые р и последние р уровней ряда теряются (не сглаживаются).
Другой недостаток метода в том, что он применим лишь для рядов, имеющих линейную тенденцию.
Метод взвешенной скользящей средней отличается от предыдущего метода сглаживания тем, что уровни, входящие в интервал сглаживания, суммируются с разными весами. Это связано с тем, что аппроксимация ряда в пределах интервала сглаживания осуществляется с использованием полинома не первой степени, как в предыдущем случае, а степени, начиная со второй и выше. Используется формула средней арифметической взвешенной:
причем веса определяются с помощью метода наименьших квадратов. Эти веса рассчитаны для различных степеней аппроксимирующего полинома и различных интервалов сглаживания. Так, для полиномов второго и третьего порядков числовая последовательность весов при интервале сглаживания т = 5 имеет вид: , а при т = 7 имеет вид: . Для полиномов четвертой и пятой степеней и при интервале сглаживания т = 7 последовательность весов выглядит следующим образом: .
К этой же группе методов выравнивания временных рядов примыкает метод экспоненциального сглаживания. Его особенность заключается в том, что в процедуре нахождения сглаженного уровня используются значения только предшествующих уровней ряда, взятые с определенным весом, причем вес наблюдения уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровня ряда. Если для исходного временного ряда соответствующие сглаженные значения уровней обозначить через ,
t = 1,2, . n, то экспоненциальное сглаживание осуществляется по формуле
(4.3)
Используя приведенное выше рекуррентное соотношение для всех уровней ряда, начиная с первого и кончая моментом времени t, можно получить, что экспоненциальная средняя, т.е. сглаженное данным методом значение уровня ряда, является взвешенной средней всех предшествующих уровней:
здесь – величина, характеризующая начальные условия.
В практических задачах обработки экономических временных рядов рекомендуется (необоснованно) выбирать величину параметра сглаживания в интервале от 0,1 до 0,3. Других точных рекомендаций для выбора оптимальной величины параметра а пока нет. В отдельных случаях Р. Браун предлагает определять величину а исходя из длины сглаживаемого ряда:
Что касается начального параметра S0, то в конкретных задачах его берут или равным значению первого уровня ряда у1, или равным средней арифметической нескольких первых членов ряда, например членов :
Указанный выше порядок выбора величины обеспечивает хорошее согласование сглаженного и исходного рядов для первых уровней. Если при подходе к правому концу временного ряда сглаженные этим методом значения при выбранном параметре а начинают значительно отличаться от соответствующих значений исходного ряда, необходимо перейти на другой параметр сглаживания. Заметим, что при этом методе сглаживания не теряются ни начальные, ни конечные уровни сглаживаемого временного ряда.