Дата публикации: 30.04.2021
Меирбек Жасдәурен Даниярұлы
Студент магистратуры 2 курса,
Казахстанско-Британский технический университет,
Казахстан, г. Алматы
АННОТАЦИЯ
В данной статье выполняется прогнозирование экономического кризиса с использованием математических моделей. За основу берется алгоритм многомерной линейной регрессии с полиномиальными свойствами. Для реализации модели применяются методы машинного обучения. Рассматриваемая модель дает представление об эволюции кризиса и позволяет оценить вероятные результаты возможных вмешательств, которые могут повлиять на развитие кризиса. В качестве входных параметров были взяты индекс Херфиндаля, цикл преобразования денежных средств и показания торговли. А в качестве выходного параметра было выбрано значение коэффициента роста экспорта. Представленная модель также помогает определить факторы и действия, которые могут повысить глобальную экономическую безопасность. В качестве среды исполнения для машинного обучения был применен язык программирования Python.
Введение
На сегодняшний день математическое моделирование занимает ведущее место среди других методов исследования. Моделирование экономических процессов проводится на основе как простых, так и сложных моделей. В первом случае экономическая модель представляется в виде графиков, которые могут отображать цифровые данные, а также теории и модели. Для второго случая экономическая модель представляется в виде системы уравнений, для которых можно получить различные математические решения, изменяя условия задачи [1,2]. Разрабатываются специальные компьютерные программы для обработки полученных статистических данных. Они позволяют описать связь между различными экономическими процессами и явлениями, прогнозировать отдельные экономические показатели и подготовить стратегии управления экономическими объектами. Математическое моделирование позволяет рассматривать такой сложнейший процесс, как экономический кризис. Весьма популярны эконометрические модели, представляющие собой системы регрессионных уравнений, в которых отражается зависимость искомых величин от внешних воздействий в условиях, описываемых оцениваемыми параметрами модели. Во время построения эконометрической модели необходимо отобрать факторы, существенно влияющие на зависимую переменную, выбрать математическую функцию, описывающую связь между переменными. В качестве такой модели можно выбрать модель линейной регрессии.
Модель регрессии в математической статистике строится на основе известных данных, в роли которых выступает определенное количество пары чисел. Представим, что первое число в паре – это значение координаты x, а второе - y, тогда множество таких пар чисел можно представить на плоскости в декартовой системе координат в виде множества точек. Построить регрессию - это значит подобрать такую линию (функцию), которая как можно точнее приближает к себе (аппроксимирует) множество вышесказанных точек. На практике в построении моделей регрессии используют линейные, полиномиальные и другие типы функций. Классическая двухфакторная модель множественной линейной регрессии описывается в [3,4]. Полином любого порядка сводится к линейной регрессии с ее методами оценивания параметров и проверки гипотез. Как показывает опыт большинства исследователей, среди нелинейной полиномиальной регрессии чаще всего используется полином второй степени. Ограничения в использовании полиномов более высоких степеней связаны с требованием однородности исследуемой совокупности: чем выше порядок полинома, тем больше изгибов имеет кривая и соответственно менее однородна совокупность по результативному признаку [5].
Любая математическая модель основана на упрощении, отличается от реальной ситуации и является лишь приближенным описанием. Следовательно, возможны некоторые погрешности результатов. Несмотря на это, за счет замены реального процесса моделью появляется возможность воспользоваться математическими методами при изучении различных процессов.
Метод и теория
Цель настоящего исследования заключается в применении алгоритма полиномиальной регрессии с методами машинного обучения (ML) для прогнозирования экономического кризиса. На рисунке 1 схематически описан процесс построения модели машинного обучения для данной задачи. Полученные данные из математической модели были разделены на обучающую и тестовую выборку. В качестве входных параметров были выбраны следующие 4 параметра:
-
Herfindahl Index - индекс Херфиндаля, общепринятый показатель концентрации рынка. Индекс Херфиндаля рассчитывается путем возведения в квадрат рыночной доли каждой фирмы, конкурирующей на рынке, и последующего суммирования полученных чисел. Например, для рынка, состоящего из четырех фирм с долей 30, 30, 20 и 20 процентов, HI составляет 2600 (302 + 302 + 202 + 202 = 2600).
-
Cash Conversion Cycle - цикл преобразования денежных средств - это показатель, который показывает, сколько времени требуется компании, чтобы преобразовать капитал, вложенный в запасы, обратно в наличные.
-
Intout - входной и выходной коэффициент.
-
Tradeshare - торговля.
В качестве выходного параметра был выбран следующий параметр:
-
Export Growth - рост экспорта.
Рисунок 1. Схема построения модели
В данной работе рассматривается один из классов задач в машинном обучении - обучение с учителем. Главная цель обучения с учителем заключается в предсказании данных на основе обученных процессов, где y - целевая функция, а x - её признаки. Эта задача относится к классу регрессионных задач в теории методов машинного обучения. Входные данные задаются с помощью следующих переменных: Herfindahl Index - h, Cash Conversion Cycle – c, Intout – k, Tradeshare - s. Таким образом, мы определили рост экспорта как целевую функцию y, а остальные данные представляются как признаки x.
где модель ℎ описывает шаблон между x и y, и ???????? является случайной ошибкой модели, которая измеряет некоторые расхождения. Для данного исследования была выбрана модель линейной регрессии (LR) и модель линейной регрессии с полиномиальными свойствами.
Применяя метод, базирующийся на ансамбле сценариев, были получены данные, где в качестве входных параметров были взяты различные комбинации исходных параметров. Количество пар выборки для исходных параметров было взято равным 409. Для каждого запуска рассчитывается значение коэффициента роста экспорта. Чтобы исследовать динамику этого коэффициента берется 17 значений при промежуточной временной итерации для каждой пары выборки. Общее количество пар выборки составляет 409*17=6953 моделей. В данной статье представлены результаты только для одной пары тестового набора данных.
На рисунке 2 и рисунке 3 представлены результаты для линейной регрессии и для полиномиальной регрессии соответственно. В данной задаче была взята квадратичная степень полинома. Сравнивая эти рисунки, можно увидеть, что полиномиальная модель обучает лучше и увеличивает точность результатов, чем линейная модель. В качестве оценки функции потерь было выбрано значение MSE (Mean Squared Error). MSE является средней квадратичной ошибкой и равна 0.061 для настоящего исследования. Из этого следует, что квадратичная полиномиальная регрессия обучается при тренировочном наборе довольно хорошо.
Рисунок 2. Прогнозирование линейной регрессии для одной пары тестового набора данных
Рисунок 3. Прогнозирование полиномиальной регрессии для одной пары тестового набора данных
Заключение
Применяемая модель линейной регрессии была обучена четырьмя входными параметрами и коэффициентом роста экспорта. Таким образом, обученная модель прогнозирует значения коэффициента роста экспорта на основе тестовых данных. Модель множественной линейной регрессии имеет несколько хороших преимуществ, хотя и является очень простой. Данная модель хорошо обучается и высоко интерпретируется, поскольку все независимые переменные множественной регрессии оказывают прямое влияние на целевую функцию. Следственно, влияние входных параметров легко обнаруживается и визуализируется. В данной работе полиномиальная регрессия используется как частный случай множественной линейной регрессии. Так как, увеличение n степени полинома добавляет к линейной регрессии нелинейность данных.
Список литературы:
1. Иванилов Ю. П., Логов А. В. Математические модели в экономике. М., «Наука», Главная редакция физико - технической литературы, 1970.
2. Долгополова А.Ф., Гулай Т.А., Литвин Д.Б. Особенности применения методов математического моделирования в экономических исследованиях. Экономика и управление, 2013. № 1. С. 62-66.
3. Harrell Jr., Frank E. Regression modeling strategies: with applications to linear models, logistic and ordinal regression, and survival analysis. Springer Series in Statistics, 2015. 582 p.
4. Kuhn M., Johnson K. Applied predictive modeling. Springer, 2018. 600 p.
5. Елисеева И. И. и др. Эконометрика : учебник для бакалавриата и магистратуры. М., Издательство Юрайт, 2019.