ИНТЕРВАЛЬНОЕ ПРОГНОЗИРОВАНИЕ ДИНАМИЧЕСКИХ ПОКАЗАТЕЛЕЙ НА ОСНОВЕ ЛОГИСТИЧЕСКИХ РЕГРЕССИОННЫХ МОДЕЛЕЙ

Receipt date: 
16.09.2017
Year: 
2017
Journal number: 
УДК: 
519.688
DOI: 

10.26731/1813-9108.2017.4(56).122-131

Article File: 
Pages: 
122
131
Abstract: 

В работе проведена формализация, программная реализация и проверка точности интервального прогнозирования реальных динамических показателей с различными статистическими характеристиками на основе методов логистической регрессии без регуляризации и с регуляризацией значений параметров. Интервальное прогнозирование динамических показателей заключается в определении принадлежности их будущих значений заранее введённым интервалам на основе оценок вероятностей. Так как при таком прогнозировании мы определяем не само будущее значение показателя, а интервал,
в котором оно будет находиться, мы назвали такой метод прогнозирования «интервальным прогнозированием». Для проверки точности интервального прогнозирования мы использовали реальные динамические показатели с различными статистическими характеристиками, зависящими от стационарности по параметру положения и масштаба. Для проверки неизменности значения параметра положения с течением времени мы использовали модифицированный критерий сдвига Краскела ‑ Уоллиса, а для проверки неизменности значения параметра масштаба мы использовали модифицированный критерий Флигнера-Киллина. В результате проведенного исследования в большинстве случаев для динамических показателей с различными статистическими характеристиками модель логистической регрессии без регуляризации продемонстрировала лучшую точность интервального прогнозирования. Эта модель рекомендуется для проведения интервального прогнозирования реальных динамических показателей на практике, в том числе для построения прогнозирующих ансамблей.

List of references: 
  1. Mitrea C.A. A Comparison between neural networks and traditional forecasting methods: a case study // International journal of engineering business management. 2009. № 1(2). Pр. 19–24.
  2. Gooijer J,G,, Hyndman R,J, 25 years of time series forecasting // International journal of forecasting. 2006. № 22 (3). Pр. 443–473.
  3. Shumway R.H. Time series analysis and its applications with R examples // Springer. 2011. 609 p.
  4. Wang H., Li G., Wang H, Deep learning based ensemble approach for probabilistic wind power forecasting // Applied energy. 2017. № 188. Pр. 56–70,
  5. Vernay M,, Lafaysse M,, Merindol L, Ensemble forecasting of snowpack conditions and avalanche hazard // Cold regions science and technology. 2015. № 120. Pр 251–262.
  6. Elliot G. Predicting binary outcomes [Electronic resource]. URL: http://econweb,ucsd,edu/~grelliott/BinPred,pdf (access date: 22.08.2017).
  7. Yoder M., Cering A.S., Navidi W.C. Short-term forecasting of categorical changes in wind power with Markov chain models // Wind energy. 2014. № 17. Pр 1425–1439.
  8. Lahiri K., Yang L. Forecasting binary outcomes // Handbook of economic forecasting [Electronic resource]. URL: http://www.albany.edu/economics/research/workingp/2012/lahiriyang,pdf (access date:12.05.2017).
  9. Краковский Ю.М., Лузгин А.Н. Алгоритм интервального прогнозирования динамических показателей на основе робастной вероятностной кластерной модели : электрон. журн. // Наука и образование. 2016. №. 11. С. 113–126. URL: http://technomag.neicon.ru/doc/849839.html (дата обращения: 01.07.2017).
  10. Murata A., Fujii Y., Naitoh K. Multinomial logistic regression model for predicting driver's drowsiness using behavioral measures // Procedia manufacturing. 2015. № 3. P. 2426–2433.
  11. Arbues F. Determinants of behavior toward selective collection of batteries in Spain, A bivariate probit model // Resources conservation and recycling. 2016. № 106. Pр. 1–8.
  12. Cui M., Ke D., Sun Y. Wind power ramp event forecasting using a stochastic scenario generation method // IEEE Transactions on sustainable energy. 2015. № 6. Pр. 422–433.
  13. Dreiseitl S., Ohno-Machado L. Logistic regression and artificial neural network classification models: a methodology review // Journal of biomedical informatics. 2002. № 35. Pр. 352–359.
  14. Kliestik T., Kocisova K., Misankova M. Logit and probit Model used for prediction of financial health of company // Procedia economics and finance. 2015. № 23. Pр. 850–855.
  15. Краковский Ю.М., Лузгин А.Н. Интервальное прогнозирование нестационарных динамических показателей на основе модели вероятностной нейронной сети // Научная мысль. 2016. № 1. C. 116–122.
  16. Краковский Ю.М., Лузгин А.Н. Проверка нестационарности динамических показателей по критерию сдвига Краскела-Уоллиса // Байкальский Вестник ДААД. 2016. № 1. С. 17–23.
  17. Кобзарь А.И. Прикладная математическая статистика. М. : Физматлит, 2006. 816 с.
  18. Hettmansperger T.P., McKean J.W. Robust nonparametric statistical methods. New York : Chapman-Hall. 2011. 553 p.
  19. Kloke J., McKean J.W.  Nonparametric statistical methods using R. New York : Chapman-Hall. 2014. 283 p.
  20. CS229 Lecture notes [Electronic resource] // Stanford University. URL: https://see.stanford.edu/materials/aimlcs229/cs229-notes1.pdf (access date: 10.09.2017).
  21. Minka T.P. Algorithm for maximum-likelihood logistic regression [Electronic resource]. URL: https://tminka.github.io/papers/logreg/minka-logreg.pdf (access date: 08.07.2017).
  22. Genkin A., Lewis D.D., Madigan D.D. Sparse logistic regression for text categorization [Electronic resource]. URL: http://www.ics.uci.edu/textasciitilde smyth/courses/cs277/papers/genkin_logistic_regression_sparse.pdf  (access date: 02.02.2017).
  23. The R-Project of statistical computing [Electronic resource]. URL: http://www.r-project.org (access date:: 10.11.2017).
  24. Краковский Ю.М. Программное обеспечение интервального прогнозирования нестационарных динамических показателей // Вестник ИрГТУ. 2015. Т. 1. № 4. С. 12–16.
  25. RStudio [Электронный ресурс]. URL: https://www.rstudio.com (дата обращения: 11.11.2016).
  26. Package ‘gWidgets2’ [Electronic resource]. URL: https://cran.r-project.org/web/packages/gWidgets2 (access date:  01.01.2017).
  27. RGtk2. [Electronic resource]. URL: https://cran.r-project.org/web/packages/RGtk2 (access date: 02.15.2017).
  28. A Library for Large Linear Classification [Electronic resource]. URL: https://www.csie.ntu.edu.tw/\textasciitilde cjlin/liblinear (access date: 15.05.2017).
  29. Rufibach K. Use of Brier score to assess binary predictions // Journal of clinical epidemiology. 2010. № 63(8). Pр 938–939.
  30. Air Quality Data of Switzerland [Electronic resource]. URL: https://cran.r-project.org/web/packages/SwissAir/index.html (access date: 11.03.2016).
  31. DataMarket [Electronic resource]. URL: https://datamarket.com/data (дата обращения: 10.04.2017).
  32. SRCP [Electronic resource]. URL: http://www.crsp.com/products/documentation/crsp-calculations (access date: 11.03.2017).
  33. Madras Monthly Sea Level, CRU [Electronic resource]. URL: http://www.comp-engine.org/timeseries/time-series_data/data-11114 (access date: 18.05.2017).