Формирование баз данных в программной среде R: опыт экономических исследований на муниципальном уровне

Прокопьев Егор Александрович - кандидат экономических наук, ведущий научный сотрудник лаборатории цифровых технологий регионального развития отдела комплексных научных исследований. Карельский научный центр Российской академии наук

Иголкин Владислав Александрович - стажер-исследователь лаборатории цифровых технологий регионального развития отдела комплексных научных исследований. Карельский научный центр Российской академии наук

Аннотация

Отсутствие официальной статистики по уровню социально-экономического развития территорий или длительный лаг в ее опубликовании заставляет исследователей обращаться к альтернативным источникам данных, возникающим благодаря стремительному развитию цифровых технологий. Для работы с этими дан ными достаточно владеть интерпретируемым объектно-ориентированным языком программирования R. Целью статьи является знакомство читателя с возможностями программной среды R при формировании из разных источников муниципальной базы данных для социально-экономических исследований. В качестве источников данных рассмотрены: база данных Росстата «Показатели муниципальных образований»; форма налоговой отчетности 5-НДФЛ, сайт Федеральной налоговой службы; сайт Центральной избирательной комиссии Российской Федерации; сервис TurgetHunter. В рамках подготовительного этапа формирования базы данных показано, какие параметры необходимо учитывать при создании вспомогательной таблицы-ключа. На примере работы с данными разобраны функции left_join(), pivot_longer(), fill(), group_ by(), arrange(), summarize(), separate(). Изложенный материал можно использовать для разработки учебных задач в рамках дисциплин «Основы статистики» или «Анализ данных», а также для подготовки статистической базы для исследований социально-экономических процессов на муниципальном уровне.

Ключевые слова: программная среда R; база данных; муниципальная статистика; альтернативные источники данных; сбор и обработка данных

Для цитирования: Прокопьев Е.А., Иголкин В.А. Формирование баз данных в программной среде R: опыт экономических исследований на муниципальном уровне // Цифровые модели и решения. 2024. Т. 3, № 4. С. 27–46. DOI: 10.29141/2949-477X 2024-3-4-2. EDN: VISTZA.

Скачать статью