Описание:Целью курса является формирование теоретических и практических навыков извлечения цифровых данных из сети Интернет и приведение их к удобному для анализа и визуализации виду.
Программа призвана обеспечить формирование у слушателей критического мышления, способности адекватно оценивать поступающую информацию, применять социологические методы для диагностики проблем современного общества, проводить самостоятельный анализ цифровых данных с использованием языка программирования Python.
Знания, получаемые в ходе освоения данной программы, служат основой для дальнейшей научной и экспертной деятельности, а также научного познания в целом, способствуют повышению профессиональных компетенций слушателей.
Изучаемые темы:
1. Феномен «цифровых» следов и их использование в социологическом исследовании. Виды цифровых данных.
2. Технологии извлечения данных из сети Интернет: API, Web-Scraping.
3. Базовый синтаксис языка программирования Python.
4. Библиотека Python requests для работы с данными из сети Интернет.
5. Создание эффективных интернет запросов для извлечения цифровых данных.
6. Библиотека Python Beautiful Soup для извлечения цифровых данных.
7. Парсинг html страниц для извлечения цифровых данных.
8. Обработка, очистка и подготовка данных для анализа.
9. Описательные статистики в Python, первичная визуализация данных.