Спикер рассказала как оценивать пригодность данных исходя из состава атрибутов качества, определенных в DAMA-DMBOK. Следом, студенты попробовали свои силы в определении уровня качества данных на основе реальных примеров и кейсов от HFLabs.

Были разобраны все 11 классических метрик, которые в будущем помогут студентам применять их в рамках проектной деятельности, предусмотренной учебным планом.
Также были разобраны примеры зависимости качества данных от контекста решаемой проблемы и вопросы непостоянства и изменений в данных в силу естественных процессов.
Лекция Татьяны была насыщена интерактивными элементами, что позволило студентам эффективнее воспринимать информацию и освоить инструменты исследования качества данных. По результатам практических занятий студенты научились делать первичный анализ и отвечать на несколько ключевых вопросов, которые должен задавать каждый аналитик данных: откуда получена информация? В каких бизнес-процессах участвуют этот датасет? Для чего мы должны их анализировать? Что изменится по итогу анализа данных? Какой перечень данных есть в источнике и какую часть от этого составляет датасет?
