Классификация типов данных с точки зрения разработки
2 min readNov 24, 2023
Внутри информационных систем данные могут быть очень разнообразными и требуют различных подходов к управлению и версионированию. Это важно учитывать в контексте ведения разработки. В широком смысле данные — это все что хранится в СУБД.
Классификация:
- Структура базы данных(DDL). Эти данные, часто называемые DDL или метаданными, включают информацию о таблицах, полях, типах данных, отношениях, ограничениях и индексах, которые определяют как данные организованы и как они взаимодействуют друг с другом.
Пример — alter table
Обычно скрупулезно версионируются и сопоставляются с исходным кодом приложения. Стратегии версионирования, включающие использование SQL скриптов и методов сериализации БД - Неотъемлемые данные приложения: Это данные необходимые для работы приложения и относящтеся к DML, например список внутренних типов бизнес объектов, По тем или иным причинам не попавший в корпоративный НСИ. Пример - перечисление бизнес стадий заявки. Обычно версионируются или так же как DDL или внутри самого приложания.
- Нормативно-справочная информация (НСИ) или Master Data: Эти данные обычно включают ключевую информацию, используемую на протяжении всей организации, например, сведения о клиентах, продуктах, поставщиках. Здесь важно обеспечить централизованное управление и версионирование для поддержания актуальности и точности данных.
- Первичные данные: Исходные данные, вводимые в систему, например, налоговые декларации или пользовательские данные.
- Персональные данные или другие данные прямо попадающие под регулирование (№152-ФЗ, PCI DSS, GDPR). Очень индивидуальные решения по управлению и контролю.
- Вторичные данные и данные из аналитического слоя: Это могут быть копии данных из других сервисов или данные, полученные из первичных путем преобразований. Управление необходимо для отслеживания происхождения данных и их актуальности. В случае утери — реплицируются или генерируются заново.
- Служебные данные: Как правило, это логи и другие данные, связанные с операционной деятельностью системы. Обычно или архивируются или централизуются для анализа и потом архивируются.
- Тестовые данные. Используются для тестирования системы, включая функциональное и нагрузочное тестирование. Обычно версионируются и управляются вместе с кодом самих тестов.
Важно учитывать не только технические аспекты, но и бизнес-требования, требования к качеству, правила безопасности и регулятивные нормы. У каждого типа данных может быть своя политика использования и хранения. Это неизбежно приводит к разными подходам к версионированию и управлению.