Классификация типов данных с точки зрения разработки

Michael Sokolov
2 min readNov 24, 2023

Внутри информационных систем данные могут быть очень разнообразными и требуют различных подходов к управлению и версионированию. Это важно учитывать в контексте ведения разработки. В широком смысле данные — это все что хранится в СУБД.

Классификация:

  1. Структура базы данных(DDL). Эти данные, часто называемые DDL или метаданными, включают информацию о таблицах, полях, типах данных, отношениях, ограничениях и индексах, которые определяют как данные организованы и как они взаимодействуют друг с другом.
    Пример — alter table
    Обычно скрупулезно версионируются и сопоставляются с исходным кодом приложения. Стратегии версионирования, включающие использование SQL скриптов и методов сериализации БД
  2. Неотъемлемые данные приложения: Это данные необходимые для работы приложения и относящтеся к DML, например список внутренних типов бизнес объектов, По тем или иным причинам не попавший в корпоративный НСИ. Пример - перечисление бизнес стадий заявки. Обычно версионируются или так же как DDL или внутри самого приложания.
  3. Нормативно-справочная информация (НСИ) или Master Data: Эти данные обычно включают ключевую информацию, используемую на протяжении всей организации, например, сведения о клиентах, продуктах, поставщиках. Здесь важно обеспечить централизованное управление и версионирование для поддержания актуальности и точности данных.
  4. Первичные данные: Исходные данные, вводимые в систему, например, налоговые декларации или пользовательские данные.
  5. Персональные данные или другие данные прямо попадающие под регулирование (№152-ФЗ, PCI DSS, GDPR). Очень индивидуальные решения по управлению и контролю.
  6. Вторичные данные и данные из аналитического слоя: Это могут быть копии данных из других сервисов или данные, полученные из первичных путем преобразований. Управление необходимо для отслеживания происхождения данных и их актуальности. В случае утери — реплицируются или генерируются заново.
  7. Служебные данные: Как правило, это логи и другие данные, связанные с операционной деятельностью системы. Обычно или архивируются или централизуются для анализа и потом архивируются.
  8. Тестовые данные. Используются для тестирования системы, включая функциональное и нагрузочное тестирование. Обычно версионируются и управляются вместе с кодом самих тестов.

Важно учитывать не только технические аспекты, но и бизнес-требования, требования к качеству, правила безопасности и регулятивные нормы. У каждого типа данных может быть своя политика использования и хранения. Это неизбежно приводит к разными подходам к версионированию и управлению.

--

--