Кслера8

Основные данные против справочных данных – DATAVERSITY

елосмайлик / Shutterstock

Термины «основные данные» и «справочные данные» довольно легко спутать. Оба предоставляют данные, которые меняются лишь изредка с течением времени, и предоставляют данные, которые должны быть точными и актуальными. 

Основные данные предоставляют точную информацию, необходимую для бизнес-операций, имеющих решающее значение для ведения бизнеса, — постоянную/полупостоянную информацию о клиентах, сотрудниках и поставщиках, а также продуктах и ​​активах организации. 

С другой стороны, справочные данные обычно являются долгосрочными (но не всегда) и используются для определения и классификации «других» данных.

Путаница усугубляется обзорами программных платформ, названия которых фокусируются на справочных данных, но затем переходят к описанию платформ управления основными данными (MDM), причем только одна или две платформы поддерживают справочные данные.

Стандартизированного определения справочных данных не существует. (Для лучшего понимания справочных данных подумайте о справочном разделе в вашей публичной библиотеке.) «Другие» долгосрочные данные охватывают широкий спектр потребностей и отраслей. Например, в финансовой отрасли справочные данные — это общий термин для обозначения подробной информации, используемой во время транзакций. динамические справочные данные. Справочные данные о росте детей, разработанные Всемирной организацией здравоохранения, представляют собой еще один пример – использование статических справочных данных. Небольшая выборка различных типов справочных данных включает в себя:

Основные данные предоставляют основную информацию, необходимую для бизнес-операций, и могут требовать ограниченного доступа по соображениям безопасности. Справочные данные предоставляют дополнительную информацию, которая помогает бизнесу работать более эффективно и часто легко доступна всем сотрудникам.

Справочные и основные данные должны быть точными и актуальными.  

Организации могут хранить справочные данные в нескольких местах. Если программное обеспечение поддерживает это, справочные данные могут быть сохранены в каталогах данных, программном обеспечении управления данными и платформах управления основными данными. Кроме того, существует несколько программ, специально предназначенных для работы со справочными данными. В некоторых случаях, например, при использовании информационное хранилище, справочные данные могут быть настроены как подразделение основных данных. 

Что Справочные данные?

Справочные данные поступают из различных источников, и ими необходимо управлять для обеспечения синхронизации бизнес-систем. Эффективный метод сделать это — использовать платформу управления данными, которая включает в себя программное обеспечение для ссылок на данные. Без такого типа управления справочные данные могут быть разобщенный внутри ведомственной организации. Его также можно определять и управлять по-разному, если разные отделы используют свои собственные тактики сбора и хранения справочных данных. Примеры часто используемых справочных данных включают:

  • Коды транзакций
  • Задачи и бизнес-процессы
  • Финансовые иерархии
  • Сегментация клиентов
  • Информация о валюте
  • Коды штатов или стран
  • Типы организационных подразделений
  • Языковые коды
  • Центры затрат

Справочные данные могут быть взяты как из государственных, так и из частных источников и предоставляют информацию для различных областей. Из-за сложных связей между доменами и приложениями, поддерживающими справочные данные, управление ими может представлять некоторые проблемы. Управление справочными данными не должно осуществляться вручную. Справочные данные обычно используются каждым отделом организации, чтобы обеспечить контекст для своих данных. Он поддерживает Качество данных и удобство использования данных. 

Справочные данные обеспечивают основу для процесса интерпретации данных, который используется в различных приложениях, системах и процессах.

Основная цель справочных данных — установить общие определения, классификации и связи для элементов данных. Он также использует предопределенные коды и значения. Благодаря этому справочные данные повышают качество данных и оптимизируют процесс интеграции данных. Это, в свою очередь, упрощает обмен данными.

Например, в финансовой отрасли используются идентификаторы безопасности, такие как Международные идентификационные номера ценных бумаг (ISIN) или символы тикера которые передают справочные данные, идентифицирующие финансовые инструменты — облигации, акции и деривативы. В электронной коммерции использование кодов продуктов и категоризации может значительно упростить стандартизированное управление запасами и ценообразование. В здравоохранении системы медицинского кодирования помогают точно классифицировать медицинские услуги и выставлять счета за них.

Основные данные и управление основными данными Разъяснения

Разработаны два типа управления основными данными: аналитический и оперативный. Оперативное управление основными данными описывает основные данные, которые организация использует для ведения бизнеса. Эти данные должны быть точными и заслуживающими доверия, чтобы избежать проблем с транзакциями и доставкой и обеспечить бесперебойное ведение бизнеса.

Аналитические системы управления основными данными используют основные данные, чтобы избежать проблем, возникающих из-за противоречивой и избыточной информации. Без использования основных данных разные отделы будут разрабатывать свои собственные версии основных данных, что приведет к появлению множества списков с ошибками.

Чтобы лучше понять основные данные, рассмотрим, чем основные данные не являются. 

  • Это не транзакционные данные: Транзакционные данные генерируются различными приложениями, поддерживающими повседневные бизнес-процессы продаж и покупок. Хотя эта информация записывается и хранится, данные транзакций не используются на регулярной основе.
  • Это не неструктурированные данные: Свободная форма или неструктурированные данные не организован и не отформатирован. Данные произвольной формы состоят из неструктурированного текста, чисел, дат и практически любых данных, которые не отформатированы или не преобразованы для работы с системой организации. Неструктурированные данные могут включать письменное содержимое веб-страниц или документов, электронные письма, опросы, журнальные статьи, маркетинговые исследования и т. д.

При наличии соответствующего программного обеспечения управление основными данными может предоставлять широкий спектр услуг, таких как очистка данных, преобразование данных и процессы интеграции данных. По мере добавления новых источников данных программное обеспечение для управления основными данными может идентифицировать, собирать, преобразовывать и интегрировать новые данные в систему основных данных. 

Ниже приведены примеры обычно используемых основных данных:

  • Данные клиентов: Базовые данные о клиентах, которые обычно считаются наиболее часто используемой формой основных данных, включают в себя платежные адреса, адреса электронной почты и номера телефонов, но теперь включают индивидуальные покупательские предпочтения, основанные на предыдущих покупках.
  • Данные продукта: В этом типе данных содержится вся информация, необходимая для поддержки проектирования, производства, поставок и обслуживания продуктов бизнеса. Данные о продукте включают технические характеристики, чертежи, детали и сборки. Он также может включать счета на материалы, рабочие инструкции и утвержденных поставщиков.
  • Данные о сотруднике: Эти данные должны быть доступны не всем сотрудникам, а только избранным. Обычно он включает номер социального страхования сотрудника и прямой депозитный счет, которые следует хранить в тайне. Также может быть указана такая информация, как домашний адрес, номер телефона, ближайшие родственники.
  • Покупки: Данные о крупных покупках и конкретных сделках с акциями могут быть указаны в качестве основных данных.
  • Данные о местоположении филиала: Местоположение филиалов, магазинов, объектов и франшиз является постоянной/полупостоянной информацией и используется на регулярной основе.

Основные данные в сочетании с управлением основными данными могут использоваться для поддержки анализа данных. Основные данные часто используются в аналитике, отчасти потому, что они надежны, последовательны и заслуживают доверия. Например, компания, которая использует несколько систем для хранения данных своих клиентов, рискует, что каждая система будет работать с разными версиями этих данных и испортить анализ, объединяющий данные разных систем.

Некоторые организации предпочитают ограничить доступ передавать основные данные небольшому числу соответствующих сотрудников – по соображениям безопасности – при этом справочные данные становятся доступными для всех в организации.

Хранилища данных, основные данные и справочные данные

Хранилище данных — это форма управления и хранения данных, предназначенная для поддержки аналитики и разработки бизнес-аналитика. Кроме того, его можно использовать для хранения как основных, так и справочных данных. Хранилища данных масштабируются и могут быть легко расширены. По мере роста бизнеса потребности в хранении данных возрастают, включая потребности в растущем объеме хранения основных и справочных данных. Хранилища данных позволяют такой рост.

Хранилища данных могут выполнять множество задач, включая разработку бизнес-аналитики, и они особенно полезны для анализа значительных объемов данных за длительные периоды времени.

Аналитическое управление основными данными можно скоординировать с хранилищем данных, где оно централизует и консолидирует данные. Данные поступают в хранилище данных из различных источников, включая данные, собранные с внешних сайтов, внутренние данные транзакций, операционные основные данные и справочные данные. Этот процесс позволяет организациям получать ценную информацию из своих данных.

Справочные данные могут храниться в хранилище данных, обычно как часть основных данных. Хранилища данных часто организуют данные по схеме «звезда» или «снежинка» с центральной таблицей «фактов», содержащей первичные данные, и дополнительными таблицами «измерений», которые содержат справочные данные, связанные с первичными данными. Например, в хранилище банковских данных его таблица фактов может содержать банковские данные, такие как сумма кредита, дата выдачи кредита и клиент, получивший кредит, в то время как таблицы измерений (справочные данные) могут содержать информация о продукте, демографические данные клиентов и данные о местоположении.

Чат с нами

Всем привет! Могу я чем-нибудь помочь?