Xlera8

داده های اصلی در مقابل داده های مرجع - DATAVERSITY

yelosmiley / Shutterstock

اصطلاحات "داده اصلی" و "داده های مرجع" را می توان به راحتی اشتباه گرفت. هر دو داده‌هایی را ارائه می‌دهند که فقط گهگاهی در طول زمان تغییر می‌کنند و داده‌هایی را ارائه می‌کنند که دقیق و به‌روز طراحی شده‌اند. 

داده‌های اصلی اطلاعات دقیق مورد نیاز برای تراکنش‌های تجاری را که برای اجرای یک کسب‌وکار حیاتی هستند - اطلاعات دائمی/نیمه دائمی در مورد مشتریان، کارمندان و تامین‌کنندگان و محصولات و دارایی‌های سازمان ارائه می‌کند. 

از سوی دیگر، داده‌های مرجع معمولاً بلندمدت هستند (اما نه همیشه) و در تعریف و طبقه‌بندی داده‌های «سایر» استفاده می‌شوند.

این سردرگمی با بررسی پلت فرم نرم‌افزار با عناوینی که بر داده‌های مرجع تمرکز می‌کنند، اغراق‌آمیز می‌شود، اما سپس به توصیف پلتفرم‌های مدیریت داده اصلی (MDM) تغییر می‌کند، تنها یک یا دو پلتفرم از داده‌های مرجع پشتیبانی می‌کنند.

تعریف استانداردی برای داده های مرجع وجود ندارد. (برای درک بهتر داده های مرجع، به بخش مرجع در کتابخانه عمومی خود فکر کنید.) داده های بلند مدت «سایر» طیف وسیعی از نیازها و صنایع را پوشش می دهد. به عنوان مثال، در صنعت مالی، داده های مرجع یک اصطلاح جامع برای اطلاعات دقیق مورد استفاده در طی معاملات - با استفاده از آن است داده های مرجع پویا. داده های مرجع رشد کودکان که توسط سازمان بهداشت جهانی تهیه شده است، مثال دیگری را ارائه می دهد - با استفاده از داده های مرجع استاتیک. نمونه کوچکی از انواع داده های مرجع شامل موارد زیر است:

داده های اصلی اطلاعات اولیه مورد نیاز برای تراکنش های تجاری را فراهم می کند و ممکن است به دلایل امنیتی به دسترسی محدودی نیاز داشته باشد. داده های مرجع اطلاعات بیشتری را فراهم می کند که به کسب و کار کمک می کند کارآمدتر عمل کند و اغلب به راحتی برای همه کارکنان قابل دسترسی است.

داده های مرجع و داده های اصلی لازم است که هم دقیق و هم به روز باشند.  

سازمان ها می توانند داده های مرجع را در تعدادی مکان ذخیره کنند. اگر نرم‌افزار از آن پشتیبانی کند، داده‌های مرجع را می‌توان در کاتالوگ‌های داده، نرم‌افزار مدیریت داده و پلت‌فرم‌های مدیریت داده اصلی ذخیره کرد. علاوه بر این، چند برنامه نرم افزاری خاص برای داده های مرجع وجود دارد. در برخی شرایط، مانند هنگام استفاده از a انبار داده، داده های مرجع را می توان به عنوان یک زیربخش از داده های اصلی تنظیم کرد. 

چیست داده های مرجع?

داده های مرجع از منابع مختلفی می آیند و باید برای پشتیبانی از همگام سازی سیستم های کسب و کار مدیریت شوند. یک روش کارآمد برای انجام این کار استفاده از یک پلت فرم حاکمیت داده است که شامل نرم افزار مرجع داده است. بدون این نوع مدیریت، داده های مرجع ممکن است سیل زده در یک سازمان بخش همچنین اگر بخش‌های مختلف از تاکتیک‌های خاص خود برای جمع‌آوری و ذخیره داده‌های مرجع استفاده کنند، ممکن است متفاوت تعریف و مدیریت شود. نمونه هایی از داده های مرجع رایج عبارتند از:

  • کدهای تراکنش
  • وظایف و فرآیندهای تجاری
  • سلسله مراتب مالی
  • تقسیم بندی مشتریان
  • اطلاعات ارز
  • کدهای ایالت یا کشور
  • انواع واحدهای سازمانی
  • کدهای زبان
  • مراکز هزینه

داده های مرجع را می توان هم از منابع عمومی و هم از منابع خصوصی گرفته و اطلاعات را در حوزه های مختلف فراهم می کند. به دلیل ارتباطات پیچیده بین دامنه ها و برنامه هایی که از داده های مرجع پشتیبانی می کنند، مدیریت آن می تواند چالش هایی را ایجاد کند. مدیریت داده های مرجع نباید به صورت دستی انجام شود. داده های مرجع معمولاً توسط هر بخش در سازمان برای کمک به ارائه زمینه داده های خود استفاده می شود. پشتیبانی می کند کیفیت داده و قابلیت استفاده از داده ها 

داده های مرجع پایه ای را برای فرآیند تفسیر داده ها فراهم می کند که در برنامه ها، سیستم ها و فرآیندهای مختلف استفاده می شود.

هدف اصلی داده های مرجع ایجاد تعاریف، طبقه بندی و روابط مشترک برای عناصر داده است. همچنین از کدها و مقادیر از پیش تعریف شده استفاده می کند. با انجام این کار، داده های مرجع کیفیت داده ها را افزایش داده و فرآیند یکپارچه سازی داده ها را ساده می کند. این به نوبه خود به اشتراک گذاری داده ها را ساده می کند.

به عنوان مثال، صنعت مالی از شناسه های امنیتی استفاده می کند، مانند شماره های شناسایی بین المللی اوراق بهادار (ISIN) یا نمادهای تیکر که داده‌های مرجعی را که ابزارهای مالی - اوراق قرضه، سهام و مشتقات را شناسایی می‌کند، منتقل می‌کند. در طول تجارت الکترونیک، استفاده از کدهای محصول و دسته بندی می تواند مدیریت استاندارد موجودی و قیمت گذاری را بسیار آسان تر کند. در مراقبت‌های بهداشتی، سیستم‌های کدگذاری پزشکی به طبقه‌بندی دقیق و صورت‌حساب خدمات پزشکی کمک می‌کنند.

Master Data و Master Data Management توضیح داد

دو نوع مدیریت داده اصلی ایجاد شده است: تحلیلی و عملیاتی. مدیریت داده های اصلی عملیاتی، داده های اصلی را که یک سازمان برای انجام تجارت استفاده می کند، توصیف می کند. این داده ها باید دقیق و قابل اعتماد باشند تا از مشکلات مبادله و تحویل جلوگیری کنند و از جریان روان تجارت پشتیبانی کنند.

سیستم های مدیریت داده اصلی تحلیلی از داده های اصلی برای جلوگیری از مشکلات ناشی از اطلاعات متناقض و اضافی استفاده می کنند. بدون استفاده از داده‌های اصلی، بخش‌های مختلف نسخه‌های خود را از داده‌های اصلی توسعه می‌دهند، که منجر به فهرست‌های متعدد، با خطاهای خزنده می‌شود.

برای درک بهتر داده های اصلی، در نظر بگیرید که چه داده های اصلی نیستند. 

  • این داده های معاملاتی نیست: داده‌های تراکنش‌ها توسط برنامه‌های کاربردی مختلف تولید می‌شوند که از فرآیندهای روزانه فروش و خرید پشتیبانی می‌کنند. در حالی که این اطلاعات ثبت و ذخیره می شود، از داده های تراکنش به طور منظم استفاده نمی شود.
  • داده های بدون ساختار نیست: فرم آزاد یا داده های بدون ساختار نه سازماندهی شده و نه قالب بندی شده است. داده های فرم آزاد شامل متن بدون ساختار، اعداد، تاریخ ها و اساساً هر داده ای است که برای کار با سیستم سازمان فرمت/تبدیل نشده است. داده های بدون ساختار می تواند شامل محتوای مکتوب صفحات وب یا اسناد، ایمیل ها، نظرسنجی ها، مقالات مجلات، تحقیقات بازاریابی و غیره باشد.

با نرم افزار مناسب، مدیریت داده های اصلی می تواند طیف گسترده ای از خدمات مانند پاکسازی داده ها، تبدیل داده ها و فرآیندهای یکپارچه سازی داده ها را ارائه دهد. با اضافه شدن منابع داده جدید، استاد نرم افزار مدیریت داده ها می تواند داده های جدید را شناسایی، جمع آوری، تبدیل و در سیستم داده اصلی ادغام کند. 

نمونه‌هایی از داده‌های اصلی معمولاً مورد استفاده در زیر فهرست شده‌اند:

  • اطلاعات مشتری: به طور کلی رایج‌ترین شکل داده‌های اصلی در نظر گرفته می‌شود، داده‌های اصلی مشتری شامل آدرس‌های صورت‌حساب، آدرس‌های ایمیل و شماره تلفن‌ها می‌شود، اما به گونه‌ای رشد کرده است که بر اساس خریدهای قبلی، ترجیحات خرید فردی را شامل می‌شود.
  • داده های محصول: این نوع داده ها تمام اطلاعات مورد نیاز برای پشتیبانی از طراحی، تولید، تحویل و نگهداری محصولات یک کسب و کار را فهرست می کند. داده های محصول شامل مشخصات فنی، نقشه ها، قطعات و مجموعه ها است. همچنین ممکن است شامل صورت‌حساب‌های مواد، دستورالعمل‌های کاری و تامین‌کنندگان تایید شده باشد.
  • داده های کارکنان: این داده ها نباید در دسترس همه کارکنان باشد، بلکه فقط تعداد معدودی از آنها در دسترس باشند. معمولاً شامل شماره تأمین اجتماعی و حساب سپرده مستقیم کارمند است که باید خصوصی نگه داشته شود. همچنین ممکن است اطلاعاتی مانند آدرس منزل، شماره تلفن، اقوام نزدیک آنها ذکر شود.
  • خریدها: داده‌های مربوط به خریدهای بزرگ و معاملات سهام خاص ممکن است به عنوان داده اصلی فهرست شوند.
  • اطلاعات مکان شعبه: مکان شعب، فروشگاه ها، امکانات و حق امتیازها اطلاعات دائمی/نیمه دائمی هستند و به طور منظم استفاده می شوند.

داده های اصلی، همراه با مدیریت داده های اصلی، می توانند برای پشتیبانی از تجزیه و تحلیل داده ها استفاده شوند. داده های اصلی اغلب با تجزیه و تحلیل استفاده می شوند، تا حدی به این دلیل که قابل اعتماد، سازگار و قابل اعتماد هستند. به عنوان مثال، کسب‌وکاری که از سیستم‌های متعدد برای ذخیره داده‌های مشتریان خود استفاده می‌کند، این خطر را دارد که هر سیستم با نسخه‌های متفاوتی از آن داده‌ها کار کند و تجزیه و تحلیلی را که داده‌های سیستم‌های مختلف را ترکیب می‌کند، خراب کند.

چندین سازمان ترجیح می دهند دسترسی را محدود کنید داده های اصلی به تعداد کمی از کارکنان مناسب - به دلایل امنیتی - در حالی که داده های مرجع را برای همه افراد سازمان در دسترس قرار می دهد.

انبارهای داده، داده های اصلی و داده های مرجع

انبار داده شکلی از مدیریت و ذخیره سازی داده است که برای پشتیبانی از تجزیه و تحلیل و توسعه طراحی شده است هوش تجاری. علاوه بر این، می توان از آن برای ذخیره داده های اصلی و داده های مرجع استفاده کرد. انبارهای داده مقیاس پذیر هستند و به راحتی قابل گسترش هستند. همانطور که یک کسب و کار رشد می کند، نیازهای ذخیره سازی داده های آن افزایش می یابد، از جمله نیاز آن به مقدار فزاینده ای از داده های اصلی و ذخیره سازی داده های مرجع. انبارهای داده امکان این رشد را فراهم می کنند.

انبارهای داده می توانند وظایف مختلفی از جمله توسعه هوش تجاری را انجام دهند و به ویژه برای تجزیه و تحلیل مقادیر قابل توجهی از داده ها در دوره های زمانی طولانی مفید هستند.

مدیریت داده های اصلی تحلیلی می تواند هماهنگ شود با یک انبار داده که در آن داده ها را متمرکز و یکپارچه می کند. داده ها از منابع مختلفی به انبار داده ها جریان می یابد، از جمله داده های جمع آوری شده از سایت های خارجی، داده های تراکنش داخلی، داده های اصلی عملیاتی و داده های مرجع. این فرآیند به سازمان ها اجازه می دهد تا بینش های ارزشمندی را از داده های خود به دست آورند.

داده های مرجع را می توان در یک انبار داده، به طور معمول به عنوان یک زیربخش از داده های اصلی، ذخیره کرد. انبارهای داده اغلب داده ها را با استفاده از یک طرحواره ستاره یا دانه برف، با یک جدول "واقعیت" مرکزی که حاوی داده های اولیه است، و جداول "بعد" اضافی، که حاوی داده های مرجع مربوط به داده های اولیه است، سازماندهی می کنند. به عنوان مثال، در یک انبار داده بانکی، جدول واقعی آن ممکن است حاوی داده های بانکی باشد، مانند مبلغ وام، تاریخ اعطای وام، و مشتری که وام را دریافت کرده است، در حالی که جداول ابعاد (داده های مرجع) می تواند شامل باشد. اطلاعات مربوط به اطلاعات محصول، جمعیت شناسی مشتری و داده های مکان.

چت با ما

سلام! چگونه می توانم به شما کمک کنم؟