اصطلاحات "داده اصلی" و "داده های مرجع" را می توان به راحتی اشتباه گرفت. هر دو دادههایی را ارائه میدهند که فقط گهگاهی در طول زمان تغییر میکنند و دادههایی را ارائه میکنند که دقیق و بهروز طراحی شدهاند.
دادههای اصلی اطلاعات دقیق مورد نیاز برای تراکنشهای تجاری را که برای اجرای یک کسبوکار حیاتی هستند - اطلاعات دائمی/نیمه دائمی در مورد مشتریان، کارمندان و تامینکنندگان و محصولات و داراییهای سازمان ارائه میکند.
از سوی دیگر، دادههای مرجع معمولاً بلندمدت هستند (اما نه همیشه) و در تعریف و طبقهبندی دادههای «سایر» استفاده میشوند.
این سردرگمی با بررسی پلت فرم نرمافزار با عناوینی که بر دادههای مرجع تمرکز میکنند، اغراقآمیز میشود، اما سپس به توصیف پلتفرمهای مدیریت داده اصلی (MDM) تغییر میکند، تنها یک یا دو پلتفرم از دادههای مرجع پشتیبانی میکنند.
تعریف استانداردی برای داده های مرجع وجود ندارد. (برای درک بهتر داده های مرجع، به بخش مرجع در کتابخانه عمومی خود فکر کنید.) داده های بلند مدت «سایر» طیف وسیعی از نیازها و صنایع را پوشش می دهد. به عنوان مثال، در صنعت مالی، داده های مرجع یک اصطلاح جامع برای اطلاعات دقیق مورد استفاده در طی معاملات - با استفاده از آن است داده های مرجع پویا. داده های مرجع رشد کودکان که توسط سازمان بهداشت جهانی تهیه شده است، مثال دیگری را ارائه می دهد - با استفاده از داده های مرجع استاتیک. نمونه کوچکی از انواع داده های مرجع شامل موارد زیر است:
داده های اصلی اطلاعات اولیه مورد نیاز برای تراکنش های تجاری را فراهم می کند و ممکن است به دلایل امنیتی به دسترسی محدودی نیاز داشته باشد. داده های مرجع اطلاعات بیشتری را فراهم می کند که به کسب و کار کمک می کند کارآمدتر عمل کند و اغلب به راحتی برای همه کارکنان قابل دسترسی است.
داده های مرجع و داده های اصلی لازم است که هم دقیق و هم به روز باشند.
سازمان ها می توانند داده های مرجع را در تعدادی مکان ذخیره کنند. اگر نرمافزار از آن پشتیبانی کند، دادههای مرجع را میتوان در کاتالوگهای داده، نرمافزار مدیریت داده و پلتفرمهای مدیریت داده اصلی ذخیره کرد. علاوه بر این، چند برنامه نرم افزاری خاص برای داده های مرجع وجود دارد. در برخی شرایط، مانند هنگام استفاده از a انبار داده، داده های مرجع را می توان به عنوان یک زیربخش از داده های اصلی تنظیم کرد.
چیست داده های مرجع?
داده های مرجع از منابع مختلفی می آیند و باید برای پشتیبانی از همگام سازی سیستم های کسب و کار مدیریت شوند. یک روش کارآمد برای انجام این کار استفاده از یک پلت فرم حاکمیت داده است که شامل نرم افزار مرجع داده است. بدون این نوع مدیریت، داده های مرجع ممکن است سیل زده در یک سازمان بخش همچنین اگر بخشهای مختلف از تاکتیکهای خاص خود برای جمعآوری و ذخیره دادههای مرجع استفاده کنند، ممکن است متفاوت تعریف و مدیریت شود. نمونه هایی از داده های مرجع رایج عبارتند از:
- کدهای تراکنش
- وظایف و فرآیندهای تجاری
- سلسله مراتب مالی
- تقسیم بندی مشتریان
- اطلاعات ارز
- کدهای ایالت یا کشور
- انواع واحدهای سازمانی
- کدهای زبان
- مراکز هزینه
داده های مرجع را می توان هم از منابع عمومی و هم از منابع خصوصی گرفته و اطلاعات را در حوزه های مختلف فراهم می کند. به دلیل ارتباطات پیچیده بین دامنه ها و برنامه هایی که از داده های مرجع پشتیبانی می کنند، مدیریت آن می تواند چالش هایی را ایجاد کند. مدیریت داده های مرجع نباید به صورت دستی انجام شود. داده های مرجع معمولاً توسط هر بخش در سازمان برای کمک به ارائه زمینه داده های خود استفاده می شود. پشتیبانی می کند کیفیت داده و قابلیت استفاده از داده ها
داده های مرجع پایه ای را برای فرآیند تفسیر داده ها فراهم می کند که در برنامه ها، سیستم ها و فرآیندهای مختلف استفاده می شود.
هدف اصلی داده های مرجع ایجاد تعاریف، طبقه بندی و روابط مشترک برای عناصر داده است. همچنین از کدها و مقادیر از پیش تعریف شده استفاده می کند. با انجام این کار، داده های مرجع کیفیت داده ها را افزایش داده و فرآیند یکپارچه سازی داده ها را ساده می کند. این به نوبه خود به اشتراک گذاری داده ها را ساده می کند.
به عنوان مثال، صنعت مالی از شناسه های امنیتی استفاده می کند، مانند شماره های شناسایی بین المللی اوراق بهادار (ISIN) یا نمادهای تیکر که دادههای مرجعی را که ابزارهای مالی - اوراق قرضه، سهام و مشتقات را شناسایی میکند، منتقل میکند. در طول تجارت الکترونیک، استفاده از کدهای محصول و دسته بندی می تواند مدیریت استاندارد موجودی و قیمت گذاری را بسیار آسان تر کند. در مراقبتهای بهداشتی، سیستمهای کدگذاری پزشکی به طبقهبندی دقیق و صورتحساب خدمات پزشکی کمک میکنند.
Master Data و Master Data Management توضیح داد
دو نوع مدیریت داده اصلی ایجاد شده است: تحلیلی و عملیاتی. مدیریت داده های اصلی عملیاتی، داده های اصلی را که یک سازمان برای انجام تجارت استفاده می کند، توصیف می کند. این داده ها باید دقیق و قابل اعتماد باشند تا از مشکلات مبادله و تحویل جلوگیری کنند و از جریان روان تجارت پشتیبانی کنند.
سیستم های مدیریت داده اصلی تحلیلی از داده های اصلی برای جلوگیری از مشکلات ناشی از اطلاعات متناقض و اضافی استفاده می کنند. بدون استفاده از دادههای اصلی، بخشهای مختلف نسخههای خود را از دادههای اصلی توسعه میدهند، که منجر به فهرستهای متعدد، با خطاهای خزنده میشود.
برای درک بهتر داده های اصلی، در نظر بگیرید که چه داده های اصلی نیستند.
- این داده های معاملاتی نیست: دادههای تراکنشها توسط برنامههای کاربردی مختلف تولید میشوند که از فرآیندهای روزانه فروش و خرید پشتیبانی میکنند. در حالی که این اطلاعات ثبت و ذخیره می شود، از داده های تراکنش به طور منظم استفاده نمی شود.
- داده های بدون ساختار نیست: فرم آزاد یا داده های بدون ساختار نه سازماندهی شده و نه قالب بندی شده است. داده های فرم آزاد شامل متن بدون ساختار، اعداد، تاریخ ها و اساساً هر داده ای است که برای کار با سیستم سازمان فرمت/تبدیل نشده است. داده های بدون ساختار می تواند شامل محتوای مکتوب صفحات وب یا اسناد، ایمیل ها، نظرسنجی ها، مقالات مجلات، تحقیقات بازاریابی و غیره باشد.
با نرم افزار مناسب، مدیریت داده های اصلی می تواند طیف گسترده ای از خدمات مانند پاکسازی داده ها، تبدیل داده ها و فرآیندهای یکپارچه سازی داده ها را ارائه دهد. با اضافه شدن منابع داده جدید، استاد نرم افزار مدیریت داده ها می تواند داده های جدید را شناسایی، جمع آوری، تبدیل و در سیستم داده اصلی ادغام کند.
نمونههایی از دادههای اصلی معمولاً مورد استفاده در زیر فهرست شدهاند:
- اطلاعات مشتری: به طور کلی رایجترین شکل دادههای اصلی در نظر گرفته میشود، دادههای اصلی مشتری شامل آدرسهای صورتحساب، آدرسهای ایمیل و شماره تلفنها میشود، اما به گونهای رشد کرده است که بر اساس خریدهای قبلی، ترجیحات خرید فردی را شامل میشود.
- داده های محصول: این نوع داده ها تمام اطلاعات مورد نیاز برای پشتیبانی از طراحی، تولید، تحویل و نگهداری محصولات یک کسب و کار را فهرست می کند. داده های محصول شامل مشخصات فنی، نقشه ها، قطعات و مجموعه ها است. همچنین ممکن است شامل صورتحسابهای مواد، دستورالعملهای کاری و تامینکنندگان تایید شده باشد.
- داده های کارکنان: این داده ها نباید در دسترس همه کارکنان باشد، بلکه فقط تعداد معدودی از آنها در دسترس باشند. معمولاً شامل شماره تأمین اجتماعی و حساب سپرده مستقیم کارمند است که باید خصوصی نگه داشته شود. همچنین ممکن است اطلاعاتی مانند آدرس منزل، شماره تلفن، اقوام نزدیک آنها ذکر شود.
- خریدها: دادههای مربوط به خریدهای بزرگ و معاملات سهام خاص ممکن است به عنوان داده اصلی فهرست شوند.
- اطلاعات مکان شعبه: مکان شعب، فروشگاه ها، امکانات و حق امتیازها اطلاعات دائمی/نیمه دائمی هستند و به طور منظم استفاده می شوند.
داده های اصلی، همراه با مدیریت داده های اصلی، می توانند برای پشتیبانی از تجزیه و تحلیل داده ها استفاده شوند. داده های اصلی اغلب با تجزیه و تحلیل استفاده می شوند، تا حدی به این دلیل که قابل اعتماد، سازگار و قابل اعتماد هستند. به عنوان مثال، کسبوکاری که از سیستمهای متعدد برای ذخیره دادههای مشتریان خود استفاده میکند، این خطر را دارد که هر سیستم با نسخههای متفاوتی از آن دادهها کار کند و تجزیه و تحلیلی را که دادههای سیستمهای مختلف را ترکیب میکند، خراب کند.
چندین سازمان ترجیح می دهند دسترسی را محدود کنید داده های اصلی به تعداد کمی از کارکنان مناسب - به دلایل امنیتی - در حالی که داده های مرجع را برای همه افراد سازمان در دسترس قرار می دهد.
انبارهای داده، داده های اصلی و داده های مرجع
انبار داده شکلی از مدیریت و ذخیره سازی داده است که برای پشتیبانی از تجزیه و تحلیل و توسعه طراحی شده است هوش تجاری. علاوه بر این، می توان از آن برای ذخیره داده های اصلی و داده های مرجع استفاده کرد. انبارهای داده مقیاس پذیر هستند و به راحتی قابل گسترش هستند. همانطور که یک کسب و کار رشد می کند، نیازهای ذخیره سازی داده های آن افزایش می یابد، از جمله نیاز آن به مقدار فزاینده ای از داده های اصلی و ذخیره سازی داده های مرجع. انبارهای داده امکان این رشد را فراهم می کنند.
انبارهای داده می توانند وظایف مختلفی از جمله توسعه هوش تجاری را انجام دهند و به ویژه برای تجزیه و تحلیل مقادیر قابل توجهی از داده ها در دوره های زمانی طولانی مفید هستند.
مدیریت داده های اصلی تحلیلی می تواند هماهنگ شود با یک انبار داده که در آن داده ها را متمرکز و یکپارچه می کند. داده ها از منابع مختلفی به انبار داده ها جریان می یابد، از جمله داده های جمع آوری شده از سایت های خارجی، داده های تراکنش داخلی، داده های اصلی عملیاتی و داده های مرجع. این فرآیند به سازمان ها اجازه می دهد تا بینش های ارزشمندی را از داده های خود به دست آورند.
داده های مرجع را می توان در یک انبار داده، به طور معمول به عنوان یک زیربخش از داده های اصلی، ذخیره کرد. انبارهای داده اغلب داده ها را با استفاده از یک طرحواره ستاره یا دانه برف، با یک جدول "واقعیت" مرکزی که حاوی داده های اولیه است، و جداول "بعد" اضافی، که حاوی داده های مرجع مربوط به داده های اولیه است، سازماندهی می کنند. به عنوان مثال، در یک انبار داده بانکی، جدول واقعی آن ممکن است حاوی داده های بانکی باشد، مانند مبلغ وام، تاریخ اعطای وام، و مشتری که وام را دریافت کرده است، در حالی که جداول ابعاد (داده های مرجع) می تواند شامل باشد. اطلاعات مربوط به اطلاعات محصول، جمعیت شناسی مشتری و داده های مکان.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://www.dataversity.net/master-data-vs-reference-data/