اکثر شرکتها در حال تبدیل شدن به «شرکت دادهای هستند که [کسب و کار خود را] بهتر از هر کس دیگری وارد میکنند». شرکتهای مدرن نه تنها بومی داده، دیجیتال و ابری هستند، بلکه راههایی برای تمایز از طریق دادههای خود پیدا میکنند و از آن به عنوان یک جریان درآمد اضافی کسب درآمد میکنند. علاوه بر این، تنها راه برای همگام ماندن با تحولات سریع در هوش مصنوعی و یادگیری ماشینی (ML) به سرمایه گذاری های استراتژیک در تثبیت زیرساخت داده های اساسی نیاز دارد. اما چه اتفاقی میافتد وقتی حجم عظیمی از دادههای نگهداری شده امروز به درستی مدیریت نشود؟
تصور کنید سعی می کنید یک کتاب خاص را در یک کتابخانه بیابید، بدون اینکه مکان، عنوان یا حتی نویسنده آن را بدانید. اوه، و هیچ ابزار یا شخصی برای درخواست وجود ندارد، پس شما به اطراف میروید و از هر کس دیگری در کتابخانه کمک میخواهید به این امید که شما را در مسیر درست راهنمایی کند یا فقط یک کتاب به شما بدهد. به طور مشابه، داده های مدیریت نشده خود را در گوشه تاریک یک «کتابخانه» دفن می کنند، اما در بیشتر موارد دیگر شبیه کتاب سابق نیستند و نویسنده ناشناخته است. این اغلب از طریق سیلوهای داده، سرویسهای پلتفرم اضافی یا تکراری، ذخیرهسازی دادهها و تعاریف متناقض و موارد دیگر اتفاق میافتد که همگی باعث افزایش هزینهها و پیچیدگیهای غیرضروری میشوند.
در حالی که سناریوی ایدهآل این است که اطمینان حاصل شود که همه داراییهای داده در وهله اول قابل کشف هستند، راههایی برای حل کردن این آشفتگی پس از وقوع وجود دارد. اما این چیزی است که هر شرکتی با آن دست و پنجه نرم می کند. تیمهای منفرد اغلب به خدمات زیرساختی دسترسی دارند و همه رویدادهای داده - از جمله اشتراکگذاری، کپی، صادرات و غنیسازی - در این پلتفرمها در سطح سازمانی نظارت نمیشوند. در نتیجه، چالش همچنان ادامه دارد، گسترش مییابد و کتابخانه دادهها بدون نظارت یا کنترل ثابت به رشد خود ادامه میدهد.
مدیر ارشد داده های Dremio (CDO).
هزینه داده های از دست رفته
عواقب داده های غیرقابل یافت ممکن است عمیق باشد. این می تواند به شدت بر عملیات و اهداف استراتژیک سازمان تأثیر بگذارد، تصمیم گیری را مختل کند، کارایی عملیاتی را به خطر بیاندازد و آسیب پذیری ها را در برابر انطباق و نقض داده ها افزایش دهد. برای تصمیمگیری، بینشهای ضروری برای انتخابهای آگاهانه اغلب غیرقابل اعتماد یا غیرقابل دسترس توصیف میشوند.
این عدم دید و اعتماد منجر به تاخیر در شناسایی و اقدام بر اساس روندها، نیازهای مشتری و پاسخ سریع به تغییرات بازار می شود که در نهایت مانع رقابت و چابکی در طول زمان می شود. وقتی دادهها در سیلوهای نظارتنشده پراکنده میشوند یا در سرویسهای ابری متفاوت بدون نظارت متمرکز تکرار میشوند، مانند این است که کتابهایی در گوشههای مختلف یک کتابخانه بدون سیستم فهرست مرکزی داشته باشید.
علاوه بر این، ناتوانی در مکان یابی و ایمن سازی داده های حساس، احتمال دسترسی غیرمجاز یا قرار گرفتن در معرض ناخواسته را افزایش می دهد و خطرات مربوط به نقض حریم خصوصی و سرقت مالکیت معنوی را تشدید می کند. از هر مهندس یا تحلیلگری بپرسید، و احتمالاً قبلاً به چالش حاکم بر دادههایی که میتوانند به صفحات گسترده صادر شوند اشاره میکنند. حل مشکل دانلود در وهله اول باید سخت تر از دانستن اینکه چه داده هایی در آن پلتفرم وجود دارد باشد: حداقل در این صورت می توانید ببینید که یک بارگیری انجام شده است و توسط چه کسی می توان در هر ممیزی پستی کمک کرد.
اصلاح اشتباه
برای سازمان هایی که نیاز به اصلاح دوره دارند، یکی از مقیاس پذیرترین راه حل ها اطمینان از "انطباق به عنوان کد" است. به زبان ساده، این اطمینان حاصل می شود که هر رویداد داده - از ارائه خدمات تا غنی سازی داده ها در آنها - ثبت، نظارت و قابل ردیابی است. مهمتر از همه، این رویدادها برای هر ذینفعی که مسئول حفاظت یا نظارت بر داده ها است قابل مشاهده است.
با حصول اطمینان از انتقال این رویدادها به یک کاتالوگ متادیتای رایج، مانند انتشار زیرمجموعه و غنیسازی کاتالوگ سازمانی، شرکتها میتوانند دادههای خود را به طور مؤثرتری نظارت و ممیزی کنند. در تئوری، هر منبعی که مطابقت ندارد باید فوراً توسط شرکت حذف شود، در نتیجه احتمال از دست دادن داده ها کاهش می یابد یا آن را غیرقابل یافتن می کند. پس ، هر کسی که یک فروشگاه شی، خدمات محاسباتی، و غیره را می چرخاند، همه برای قابلیت ممیزی، رویدادهای موجود برای نسب و قابلیت ردیابی، و در حالت ایده آل مسیری به سمت منشأ داده ثبت می شوند.
هنگامی که ابزارهایی مانند BigID از بین رفته اند، مانند یک فهرست کتابخانه پیچیده عمل می کنند، در ارائه یک نمای پایین به بالا از اکوسیستم، کمک می کند تا سازمان ها بفهمند داده ها کجا هستند و چه سیستم هایی از آنها استفاده می کنند. ابزارهایی که حاکمیت و انطباق را برای واژه نامه داده و مدیریت گردش کار و اتخاذ الگوهایی مانند استفاده از قالب Iceberg فراهم می کنند، نه تنها هزینه های تعویض امروز و فردا را کاهش می دهند، بلکه ادغام بسیاری از کاتالوگ ها و پلتفرم های کاربردی در سراسر تجارت را آسان تر می کنند. هدف در اینجا ایجاد سریع ارزش و در عین حال سادهتر کردن مدیریت دادهها در آینده است.
شرکتها باید بینشهایی در مورد چشمانداز دادههای خود کسب کنند، مسائل مربوط به انطباق بالقوه را شناسایی کنند، و اقدامات اصلاحی را قبل از غیرقابل مدیریت شدن دادهها انجام دهند، چه رسد به راهاندازی سیستمی برای مقیاس بهتر. این همیشه مسئولیت یک تیم مرکزی خواهد بود، یا در بهترین حالت در صورت دموکراتیزه شدن کامل با رهبران کارکردی به اشتراک گذاشته می شود. برای روشن شدن، همه این ابزارها برای شروع لازم نیست. درعوض، درک ماهیت وضعیت فعلی شما (یا نقطه شروع) نحوه اولویت بندی سریع موارد استفاده را که توسط آنها برای اولویت دادن به نوسازی استفاده می شود، دیکته می کند. شما باید بین بردهای سریع و تغییرات با تغییرات اساسی بزرگ تعادل برقرار کنید که باعث می شود تحولات در میان مدت سریعتر پیشرفت کنند تا شتاب را حفظ کنید و به طور مداوم اعتماد ایجاد کنید.
یک استراتژی موازی موثر، ساخت میکروسرویس ها یا ربات هایی است که دائماً اسکن، ممیزی و اطمینان از انطباق را انجام می دهند. این میکروسرویسها میتوانند طیف وسیعی از عملکردها را انجام دهند، از بررسیهای انطباق پایه گرفته تا تشخیص کامل ناهنجاری در مورد استفاده از دارایی در مقایسه با ارائه خدمات عادی، نقشها و استفاده از دارایی. با نظارت مستمر رویدادهای داده و الگوهای استفاده، این میکروسرویسها میتوانند ناهنجاریها و نقض بالقوه انطباق را در زمان واقعی شناسایی کنند و اقدامات اصلاحی سریع را ممکن میسازند. همانطور که در بالا ذکر شد، تمام منابع داده و رویدادها باید به طور خودکار پس از تهیه ثبت شوند، پس هر داده ای که فهرست نشده است می تواند بلافاصله توسط ربات به عنوان ناسازگار حذف شود.
فصل بعدی
مانند یک کتابخانه به خوبی سازماندهی شده که در آن هر کتاب فهرست نویسی شده و به راحتی قابل دسترسی است، یک محیط داده با مدیریت خوب به شرکت ها اجازه می دهد تا پیشرفت کنند. جلوگیری از هرج و مرج داده ها مستلزم یک رویکرد فعال و استراتژیک برای مدیریت داده است که همچنین اصطکاک یا فرآیندهای بیشتری را برای کاربران ایجاد نمی کند. با اجرای انطباق بهعنوان کد، استفاده از ابزارهای مشاهده دادهها، و ایجاد ریزسرویسها برای انطباق مداوم، شرکتها میتوانند اطمینان حاصل کنند که داراییهای دادهشان قابل یافتن، ایمن و ارزشمند باقی میمانند. با استفاده از این استراتژیها، کسبوکارها میتوانند پیچیدگیهای مدیریت دادهها را کنترل کنند و رشد و نوآوری پایدار را هدایت کنند.
در نهایت، پرورش فرهنگ مدیریت داده در سازمان حیاتی است. آموزش کارکنان در مورد اهمیت مدیریت داده ها و ایجاد پروتکل های شفاف برای مدیریت داده ها می تواند به طور قابل توجهی ریسک شرکت ها را کاهش دهد. جلسات آموزشی منظم و به روز رسانی در مورد بهترین شیوه ها تضمین می کند که همه اعضای تیم با اهداف حاکمیت داده شرکت هماهنگ هستند.
ما بهترین خدمات مدیریت گزارش ابری را فهرست می کنیم .
این مقاله به عنوان بخشی از کانال Expert Insights TechRadarPro تهیه شده است که در آن بهترین و باهوش ترین ذهن ها در صنعت فناوری امروز را معرفی می کنیم. نظرات بیان شده در اینجا نظرات نویسنده است و لزوماً نظرات TechRadarPro یا Future plc نیست. اگر علاقه مند به مشارکت هستید، اطلاعات بیشتری را در اینجا بیابید: https://www.techradar.com/news/submit-your-story-to-techradar-pro
ارسال نظر