متن خبر

بستن درب کتابخانه داده های از دست رفته

بستن درب کتابخانه داده های از دست رفته

شناسهٔ خبر: 692549 -




شخصی <a href= که در مقابل یک رک از سرورها در یک مرکز داده ایستاده است" class=" block-image-ads hero-image" srcset="https://cdn.mos.cms.futurecdn.net/voggnbKTY9CxkjzXf8CGud-320-80.jpg 320w, https://cdn.mos.cms.futurecdn.net/voggnbKTY9CxkjzXf8CGud-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/voggnbKTY9CxkjzXf8CGud-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/voggnbKTY9CxkjzXf8CGud-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/voggnbKTY9CxkjzXf8CGud-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/voggnbKTY9CxkjzXf8CGud-1200-80.jpg 1200w, https://cdn.mos.cms.futurecdn.net/voggnbKTY9CxkjzXf8CGud-1920-80.jpg 1920w" sizes="(min-width: 1000px) 600px, calc(100vw - 40px)" data-pin-media="https://cdn.mos.cms.futurecdn.net/voggnbKTY9CxkjzXf8CGud.jpg">
(اعتبار تصویر: Shutterstock.com / Gorodenkoff)

اکثر شرکت‌ها در حال تبدیل شدن به «شرکت داده‌ای هستند که [کسب و کار خود را] بهتر از هر کس دیگری وارد می‌کنند». شرکت‌های مدرن نه تنها بومی داده، دیجیتال و ابری هستند، بلکه راه‌هایی برای تمایز از طریق داده‌های خود پیدا می‌کنند و از آن به عنوان یک جریان درآمد اضافی کسب درآمد می‌کنند. علاوه بر این، تنها راه برای همگام ماندن با تحولات سریع در هوش مصنوعی و یادگیری ماشینی (ML) به سرمایه گذاری های استراتژیک در تثبیت زیرساخت داده های اساسی نیاز دارد. اما چه اتفاقی می‌افتد وقتی حجم عظیمی از داده‌های نگهداری شده امروز به درستی مدیریت نشود؟

تصور کنید سعی می کنید یک کتاب خاص را در یک کتابخانه بیابید، بدون اینکه مکان، عنوان یا حتی نویسنده آن را بدانید. اوه، و هیچ ابزار یا شخصی برای درخواست وجود ندارد، پس شما به اطراف می‌روید و از هر کس دیگری در کتابخانه کمک می‌خواهید به این امید که شما را در مسیر درست راهنمایی کند یا فقط یک کتاب به شما بدهد. به طور مشابه، داده های مدیریت نشده خود را در گوشه تاریک یک «کتابخانه» دفن می کنند، اما در بیشتر موارد دیگر شبیه کتاب سابق نیستند و نویسنده ناشناخته است. این اغلب از طریق سیلوهای داده، سرویس‌های پلتفرم اضافی یا تکراری، ذخیره‌سازی داده‌ها و تعاریف متناقض و موارد دیگر اتفاق می‌افتد که همگی باعث افزایش هزینه‌ها و پیچیدگی‌های غیرضروری می‌شوند.

در حالی که سناریوی ایده‌آل این است که اطمینان حاصل شود که همه دارایی‌های داده در وهله اول قابل کشف هستند، راه‌هایی برای حل کردن این آشفتگی پس از وقوع وجود دارد. اما این چیزی است که هر شرکتی با آن دست و پنجه نرم می کند. تیم‌های منفرد اغلب به خدمات زیرساختی دسترسی دارند و همه رویدادهای داده - از جمله اشتراک‌گذاری، کپی، صادرات و غنی‌سازی - در این پلتفرم‌ها در سطح سازمانی نظارت نمی‌شوند. در نتیجه، چالش همچنان ادامه دارد، گسترش می‌یابد و کتابخانه داده‌ها بدون نظارت یا کنترل ثابت به رشد خود ادامه می‌دهد.

نیک آچسون

مدیر ارشد داده های Dremio (CDO).

هزینه داده های از دست رفته

عواقب داده های غیرقابل یافت ممکن است عمیق باشد. این می تواند به شدت بر عملیات و اهداف استراتژیک سازمان تأثیر بگذارد، تصمیم گیری را مختل کند، کارایی عملیاتی را به خطر بیاندازد و آسیب پذیری ها را در برابر انطباق و نقض داده ها افزایش دهد. برای تصمیم‌گیری، بینش‌های ضروری برای انتخاب‌های آگاهانه اغلب غیرقابل اعتماد یا غیرقابل دسترس توصیف می‌شوند.

این عدم دید و اعتماد منجر به تاخیر در شناسایی و اقدام بر اساس روندها، نیازهای مشتری و پاسخ سریع به تغییرات بازار می شود که در نهایت مانع رقابت و چابکی در طول زمان می شود. وقتی داده‌ها در سیلوهای نظارت‌نشده پراکنده می‌شوند یا در سرویس‌های ابری متفاوت بدون نظارت متمرکز تکرار می‌شوند، مانند این است که کتاب‌هایی در گوشه‌های مختلف یک کتابخانه بدون سیستم فهرست مرکزی داشته باشید.

علاوه بر این، ناتوانی در مکان یابی و ایمن سازی داده های حساس، احتمال دسترسی غیرمجاز یا قرار گرفتن در معرض ناخواسته را افزایش می دهد و خطرات مربوط به نقض حریم خصوصی و سرقت مالکیت معنوی را تشدید می کند. از هر مهندس یا تحلیلگری بپرسید، و احتمالاً قبلاً به چالش حاکم بر داده‌هایی که می‌توانند به صفحات گسترده صادر شوند اشاره می‌کنند. حل مشکل دانلود در وهله اول باید سخت تر از دانستن اینکه چه داده هایی در آن پلتفرم وجود دارد باشد: حداقل در این صورت می توانید ببینید که یک بارگیری انجام شده است و توسط چه کسی می توان در هر ممیزی پستی کمک کرد.

اصلاح اشتباه

برای سازمان هایی که نیاز به اصلاح دوره دارند، یکی از مقیاس پذیرترین راه حل ها اطمینان از "انطباق به عنوان کد" است. به زبان ساده، این اطمینان حاصل می شود که هر رویداد داده - از ارائه خدمات تا غنی سازی داده ها در آنها - ثبت، نظارت و قابل ردیابی است. مهمتر از همه، این رویدادها برای هر ذینفعی که مسئول حفاظت یا نظارت بر داده ها است قابل مشاهده است.

با حصول اطمینان از انتقال این رویدادها به یک کاتالوگ متادیتای رایج، مانند انتشار زیرمجموعه و غنی‌سازی کاتالوگ سازمانی، شرکت‌ها می‌توانند داده‌های خود را به طور مؤثرتری نظارت و ممیزی کنند. در تئوری، هر منبعی که مطابقت ندارد باید فوراً توسط شرکت حذف شود، در نتیجه احتمال از دست دادن داده ها کاهش می یابد یا آن را غیرقابل یافتن می کند. پس ، هر کسی که یک فروشگاه شی، خدمات محاسباتی، و غیره را می چرخاند، همه برای قابلیت ممیزی، رویدادهای موجود برای نسب و قابلیت ردیابی، و در حالت ایده آل مسیری به سمت منشأ داده ثبت می شوند.

هنگامی که ابزارهایی مانند BigID از بین رفته اند، مانند یک فهرست کتابخانه پیچیده عمل می کنند، در ارائه یک نمای پایین به بالا از اکوسیستم، کمک می کند تا سازمان ها بفهمند داده ها کجا هستند و چه سیستم هایی از آنها استفاده می کنند. ابزارهایی که حاکمیت و انطباق را برای واژه نامه داده و مدیریت گردش کار و اتخاذ الگوهایی مانند استفاده از قالب Iceberg فراهم می کنند، نه تنها هزینه های تعویض امروز و فردا را کاهش می دهند، بلکه ادغام بسیاری از کاتالوگ ها و پلتفرم های کاربردی در سراسر تجارت را آسان تر می کنند. هدف در اینجا ایجاد سریع ارزش و در عین حال ساده‌تر کردن مدیریت داده‌ها در آینده است.

شرکت‌ها باید بینش‌هایی در مورد چشم‌انداز داده‌های خود کسب کنند، مسائل مربوط به انطباق بالقوه را شناسایی کنند، و اقدامات اصلاحی را قبل از غیرقابل مدیریت شدن داده‌ها انجام دهند، چه رسد به راه‌اندازی سیستمی برای مقیاس بهتر. این همیشه مسئولیت یک تیم مرکزی خواهد بود، یا در بهترین حالت در صورت دموکراتیزه شدن کامل با رهبران کارکردی به اشتراک گذاشته می شود. برای روشن شدن، همه این ابزارها برای شروع لازم نیست. درعوض، درک ماهیت وضعیت فعلی شما (یا نقطه شروع) نحوه اولویت بندی سریع موارد استفاده را که توسط آنها برای اولویت دادن به نوسازی استفاده می شود، دیکته می کند. شما باید بین بردهای سریع و تغییرات با تغییرات اساسی بزرگ تعادل برقرار کنید که باعث می شود تحولات در میان مدت سریعتر پیشرفت کنند تا شتاب را حفظ کنید و به طور مداوم اعتماد ایجاد کنید.

یک استراتژی موازی موثر، ساخت میکروسرویس ها یا ربات هایی است که دائماً اسکن، ممیزی و اطمینان از انطباق را انجام می دهند. این میکروسرویس‌ها می‌توانند طیف وسیعی از عملکردها را انجام دهند، از بررسی‌های انطباق پایه گرفته تا تشخیص کامل ناهنجاری در مورد استفاده از دارایی در مقایسه با ارائه خدمات عادی، نقش‌ها و استفاده از دارایی. با نظارت مستمر رویدادهای داده و الگوهای استفاده، این میکروسرویس‌ها می‌توانند ناهنجاری‌ها و نقض بالقوه انطباق را در زمان واقعی شناسایی کنند و اقدامات اصلاحی سریع را ممکن می‌سازند. همانطور که در بالا ذکر شد، تمام منابع داده و رویدادها باید به طور خودکار پس از تهیه ثبت شوند، پس هر داده ای که فهرست نشده است می تواند بلافاصله توسط ربات به عنوان ناسازگار حذف شود.

فصل بعدی

مانند یک کتابخانه به خوبی سازماندهی شده که در آن هر کتاب فهرست نویسی شده و به راحتی قابل دسترسی است، یک محیط داده با مدیریت خوب به شرکت ها اجازه می دهد تا پیشرفت کنند. جلوگیری از هرج و مرج داده ها مستلزم یک رویکرد فعال و استراتژیک برای مدیریت داده است که همچنین اصطکاک یا فرآیندهای بیشتری را برای کاربران ایجاد نمی کند. با اجرای انطباق به‌عنوان کد، استفاده از ابزارهای مشاهده داده‌ها، و ایجاد ریزسرویس‌ها برای انطباق مداوم، شرکت‌ها می‌توانند اطمینان حاصل کنند که دارایی‌های داده‌شان قابل یافتن، ایمن و ارزشمند باقی می‌مانند. با استفاده از این استراتژی‌ها، کسب‌وکارها می‌توانند پیچیدگی‌های مدیریت داده‌ها را کنترل کنند و رشد و نوآوری پایدار را هدایت کنند.

در نهایت، پرورش فرهنگ مدیریت داده در سازمان حیاتی است. آموزش کارکنان در مورد اهمیت مدیریت داده ها و ایجاد پروتکل های شفاف برای مدیریت داده ها می تواند به طور قابل توجهی ریسک شرکت ها را کاهش دهد. جلسات آموزشی منظم و به روز رسانی در مورد بهترین شیوه ها تضمین می کند که همه اعضای تیم با اهداف حاکمیت داده شرکت هماهنگ هستند.

ما بهترین خدمات مدیریت گزارش ابری را فهرست می کنیم .

این مقاله به عنوان بخشی از کانال Expert Insights TechRadarPro تهیه شده است که در آن بهترین و باهوش ترین ذهن ها در صنعت فناوری امروز را معرفی می کنیم. نظرات بیان شده در اینجا نظرات نویسنده است و لزوماً نظرات TechRadarPro یا Future plc نیست. اگر علاقه مند به مشارکت هستید، اطلاعات بیشتری را در اینجا بیابید: https://www.techradar.com/news/submit-your-story-to-techradar-pro

نیک آچسون در سطح جهانی به عنوان مدیر ارشد داده های Dremio (CDO) فعالیت می کند.

خبرکاو

ارسال نظر




تبليغات ايهنا تبليغات ايهنا

تمامی حقوق مادی و معنوی این سایت متعلق به خبرکاو است و استفاده از مطالب با ذکر منبع بلامانع است