راه پرداخت
رسانه فناوری‌های مالی ایران

مدیر واحد راهکارهای تحلیلی داتین از کلان داده‌ها سخن گفت

کلان داده‌ها یکی از چالش‌های اصلی بانکداری الکترونیکی هستند و شیوه مدیریت آنها یکی از مهم‌ترین موضوعات مطرح شده در هفتمین همایش بانکداری الکترونیک است.

در حاشیه دومین روز هفتمین همایش بانکداری الکترونیک، محمدحسین برخورداری، مدیر واحد راهکارهای تحلیلی شرکت نرم‌افزاری داتیس آرین قشم درباره محلی‌سازی داده‌ها در کلان‌داده‌ها کارگاهی برگزار کرد.

او در ابتدا به تعریف کلان‌داده‌ها پرداخت و در این باره گفت: «کلان داده‌ها به داده‌های حجیم در درجات مختلفی از پیچیدگی با سرعت‌های مختلف و درجات مختلف ابهام گفته می‌شود که به وسیله تکنولوژی و روش‌های پردازشی قابل مدیریت باشد.»

او در ادامه اعلام کرد دو نوع معماری پردازش اطلاعات وجود دارد که در اصطلاح به آن حافظه اشتراکی می‌گویند.

پس از ارائه این توضیحات او به موضوع نگاشت کاهش پرداخت و در توضیح آن گفت: «نگاشت کاهش یک نوع برنامه‌نویسی و پیاده‌سازی برای ایجاد و پردازش کلان داده است.»

به گفته او یکی از مشکلات ساختارهای توزیع شده این است که اطلاعاتی در بخش‌های مختلف وجود دارد و برای نتیجه نهایی باید اطلاعات روی این بخش‌ها جابه‌جا شود تا نتیجه پردازش کامل شود؛ اما در این باره دو مشکل دارد که برخورداری درباره آنها گفت: «یک مشکل در شبکه گلوگاه وجود دارد و دیگر اینکه از سخت‌افزار به صورت کارا استفاده نمی‌شود.»

در ادامه مدیر واحد راهکارهای تحلیلی شرکت داتیس درباره روش‌های حل مسئله برای محیط‌های توزیع شده گفت: «یکی از این روش‌ها گراف جهت‌دار بدون دور است و دیگری نگاشت کاهش و در روشی دیگر هم برخی مسائل از طریق ساختار داده حل می‌شود.»

به گفته او دیتا براساس آنچه در هر بخش وجود دارد تقسیم می‌شود. برخی از آنها بحث بهینه‌سازی پرس‌وجوها را انجام می‌دهند و واسط کاربری هستند. برخی دیگر پشتیبانی از حلقه را دارند و با تغییرات ساختاری حلقه را پشتیبانی می‌کنند.

او برای محلی‌سازی داده‌ها در کلان داده هم پیشنهاداتی را مطرح کرد و درباره مفهوم محلی‌سازی داده‌ها گفت: «قرار دادن داده‌ها بر روی گره‌های مختلف به نحوی که هر گره به صورت مستقل پردازش مربوط به خود را بدون نیار به داده‌های گره‌های دیگر انجام دهد. شرط اصلی مستقل‌سازی گره‌ها است.»

برخورداری برای مستقل‌سازی سه شرط را پیشنهاد کرد و گفت: «شرط اول این است که فرمت داده‌ها یکسان شود و هر گره قالب خاص خود را نداشته باشد. شرط دوم محدودسازی حلقه‌ها به نگاشت و شرط سوم اعمال نشدن فیلتر تجمیع روی نگاشت است، زیرا نتیجه را غلط می‌کند.»

او در ادامه صحبت‌هایش به موضوع حل مسئله تشخیص تخلف پرداخت و گفت: «زمانی که ما یک قالب یکسان برای گره‌ها داریم و گراف‌ها را به زیرگراف‌ها تقسیم می‌کنیم و فیلتر تجمیعی هم بر روی نگاشتگرها تعریف نمی‌شود و به این شکل تشخیص تخلف صورت می‌گیرد.»

به گفته او اگر یک بانک می‌خواهد سرویس‌هایی را به مشتری ارائه دهد باید باز هم یکنواخت‌سازی داده‌ها را اجرا کند و در این زمینه با ذکر یک مثال گفت: «به عنوان مثال اگر مشتری اینترنت بانک و موبایل بانک را دارد آیا می‌توان سرویس جدیدی به او پیشنهاد داد.»

برخورداری در پایان به مسئله تجمیع منابع داده چند بعدی اشاره کرد و درباره راه‌حل این کار گفت: «ممکن است داده‌های چند بعدی وجود داشته باشد و کاری که می‌توان کرد این است که قالب یکنواخت برای تمام گره‌ها در نظر گرفته می‌شود و فیلتر تجمیعی بر روی نگاشتگرها اعمال نمی‌شود.»

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.