راه پرداخت
راه پرداخت؛ رسانه فناوری‌های مالی ایران

گفت‌وگو با مدیران گمانیک در خصوص چالش‌ها و بیم و امیدهای کشف تقلب در نظام بانکی کشور / فناوری در خدمت کاهش ریسک و تقلب

آویده علم جمیلی / کشف تقلب و پی‌بردن به راه‌های دور زدن قانون به‌خصوص در بخش بانکی، همواره یکی از چالش‌های جهان در مبارزه با پول‌شویی است. با وجود اینکه هرروزه شاهد بهتر شدن فناوری‌های کشف تقلب در سیستم‌های پرداخت هستیم، اما همچنان راه زیادی باقی است. با این حال، وجود ابزارهایی مانند گمانیک، می‌تواند امید به بهبود شرایط را افزایش دهد. در مصاحبه‌ای که با علی حاجی‌زاده مقدم، مدیرعامل شرکت آدانیک و سعید دادخواه، مدیر فنی گمانیک داشتیم، از آنها در خصوص نقاط قوت و ضعف گمانیک، چرایی ارائه یک نسخه جدید از این اپلیکیشن به بازار، همچنین راهکار این ابزار برای شناسایی مسیرهای تقلب پرسیدیم. مهم‌ترین نکته‌ای که حاجی‌زاده مقدم و دادخواه به آن اشاره کردند و بارها و بارها از آن سخن گفتند، نبود یک مرجع رسمی برای تجمیع داده‌های لیست سیاه و تقلب‌های بانکی و نیز امکان تبادل اطلاعات بین بانک‌های مختلف است. در غیاب این مرجع نمی‌توان امیدی به تشخیص زود و به‌موقع انواع تقلب؛ از فیشینگ تا شناسایی جریان‌های مالی سایت‌های شرط‌بندی و کارت‌های اجاره‌ای داشت.


چرا نسخه جدید روانه بازار شد؟


به‌عنوان نخستین سؤال پرسیده شد که چرا نسخه جدیدی از گمانیک را به بازار عرضه کردید و تفاوت این نسخه با قبلی در چیست؟ در ابتدا حاجی‌زاده مقدم به بیان یک مقدمه پرداخت و گفت: «پیاده‌سازی سامانه گمانیک با این رویکرد آغاز شد که تحلیل بیگ‌دیتا یک روند و جریان پیش‌رونده است. در دوره رشد شدید خدمات دیجیتالی، روش‌های کلاسیک مدیریت مبتنی بر گزارش‌های کلاسیک مالی و فروش و وضعیت بازار به‌تنهایی پاسخگوی نیازهای افراد و شرکت‌ها نیستند و سیل داده‌های در گردش داخل سازمان‌ها، نیازمند اتخاذ یکسری رویکردهای دیگر است. فناوری بیگ‌دیتا و هوش مصنوعی برای پاسخ به این موضوع ابزاری درست هستند و ما نیز از آنها در پیاده‌سازی و توسعه سامانه گمانیک استفاده کردیم. گمانیک ابزاری برای کشف الگوهای پنهان در  بیگ‌دیتاست. گمانیک در چهار سال و نیم گذشته که در مسیر رشد قرار داشته، بازخوردهای مداومی از کاربران دریافت کرده و همین بازخوردها باعث شکل‌گیری، وضوح و شفاف‌سازی تصویری شد که در روز اول برای این سامانه داشتیم».

علی حاجی‌زاده مقدم

سعید دادخواه این‌گونه به این سؤال پاسخ داد: «چهار سال و نیم پیش کار گمانیک را شروع کردیم. در ابتدا برای شناسایی ناهنجاری‌های مستتر در داده‌ها یکسری الگوریتم ساده و آماری داشتیم که به روش برنامه‌نویسی کلاسیک پیاده‌سازی شده بودند و از ابزارهای پردازش بیگ‌دیتا استفاده نمی‌کردیم. اما به‌مرور و با پیشرفت پروژه، موتور تعریف قواعد تکامل پیدا کرد. البته مثل هر پروژه دیگری، نقاط ضعفی نیز وجود داشت؛ اولین و شاید مهم‌ترین آنها پایین‌بودن سرعت ایجاد هماهنگی بین بخش‌های مختلف سیستم بود. پس از شناسایی نقاط ضعف به این نتیجه رسیدیم که برای بهبود و افزایش کارایی سامانه و رسیدن به اهدافی که داشتیم، می‌بایست کار دیگری صورت بگیرد.»

دادخواه در ادامه گفت: «بعد از یک سال و نیم بهینه‌سازی محصول را با تغییرات بنیادی در تکنولوژی‌های مورد استفاده آغاز کردیم. در این مقطع بود که نام «گمانیک» را انتخاب کرده و با آن ادامه دادیم. برای گام نخست، همان نسخه قبلی را به نحو بهتر پیاده‌سازی کرده و ویژگی‌های جدیدی به آن افزودیم. به‌عنوان مثال پیش‌تر برای افزودن قاعده جدید به پیاده‌سازی کد قاعده توسط توسعه‌دهنده سامانه نیاز بود. این فرایند در نسخه جدید به‌سادگی از طریق پنل سامانه و توسط کاربر سامانه انجام می‌شود. در نسخه جدید همه‌چیز را کاملاً عمومی دیدیم و دو نوع داده پایه برای سامانه ایجاد کردیم؛ داده‌های سیستمی و داده‌های سازمانی. با توجه به طراحی و معماری نسخه جدید، افزودن داده‌های سازمانی و سیستمی به سامانه کار دشواری نبود و در کمترین زمان انجام می‌شد.»

دادخواه در خصوص نسخه جدید ادامه داد: «با وجود گستردگی قواعد موجود در سامانه و نیازی که در سازمان‌ها ایجاد شد، به‌منظور ایجاد دیدی کلی نسبت به نتایج و طبقه‌بندی آنها، سرویسی برای امتیازدهی و سطح‌بندی موجودیت‌ها در سامانه تعریف شد. علاوه بر آن  برای انسجام و دسترسی ساده به کلیه اطلاعات یک موجودیت، پروفایلی در سامانه تعریف شد. پروفایل یکپارچه موجودیت یا مشتری امکان مشاهده نتایج مربوط به موجودیت در حساب‌ها و کارت‌های گوناگون را، در یک نگاه، در دو قالب تصویری و جدول‌های داده فراهم می‌کند. پس از آن به سمت پردازش بیگ‌دیتا با استفاده از ابزارهای پردازشی بیگ‌دیتا و هوشمندسازی فرایند تشخیص ناهنجاری  رفتیم که به‌نوعی بنیان و اساس تعریف سامانه محسوب می‌شدند. در واقع منطق و زیرساخت برنامه کاملاً برای استفاده از الگوریتم‌های یادگیری ماشین و پیاده‌سازی فرایندهای هوشمند آماده شده بود. طی یک سال اخیر ابزارهای پردازش داده‌های حجیم مانند زپلین و دیگر ابزارهای پردازشی را به سامانه اضافه کرده‌ایم. در واقع مجموعه این ابزارها در کنار تخصص و مهارت برای شناسسایی بهترین الگوریتم‌ها و بهینه‌سازی آنها بر اساس کیفیت و کمیت داده‌ها، باعث شدند قدرت پردازش سامانه افزایش زیادی داشته باشد، به‌طوری که به‌جرئت می‌توان ادعا کرد برای کشف تقلب و پی‌بردن به هر گونه ناهنجاری در یک سیستم، گمانیک یکی از بهترین گزینه‌هاست.»


چقدر می‌توان از گمانیک در دنیای واقعی بهره برد؟


سؤال بعدی درباره اثرگذاری گمانیک در دنیای واقعی بود. حاجی‌زاده این موضوع را مطرح کرد که گمانیک در حال حاضر در حوزه بانکی متمرکز است. او در این خصوص ادامه داد: «حضور گمانیک در این حوزه از موضوع تقلب‌های مرتبط با کارت شروع شد. تعیین‌کننده اولویت موضوع، بانک به‌عنوان مشتری و بهره‌بردار سامانه بود. اهمیت کارت به این دلیل بود که موجودیت کارت یکی از کانال‌های کلاهبرداری است، اما در ادامه به سایر تراکنش‌های مبتنی بر سپرده و سایر موجودیت‌های بانکی مانند سرفصل‌ها نیز توسعه پیدا کرد. سپس از این مرحله که صرفاً کارت یا سایر موجودیت‌ها به‌صورت جداگانه در نظر گرفته شود، گذر کرده و به این مرحله که همه داده‌های یک موجودیت (مثلاً یک مشتری) به یکدیگر ارتباط پیدا می‌کنند، رسیدیم. برقراری ارتباط بین موجودیت‌ها امکان تمرکز روی مشتری و شناسایی رفتارهای نابهنجار مشتری را فراهم کرد. به‌عنوان مثال در حال حاضر با توجه به ابزارهایی که گمانیک از آنها بهره می‌برد، ریسک یک فرد اندازه‌گیری می‌شود».

حاجی‌زاده در ادامه به این موضوع نیز اشاره کرد که ابزارهای به‌کاررفته در گمانیک محدود به بانک‌ها نمی‌شود و می‌تواند در سایر سازمان‌ها و صنایع نیز به کار گرفته شود. وی گفت: «این ابزار و فناوری‌های استفاده‌شده در آن، قابلیت تشخیص هرگونه ناهنجاری در هر داده‌ای را دارد. در واقع سعی شده در منابع داده ورودی و همچنین در طراحی الگوها، منطق سامانه و ابزارهای پیاده‌سازی‌شده را به سمت عمومی‌تر شدن پیش ببریم؛ به گونه‌ای که  امکان تشخیص ‌ناهنجاری در گستره وسیعی از انواع داده مهیا شود. البته باید یادآوری کنیم که این رخدادهای غیرعادی یا ناهنجاری، الزاماً برای تشخیص تقلب نیست و بسته به داده‌ها، هدف و نیازمندی سازمان می‌تواند به شناسایی موارد استثنا و توسعه سیاست‌گذاری‌های سازمان‌ها بینجامد. با این دید، شناسایی ناهنجاری‌ها در حوزه‌های بسیار دیگری کاربرد دارد.»

در ادامه پرسیده شد که برای شناسایی اصل از فرع یا اصل از تقلب و ناهنجاری، در گمانیک چقدر از هوش مصنوعی استفاده شده است. دادخواه توضیح داد: «اگر تخلفی رخ دهد، با استفاده از قواعد می‌توان آن را شناسایی کرد و بر اساس قوانین مالی و بانکی جلوی آن را گرفت. در واقع با ثبت قواعد جدید سعی می‌شود تخلفات شناسایی و از آنها جلوگیری شود. به‌عنوان مثال یکسری افراد هستند که با وجود رعایت قانون توسط بانک‌ها، راه‌هایی برای تقلب و تخلف از قوانین بانکی و مالی پیدا می‌کنند. در واقع تقلب‌هایی از این دست می‌توانند بانک را متضرر کنند. این نوع تخلفات هدف‌شان بانک‌ها هستند. دسته دیگر تقلب‌هایی هستند که علاوه بر بانک، مشتریان را نیز دچار زیان و خسارت می‌کنند. این نوع تقلب‌ها را نمی‌توان به قالب یک قانون ساده کاهش داد و به‌صورت قاعده تعریف کرد. اگر هم بر فرض قاعده‌ای برای شناسایی و کاهش تقلب ایجاد شود، تعداد تراکنش‌های زیادی در لیست تراکنش‌های مشکوک قرار می‌گیرند که در این صورت نیز نمی‌توان تقلب اصلی را با توجه به حجم زیاد تراکنش‌هایی که باید بررسی شود، به‌سرعت شناسایی کرد.»

او در خصوص نحوه استفاده از یادگیری ماشین برای کشف این نوع تقلب‌ها گفت: «با استفاده از الگوریتم‌های یادگیری ماشین سرویسی طراحی شده که داده‌ها را پردازش کرده و از آنها به یکسری ویژگی می‌رسد. مدل تعریف‌شده بر اساس ویژگی‌های به‌دست‌آمده، با دقت بالایی ناهنجاری‌ها را شناسایی می‌کند. در واقع می‌توان این ادعا را مطرح کرد که الگوریتم‌های یادگیری ماشین می‌توانند جامعه‌ای را انتخاب کنند که تقلب‌های بیشتری در آن رخ داده است. این انتخاب با صرف هزینه کمتری صورت می‌پذیرد.»


اگر بانک‌ها بخواهند، گمانیک می‌تواند به آنها کمک کند


سؤال بعدی در خصوص فیشینگ و تراکنش‌های مشکوک بود؛ اینکه گمانیک در این حوزه چقدر توانسته به بانک‌ها کمک کند تا تقلب‌هایی را که در راستای پول‌شویی است، شناسایی کنند و شناسایی این تقلب‌ها چقدر زمان می‌برد؟ دادخواه پاسخ داد: «از بین صحبت‌های شما دو بخش را از هم جدا می‌کنم. بخش اول اینکه چه تقلب‌هایی را باید شناسایی کرد؛ ما یک پیش‌فرض داریم که پشت همه موجودیت‌ها افراد (حقیقی یا حقوقی) هستند و قرار نیست رفتارشان تغییر کند، یا به عبارت دیگر اکثر افراد رفتار منطقی ثابتی دارند که می‌توان آن را با استفاده از رفتار یا چگونگی استفاده از موجودیت‌ها شناسایی کرد. زمانی می‌توان تقلب‌های بیشتری را شناسایی کرد که سعی کنیم به جای فرد متقلب فکر کنیم. به‌عنوان مثال، در صورتی که اطلاعات کارت یا حساب کسی لو برود، فرد افشاکننده سعی می‌کند بیشترین استفاده را از آن داشته باشد. این «بیشترین استفاده» پیش‌فرض ما قرار می‌گیرد. اگر اتفاق دیگری پس از افشای اطلاعات حساب رخ دهد، از رفتار منطقی موجودیت فاصله گرفته و تشخیص آن نیز صورت می‌پذیرد. بحث دوم مدت‌زمان تشخیص تقلب است. این سؤال در اپلیکیشن‌های پیاده‌سازی‌شده در منطق کلاسیک موضوعیت پیدا می‌کرد؛ چراکه در آن صورت می‌گفتیم اپلیکیشن‌مان چقدر پتانسیل دارد و چه میزان تراکنش را در روز پردازش می‌کند. اما در مورد سامانه گمانیک با توجه به استفاده از ابزارهای بیگ‌دیتا، این سؤال دیگر موضوعیت ندارد.»

سعید دادخواه، مدیر تیم گمانیک در شرکت آدانیک
سعید دادخواه

دادخواه در ادامه توضیح داد: «در حال حاضر روزانه به ازای هر پردازش، تراکنش‌های سه ماه بررسی می‌شود و کل این فرایند ممکن است در چند دقیقه به اتمام برسد. می‌توان به‌سادگی منابع را متناسب با داده‌های ورودی، افزایش دهیم. در این صورت زمان چندان افزایش پیدا نمی‌کند. از این جهت نگرانی نداریم؛ چراکه یک زیرساخت منعطف طراحی شده و اگر داده‌های بیشتری به آن وارد شود، با اضافه‌کردن منابع بیشتر، زمان مورد بررسی را می‌توان کاهش داد. البته تاکنون نیازی به آن حس نشده است. با همین سامانه و با منابعی که از ابتدا در نظر گرفته بودیم، با بهبود فرایندها توانستیم به این حد برسیم که داده‌های سه ماه را در عرض چند دقیقه پردازش کنیم.»

در ادامه حاجی‌زاده یک نکته را به صحبت‌های دادخواه اضافه کرد و افزود: «حل مسائلی که بانک‌ها در حوزه فیشینگ با آن مواجه هستند، به داده‌هایی فراتر از داده‌های یک بانک نیاز دارد؛ چراکه خود فیشینگ قابل تشخیص نیست، اما رفتارهای بعدی آن و روند پول‌شویی بعدی که در فیشینگ اتفاق می‌افتد، حائز اهمیت است. یکی از مشکلاتی که وجود دارد این است که یک بانک داده کافی ندارد و متقلبان نیز از همین نقطه‌ضعف استفاده می‌کنند؛ بنابراین شاید یکی از دلایلی که جای خالی ابزاری مانند گمانیک حس می‌شود، وجود یک  نقطه مرکزی است که بتواند این داده‌ها را از بانک‌های مختلف دریافت و  الگوسازی کند.»


برای هر سلیقه‌ای، برنامه‌ای داریم


نکته‌ای که حاجی‌زاده در خصوص نیاز به داده‌هایی فراتر از داده‌های یک بانک بیان کرد، سؤال بعدی ما بود؛ از آنها پرسیدیم که بانک‌ها  در بحث ارائه داده خشک عمل می‌کنند، از سوی دیگر در برخی موارد نیز داده‌های قابل استناد و مطمئنی از موضوعاتی که سامانه کشف تقلب بر اساس آن پردازش‌های لازم را انجام دهد، وجود ندارد. با این چالش چگونه برخورد می‌کنید؟ بانک‌ها همکاری می‌کنند یا با این چالش کارتان را پیش می‌برید؟ دادخواه پاسخ داد: «برای انجام پردازش داده‌ها، فرایندهای زیادی را پیش‌بینی کرده بودیم و در واقع با همین محدودیت‌ها سامانه گمانیک را توسعه دادیم. بحث‌های زیادی مطرح است که بانک‌ها  بتوانند چنین سامانه‌ای را طراحی کنند. یک بحث میزان زیاد داده‌هاست که احتمال ایجاد اشتباه در آنها را افزایش می‌دهد. البته این چالش را از سوی خودمان و نه از طرف بانک رسیدگی کردیم. همین رسیدگی باعث شد که نقطه‌ضعف را برطرف کرده و کیفیت داده‌ها را به یک حد مطلوب برسانیم تا در نهایت کشف تقلب صورت گیرد.»

دادخواه در ادامه به نکته دیگری اشاره کرد و افزود: «نکته بعدی این است که بانک‌ها دوست ندارند داده‌هایشان را در اختیار «غیر» قرار دهند که البته منطقی بوده و نگرانی بجایی است؛ چراکه ممکن است داده‌های بانک لو برود یا از آن سوءاستفاده شود. برای این کار، سرویس و ابزار را داخل بانک و پشت لایه‌های امنیتی خود بانک قرار دادیم. در واقع همان قدری که بانک به سیستم خودش اعتماد دارد، به ما نیز اعتماد دارد. نکته دوم بحث پوشیدگی و مخفی‌بودن است. برخی بانک‌ها یکسری داده‌هایشان را به‌دلیل حساسیت در اختیار دیگران قرار نمی‌دهند، اما حاضرند آن را در سامانه ما بگذارند. در این مواقع خطی را داخل سامانه ایجاد کردیم که داده‌های حساس این‌چنینی را به آن وارد کرده و فقط به خود متخصصان بانک نشان می‌دهیم. یعنی از آن داده‌ها به هیچ‌وجه در بحث‌های پردازشی استفاده نمی‌کنیم. در واقع ما با اقداماتی که عنوان شد، به‌دنبال آن بودیم که رضایت بانک‌ها را جذب کنیم.»


کشف شرط‌بندی با یادگیری ماشین


از آنها در خصوص امکان کشف تقلب از طریق سایت‌های مربوط به شرط‌بندی یا اجاره‌ای پرسیدیم که حاجی‌زاده پاسخ داد: «در مباحث یادگیری ماشین یک مرجعی قرار داده‌ایم که جامعه را نسبت به آن می‌سنجیم. این مرجع می‌تواند هر چیزی باشد. در بحث فیشینگ، مرجع رفتار گذشته آن موجودیت بوده که همان کارت یا مشتری است. مراجع دیگری نیز می‌توان در نظر گرفت، به‌عنوان مثال مراجع رفتاری کل موجودیت‌ها. اگر رفتارهای کل کارت‌های یک بانک مرجع قرار گیرد، می‌توان آنها را به گروه‌های مختلفی تقسیم‌بندی کرد. وقتی این کار را انجام دهیم، به‌صورت خودکار مشتریان مشابه کنار هم قرار می‌گیرند. اتفاقی که می‌افتد، این است که یا عده‌ای جدای از این دسته‌بندی وارد گروه دیگری می‌شوند، یا اگر تعدادشان زیاد باشد، در دسته‌بندی مجزای دیگری قرار می‌گیرند که می‌توانیم با انتخاب آنها در یک دسته‌بندی دیگر، یک گروه دیگر تعریف کنیم. در واقع گمانیک الگوهای رفتاری را گروه‌بندی می‌کند.»

او در خصوص تأثیر گمانیک بر الگوهای دیگری مانند شرط‌بندی و دیگر حوزه‌های مشابه نیز گفت: «حساب‌های اجاره‌ای نیز الگوی رفتاری خاصی دارند. علاوه بر این، اطلاعات دموگرافیک افراد نیز می‌تواند کمک کند. فرض کنید مشخصات فردی را که حسابی به اسم خود دارد، بررسی کرده و متوجه می‌شویم که سابقه‌ای بسیار متفاوت با آنچه انجام می‌دهد، دارد. البته باید این نکته نیز مدنظر قرار گیرد که حساب‌های اجاره‌ای الگوی رفتاری شبیه هم دارند؛ در حجم تراکنش، ورودی و خروجی حساب‌ها و موارد دیگر که اگر تعدادی از آنها شناسایی شود، گمانیک می‌تواند به سایر حساب‌هایی که الگوی مشابهی دارند، برسد.»

از حاجی‌زاده در خصوص چالش‌هایی که با رگولاتوری دارند، پرسیدیم. اینکه آیا در این خصوص با بانک مرکزی چالش‌هایی به وجود آمده یا خیر که حاجی‌زاده گفت: «در این شرایط نیاز است که رگولاتوری داده‌های کامل‌تری برای بحث کشف تقلب از بانک‌ها داشته باشد. همان‌طور که اشاره شد، صرفاً داده کافی نیست. به‌عنوان مثال، هر چقدر داده‌هایی که شتاب و شاپرک ارائه می‌دهند، کامل‌تر باشد (به‌عنوان مثال شامل  موقعیت جغرافیایی یا اطلاعات صنف و زمینه کاری پذیرنده)، طبعاً کمک فراوانی به بحث کشف تقلب می‌شود؛ چراکه می‌توان از ابعاد دیگری نیز الگو را ساخت. در غیاب این موارد بسیاری از تقلب‌ها دیده نمی‌شود؛ همان چیزهایی که از ابتدا دنبالش بودیم. برای رسیدن به آن نیاز است که بانک‌ها، داده‌های کامل‌تری را در اختیارمان قرار دهند. بحث دیگر این است که این رگولاتور به‌عنوان یک نهاد مرکزی بتواند کمک کند که  داده‌های بی‌نام یا ناشناس‌ در یک بانک در اختیار بانک دیگر قرار گیرد. برای اینکه بتوان تشخیص داد که فیشینگ اتفاق افتاده، نیاز است که یک زنجیره را تعقیب کرد. حال اگر این داده‌ها به‌صورت ناشناس‌ و با حفظ محرمانگی مردم به شکلی در یک نهاد مرکزی قرار گرفته و پس از آن در اختیار سایر بانک‌ها قرار بگیرد، به پلیس و بانک‌ها نیز کمک می‌کند که بتوانند تشخیص بهتری در این زمینه داشته باشند. در اینجا نقش یک نهاد مرکزی ضروری است؛ در غیر این صورت بانک‌ها می‌بایست به‌صورت دو به دو با یکدیگر فعالیت کنند که امکانش وجود ندارد. در واقع لازم است تجمیع داده‌های تلخیص‌شده از رفتار مشتریان در اختیار سایرین قرار بگیرد. همچنین به اشتراک گذاشتن لیست‌های سیاه و خاکستری بین بانک‌ها می‌تواند جلوی بسیاری از تقلب‌ها را بگیرد.»

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.