پایگاه خبری راه پرداخت دارای مجوز به شماره ۷۴۵۷۲ از وزارت فرهنگ و ارشاد اسلامی و بخشی از «شبکه عصر تراکنش» است. راه پرداخت فعالیت خود را از دوم اردیبهشتماه ۱۳۹۰ شروع کرده و اکنون پرمخاطبترین رسانه ایران در زمینه فناوریهای مالی، بانکداری و پرداخت و استارتآپهای فینتک است.
گفتوگو با مدیران گمانیک در خصوص چالشها و بیم و امیدهای کشف تقلب در نظام بانکی کشور / فناوری در خدمت کاهش ریسک و تقلب
آویده علم جمیلی / کشف تقلب و پیبردن به راههای دور زدن قانون بهخصوص در بخش بانکی، همواره یکی از چالشهای جهان در مبارزه با پولشویی است. با وجود اینکه هرروزه شاهد بهتر شدن فناوریهای کشف تقلب در سیستمهای پرداخت هستیم، اما همچنان راه زیادی باقی است. با این حال، وجود ابزارهایی مانند گمانیک، میتواند امید به بهبود شرایط را افزایش دهد. در مصاحبهای که با علی حاجیزاده مقدم، مدیرعامل شرکت آدانیک و سعید دادخواه، مدیر فنی گمانیک داشتیم، از آنها در خصوص نقاط قوت و ضعف گمانیک، چرایی ارائه یک نسخه جدید از این اپلیکیشن به بازار، همچنین راهکار این ابزار برای شناسایی مسیرهای تقلب پرسیدیم. مهمترین نکتهای که حاجیزاده مقدم و دادخواه به آن اشاره کردند و بارها و بارها از آن سخن گفتند، نبود یک مرجع رسمی برای تجمیع دادههای لیست سیاه و تقلبهای بانکی و نیز امکان تبادل اطلاعات بین بانکهای مختلف است. در غیاب این مرجع نمیتوان امیدی به تشخیص زود و بهموقع انواع تقلب؛ از فیشینگ تا شناسایی جریانهای مالی سایتهای شرطبندی و کارتهای اجارهای داشت.
چرا نسخه جدید روانه بازار شد؟
بهعنوان نخستین سؤال پرسیده شد که چرا نسخه جدیدی از گمانیک را به بازار عرضه کردید و تفاوت این نسخه با قبلی در چیست؟ در ابتدا حاجیزاده مقدم به بیان یک مقدمه پرداخت و گفت: «پیادهسازی سامانه گمانیک با این رویکرد آغاز شد که تحلیل بیگدیتا یک روند و جریان پیشرونده است. در دوره رشد شدید خدمات دیجیتالی، روشهای کلاسیک مدیریت مبتنی بر گزارشهای کلاسیک مالی و فروش و وضعیت بازار بهتنهایی پاسخگوی نیازهای افراد و شرکتها نیستند و سیل دادههای در گردش داخل سازمانها، نیازمند اتخاذ یکسری رویکردهای دیگر است. فناوری بیگدیتا و هوش مصنوعی برای پاسخ به این موضوع ابزاری درست هستند و ما نیز از آنها در پیادهسازی و توسعه سامانه گمانیک استفاده کردیم. گمانیک ابزاری برای کشف الگوهای پنهان در بیگدیتاست. گمانیک در چهار سال و نیم گذشته که در مسیر رشد قرار داشته، بازخوردهای مداومی از کاربران دریافت کرده و همین بازخوردها باعث شکلگیری، وضوح و شفافسازی تصویری شد که در روز اول برای این سامانه داشتیم».
سعید دادخواه اینگونه به این سؤال پاسخ داد: «چهار سال و نیم پیش کار گمانیک را شروع کردیم. در ابتدا برای شناسایی ناهنجاریهای مستتر در دادهها یکسری الگوریتم ساده و آماری داشتیم که به روش برنامهنویسی کلاسیک پیادهسازی شده بودند و از ابزارهای پردازش بیگدیتا استفاده نمیکردیم. اما بهمرور و با پیشرفت پروژه، موتور تعریف قواعد تکامل پیدا کرد. البته مثل هر پروژه دیگری، نقاط ضعفی نیز وجود داشت؛ اولین و شاید مهمترین آنها پایینبودن سرعت ایجاد هماهنگی بین بخشهای مختلف سیستم بود. پس از شناسایی نقاط ضعف به این نتیجه رسیدیم که برای بهبود و افزایش کارایی سامانه و رسیدن به اهدافی که داشتیم، میبایست کار دیگری صورت بگیرد.»
دادخواه در ادامه گفت: «بعد از یک سال و نیم بهینهسازی محصول را با تغییرات بنیادی در تکنولوژیهای مورد استفاده آغاز کردیم. در این مقطع بود که نام «گمانیک» را انتخاب کرده و با آن ادامه دادیم. برای گام نخست، همان نسخه قبلی را به نحو بهتر پیادهسازی کرده و ویژگیهای جدیدی به آن افزودیم. بهعنوان مثال پیشتر برای افزودن قاعده جدید به پیادهسازی کد قاعده توسط توسعهدهنده سامانه نیاز بود. این فرایند در نسخه جدید بهسادگی از طریق پنل سامانه و توسط کاربر سامانه انجام میشود. در نسخه جدید همهچیز را کاملاً عمومی دیدیم و دو نوع داده پایه برای سامانه ایجاد کردیم؛ دادههای سیستمی و دادههای سازمانی. با توجه به طراحی و معماری نسخه جدید، افزودن دادههای سازمانی و سیستمی به سامانه کار دشواری نبود و در کمترین زمان انجام میشد.»
دادخواه در خصوص نسخه جدید ادامه داد: «با وجود گستردگی قواعد موجود در سامانه و نیازی که در سازمانها ایجاد شد، بهمنظور ایجاد دیدی کلی نسبت به نتایج و طبقهبندی آنها، سرویسی برای امتیازدهی و سطحبندی موجودیتها در سامانه تعریف شد. علاوه بر آن برای انسجام و دسترسی ساده به کلیه اطلاعات یک موجودیت، پروفایلی در سامانه تعریف شد. پروفایل یکپارچه موجودیت یا مشتری امکان مشاهده نتایج مربوط به موجودیت در حسابها و کارتهای گوناگون را، در یک نگاه، در دو قالب تصویری و جدولهای داده فراهم میکند. پس از آن به سمت پردازش بیگدیتا با استفاده از ابزارهای پردازشی بیگدیتا و هوشمندسازی فرایند تشخیص ناهنجاری رفتیم که بهنوعی بنیان و اساس تعریف سامانه محسوب میشدند. در واقع منطق و زیرساخت برنامه کاملاً برای استفاده از الگوریتمهای یادگیری ماشین و پیادهسازی فرایندهای هوشمند آماده شده بود. طی یک سال اخیر ابزارهای پردازش دادههای حجیم مانند زپلین و دیگر ابزارهای پردازشی را به سامانه اضافه کردهایم. در واقع مجموعه این ابزارها در کنار تخصص و مهارت برای شناسسایی بهترین الگوریتمها و بهینهسازی آنها بر اساس کیفیت و کمیت دادهها، باعث شدند قدرت پردازش سامانه افزایش زیادی داشته باشد، بهطوری که بهجرئت میتوان ادعا کرد برای کشف تقلب و پیبردن به هر گونه ناهنجاری در یک سیستم، گمانیک یکی از بهترین گزینههاست.»
چقدر میتوان از گمانیک در دنیای واقعی بهره برد؟
سؤال بعدی درباره اثرگذاری گمانیک در دنیای واقعی بود. حاجیزاده این موضوع را مطرح کرد که گمانیک در حال حاضر در حوزه بانکی متمرکز است. او در این خصوص ادامه داد: «حضور گمانیک در این حوزه از موضوع تقلبهای مرتبط با کارت شروع شد. تعیینکننده اولویت موضوع، بانک بهعنوان مشتری و بهرهبردار سامانه بود. اهمیت کارت به این دلیل بود که موجودیت کارت یکی از کانالهای کلاهبرداری است، اما در ادامه به سایر تراکنشهای مبتنی بر سپرده و سایر موجودیتهای بانکی مانند سرفصلها نیز توسعه پیدا کرد. سپس از این مرحله که صرفاً کارت یا سایر موجودیتها بهصورت جداگانه در نظر گرفته شود، گذر کرده و به این مرحله که همه دادههای یک موجودیت (مثلاً یک مشتری) به یکدیگر ارتباط پیدا میکنند، رسیدیم. برقراری ارتباط بین موجودیتها امکان تمرکز روی مشتری و شناسایی رفتارهای نابهنجار مشتری را فراهم کرد. بهعنوان مثال در حال حاضر با توجه به ابزارهایی که گمانیک از آنها بهره میبرد، ریسک یک فرد اندازهگیری میشود».
حاجیزاده در ادامه به این موضوع نیز اشاره کرد که ابزارهای بهکاررفته در گمانیک محدود به بانکها نمیشود و میتواند در سایر سازمانها و صنایع نیز به کار گرفته شود. وی گفت: «این ابزار و فناوریهای استفادهشده در آن، قابلیت تشخیص هرگونه ناهنجاری در هر دادهای را دارد. در واقع سعی شده در منابع داده ورودی و همچنین در طراحی الگوها، منطق سامانه و ابزارهای پیادهسازیشده را به سمت عمومیتر شدن پیش ببریم؛ به گونهای که امکان تشخیص ناهنجاری در گستره وسیعی از انواع داده مهیا شود. البته باید یادآوری کنیم که این رخدادهای غیرعادی یا ناهنجاری، الزاماً برای تشخیص تقلب نیست و بسته به دادهها، هدف و نیازمندی سازمان میتواند به شناسایی موارد استثنا و توسعه سیاستگذاریهای سازمانها بینجامد. با این دید، شناسایی ناهنجاریها در حوزههای بسیار دیگری کاربرد دارد.»
در ادامه پرسیده شد که برای شناسایی اصل از فرع یا اصل از تقلب و ناهنجاری، در گمانیک چقدر از هوش مصنوعی استفاده شده است. دادخواه توضیح داد: «اگر تخلفی رخ دهد، با استفاده از قواعد میتوان آن را شناسایی کرد و بر اساس قوانین مالی و بانکی جلوی آن را گرفت. در واقع با ثبت قواعد جدید سعی میشود تخلفات شناسایی و از آنها جلوگیری شود. بهعنوان مثال یکسری افراد هستند که با وجود رعایت قانون توسط بانکها، راههایی برای تقلب و تخلف از قوانین بانکی و مالی پیدا میکنند. در واقع تقلبهایی از این دست میتوانند بانک را متضرر کنند. این نوع تخلفات هدفشان بانکها هستند. دسته دیگر تقلبهایی هستند که علاوه بر بانک، مشتریان را نیز دچار زیان و خسارت میکنند. این نوع تقلبها را نمیتوان به قالب یک قانون ساده کاهش داد و بهصورت قاعده تعریف کرد. اگر هم بر فرض قاعدهای برای شناسایی و کاهش تقلب ایجاد شود، تعداد تراکنشهای زیادی در لیست تراکنشهای مشکوک قرار میگیرند که در این صورت نیز نمیتوان تقلب اصلی را با توجه به حجم زیاد تراکنشهایی که باید بررسی شود، بهسرعت شناسایی کرد.»
او در خصوص نحوه استفاده از یادگیری ماشین برای کشف این نوع تقلبها گفت: «با استفاده از الگوریتمهای یادگیری ماشین سرویسی طراحی شده که دادهها را پردازش کرده و از آنها به یکسری ویژگی میرسد. مدل تعریفشده بر اساس ویژگیهای بهدستآمده، با دقت بالایی ناهنجاریها را شناسایی میکند. در واقع میتوان این ادعا را مطرح کرد که الگوریتمهای یادگیری ماشین میتوانند جامعهای را انتخاب کنند که تقلبهای بیشتری در آن رخ داده است. این انتخاب با صرف هزینه کمتری صورت میپذیرد.»
اگر بانکها بخواهند، گمانیک میتواند به آنها کمک کند
سؤال بعدی در خصوص فیشینگ و تراکنشهای مشکوک بود؛ اینکه گمانیک در این حوزه چقدر توانسته به بانکها کمک کند تا تقلبهایی را که در راستای پولشویی است، شناسایی کنند و شناسایی این تقلبها چقدر زمان میبرد؟ دادخواه پاسخ داد: «از بین صحبتهای شما دو بخش را از هم جدا میکنم. بخش اول اینکه چه تقلبهایی را باید شناسایی کرد؛ ما یک پیشفرض داریم که پشت همه موجودیتها افراد (حقیقی یا حقوقی) هستند و قرار نیست رفتارشان تغییر کند، یا به عبارت دیگر اکثر افراد رفتار منطقی ثابتی دارند که میتوان آن را با استفاده از رفتار یا چگونگی استفاده از موجودیتها شناسایی کرد. زمانی میتوان تقلبهای بیشتری را شناسایی کرد که سعی کنیم به جای فرد متقلب فکر کنیم. بهعنوان مثال، در صورتی که اطلاعات کارت یا حساب کسی لو برود، فرد افشاکننده سعی میکند بیشترین استفاده را از آن داشته باشد. این «بیشترین استفاده» پیشفرض ما قرار میگیرد. اگر اتفاق دیگری پس از افشای اطلاعات حساب رخ دهد، از رفتار منطقی موجودیت فاصله گرفته و تشخیص آن نیز صورت میپذیرد. بحث دوم مدتزمان تشخیص تقلب است. این سؤال در اپلیکیشنهای پیادهسازیشده در منطق کلاسیک موضوعیت پیدا میکرد؛ چراکه در آن صورت میگفتیم اپلیکیشنمان چقدر پتانسیل دارد و چه میزان تراکنش را در روز پردازش میکند. اما در مورد سامانه گمانیک با توجه به استفاده از ابزارهای بیگدیتا، این سؤال دیگر موضوعیت ندارد.»
دادخواه در ادامه توضیح داد: «در حال حاضر روزانه به ازای هر پردازش، تراکنشهای سه ماه بررسی میشود و کل این فرایند ممکن است در چند دقیقه به اتمام برسد. میتوان بهسادگی منابع را متناسب با دادههای ورودی، افزایش دهیم. در این صورت زمان چندان افزایش پیدا نمیکند. از این جهت نگرانی نداریم؛ چراکه یک زیرساخت منعطف طراحی شده و اگر دادههای بیشتری به آن وارد شود، با اضافهکردن منابع بیشتر، زمان مورد بررسی را میتوان کاهش داد. البته تاکنون نیازی به آن حس نشده است. با همین سامانه و با منابعی که از ابتدا در نظر گرفته بودیم، با بهبود فرایندها توانستیم به این حد برسیم که دادههای سه ماه را در عرض چند دقیقه پردازش کنیم.»
در ادامه حاجیزاده یک نکته را به صحبتهای دادخواه اضافه کرد و افزود: «حل مسائلی که بانکها در حوزه فیشینگ با آن مواجه هستند، به دادههایی فراتر از دادههای یک بانک نیاز دارد؛ چراکه خود فیشینگ قابل تشخیص نیست، اما رفتارهای بعدی آن و روند پولشویی بعدی که در فیشینگ اتفاق میافتد، حائز اهمیت است. یکی از مشکلاتی که وجود دارد این است که یک بانک داده کافی ندارد و متقلبان نیز از همین نقطهضعف استفاده میکنند؛ بنابراین شاید یکی از دلایلی که جای خالی ابزاری مانند گمانیک حس میشود، وجود یک نقطه مرکزی است که بتواند این دادهها را از بانکهای مختلف دریافت و الگوسازی کند.»
برای هر سلیقهای، برنامهای داریم
نکتهای که حاجیزاده در خصوص نیاز به دادههایی فراتر از دادههای یک بانک بیان کرد، سؤال بعدی ما بود؛ از آنها پرسیدیم که بانکها در بحث ارائه داده خشک عمل میکنند، از سوی دیگر در برخی موارد نیز دادههای قابل استناد و مطمئنی از موضوعاتی که سامانه کشف تقلب بر اساس آن پردازشهای لازم را انجام دهد، وجود ندارد. با این چالش چگونه برخورد میکنید؟ بانکها همکاری میکنند یا با این چالش کارتان را پیش میبرید؟ دادخواه پاسخ داد: «برای انجام پردازش دادهها، فرایندهای زیادی را پیشبینی کرده بودیم و در واقع با همین محدودیتها سامانه گمانیک را توسعه دادیم. بحثهای زیادی مطرح است که بانکها بتوانند چنین سامانهای را طراحی کنند. یک بحث میزان زیاد دادههاست که احتمال ایجاد اشتباه در آنها را افزایش میدهد. البته این چالش را از سوی خودمان و نه از طرف بانک رسیدگی کردیم. همین رسیدگی باعث شد که نقطهضعف را برطرف کرده و کیفیت دادهها را به یک حد مطلوب برسانیم تا در نهایت کشف تقلب صورت گیرد.»
دادخواه در ادامه به نکته دیگری اشاره کرد و افزود: «نکته بعدی این است که بانکها دوست ندارند دادههایشان را در اختیار «غیر» قرار دهند که البته منطقی بوده و نگرانی بجایی است؛ چراکه ممکن است دادههای بانک لو برود یا از آن سوءاستفاده شود. برای این کار، سرویس و ابزار را داخل بانک و پشت لایههای امنیتی خود بانک قرار دادیم. در واقع همان قدری که بانک به سیستم خودش اعتماد دارد، به ما نیز اعتماد دارد. نکته دوم بحث پوشیدگی و مخفیبودن است. برخی بانکها یکسری دادههایشان را بهدلیل حساسیت در اختیار دیگران قرار نمیدهند، اما حاضرند آن را در سامانه ما بگذارند. در این مواقع خطی را داخل سامانه ایجاد کردیم که دادههای حساس اینچنینی را به آن وارد کرده و فقط به خود متخصصان بانک نشان میدهیم. یعنی از آن دادهها به هیچوجه در بحثهای پردازشی استفاده نمیکنیم. در واقع ما با اقداماتی که عنوان شد، بهدنبال آن بودیم که رضایت بانکها را جذب کنیم.»
کشف شرطبندی با یادگیری ماشین
از آنها در خصوص امکان کشف تقلب از طریق سایتهای مربوط به شرطبندی یا اجارهای پرسیدیم که حاجیزاده پاسخ داد: «در مباحث یادگیری ماشین یک مرجعی قرار دادهایم که جامعه را نسبت به آن میسنجیم. این مرجع میتواند هر چیزی باشد. در بحث فیشینگ، مرجع رفتار گذشته آن موجودیت بوده که همان کارت یا مشتری است. مراجع دیگری نیز میتوان در نظر گرفت، بهعنوان مثال مراجع رفتاری کل موجودیتها. اگر رفتارهای کل کارتهای یک بانک مرجع قرار گیرد، میتوان آنها را به گروههای مختلفی تقسیمبندی کرد. وقتی این کار را انجام دهیم، بهصورت خودکار مشتریان مشابه کنار هم قرار میگیرند. اتفاقی که میافتد، این است که یا عدهای جدای از این دستهبندی وارد گروه دیگری میشوند، یا اگر تعدادشان زیاد باشد، در دستهبندی مجزای دیگری قرار میگیرند که میتوانیم با انتخاب آنها در یک دستهبندی دیگر، یک گروه دیگر تعریف کنیم. در واقع گمانیک الگوهای رفتاری را گروهبندی میکند.»
او در خصوص تأثیر گمانیک بر الگوهای دیگری مانند شرطبندی و دیگر حوزههای مشابه نیز گفت: «حسابهای اجارهای نیز الگوی رفتاری خاصی دارند. علاوه بر این، اطلاعات دموگرافیک افراد نیز میتواند کمک کند. فرض کنید مشخصات فردی را که حسابی به اسم خود دارد، بررسی کرده و متوجه میشویم که سابقهای بسیار متفاوت با آنچه انجام میدهد، دارد. البته باید این نکته نیز مدنظر قرار گیرد که حسابهای اجارهای الگوی رفتاری شبیه هم دارند؛ در حجم تراکنش، ورودی و خروجی حسابها و موارد دیگر که اگر تعدادی از آنها شناسایی شود، گمانیک میتواند به سایر حسابهایی که الگوی مشابهی دارند، برسد.»
از حاجیزاده در خصوص چالشهایی که با رگولاتوری دارند، پرسیدیم. اینکه آیا در این خصوص با بانک مرکزی چالشهایی به وجود آمده یا خیر که حاجیزاده گفت: «در این شرایط نیاز است که رگولاتوری دادههای کاملتری برای بحث کشف تقلب از بانکها داشته باشد. همانطور که اشاره شد، صرفاً داده کافی نیست. بهعنوان مثال، هر چقدر دادههایی که شتاب و شاپرک ارائه میدهند، کاملتر باشد (بهعنوان مثال شامل موقعیت جغرافیایی یا اطلاعات صنف و زمینه کاری پذیرنده)، طبعاً کمک فراوانی به بحث کشف تقلب میشود؛ چراکه میتوان از ابعاد دیگری نیز الگو را ساخت. در غیاب این موارد بسیاری از تقلبها دیده نمیشود؛ همان چیزهایی که از ابتدا دنبالش بودیم. برای رسیدن به آن نیاز است که بانکها، دادههای کاملتری را در اختیارمان قرار دهند. بحث دیگر این است که این رگولاتور بهعنوان یک نهاد مرکزی بتواند کمک کند که دادههای بینام یا ناشناس در یک بانک در اختیار بانک دیگر قرار گیرد. برای اینکه بتوان تشخیص داد که فیشینگ اتفاق افتاده، نیاز است که یک زنجیره را تعقیب کرد. حال اگر این دادهها بهصورت ناشناس و با حفظ محرمانگی مردم به شکلی در یک نهاد مرکزی قرار گرفته و پس از آن در اختیار سایر بانکها قرار بگیرد، به پلیس و بانکها نیز کمک میکند که بتوانند تشخیص بهتری در این زمینه داشته باشند. در اینجا نقش یک نهاد مرکزی ضروری است؛ در غیر این صورت بانکها میبایست بهصورت دو به دو با یکدیگر فعالیت کنند که امکانش وجود ندارد. در واقع لازم است تجمیع دادههای تلخیصشده از رفتار مشتریان در اختیار سایرین قرار بگیرد. همچنین به اشتراک گذاشتن لیستهای سیاه و خاکستری بین بانکها میتواند جلوی بسیاری از تقلبها را بگیرد.»