پایگاه خبری راه پرداخت دارای مجوز به شماره ۷۴۵۷۲ از وزارت فرهنگ و ارشاد اسلامی و بخشی از «شبکه عصر تراکنش» است. راه پرداخت فعالیت خود را از دوم اردیبهشتماه ۱۳۹۰ شروع کرده و اکنون پرمخاطبترین رسانه ایران در زمینه فناوریهای مالی، بانکداری و پرداخت و استارتآپهای فینتک است.
بررسی انواع تحلیل داده در گفتوگو با مدیر واحد کسبوکار هوداد کاسپین / چالشی به اسم عدم قطعیت
عبدالله عشقی مدیر واحد کسبوکاری هوداد (هوشمند داده) یا محصولات هوشمند شرکت کاسپین، در گفتوگو با راه پرداخت، سطوح مختلف محصولات داده محور را معرفی کرد.
در سالهای اخیر بحثهای مربوط به داده، اهمیت آن و همینطور تحلیل داده بسیار پررنگ بوده است. از داده به عنوان طلا یا نفت جدید یاد میکنند. داده میتواند خلق ارزش و درآمد کند، میتواند امنیت ایجاد کند و متقابلا امنیت را به خطر هم بیندازند. هر کار مهمی که در دنیا انجام میشود، یک سرش به داده مربوط است. حرکت به سمت داده در دنیا سیر صعودی دارد و در دهه اخیر مباحث بسیاری در این باره مطرح شده و راهحلهای مختلفی برای انجام عملیات مختلف ارائه شده است؛ مانند به دست آوردن داده، ذخیره داده، تجمیع داده، تغییر داده، تحلیل داده و بهکارگیری خروجیهای نهایی آن.
خوشبختانه ایران هم از این تغییر و تحولات مستثنی نیست و در کشور ما هم بحث داده و اهمیت آن به تناسب برجسته شده و سازمانها و کسبوکارهای مختلف به سمت استفاده از داده، ذخیره داده و تحلیل داده، به صورت کم و بیش، سوق پیدا کردند؛ به خصوص در کسبوکارهای بانکی.
باتوجه به ماهیت کسبوکارهای بانکی و اینکه روشهای جدید فناوری اطلاعات سریعتر در بانکها جا میافتد و بانکها ناچار به استفاده از روشهای جدید فناوری اطلاعات هستند، در کسبوکارهای بانکی نسبت به دیگر کسبوکارها، در مورد جمعآوری و تحلیل داده پیشرفتهای بیشتری شکل گرفته و اهمیت این موضوع در بانکها سریعتر و زودتر درک شده است. به همین خاطر واحدها و ساختارهای سازمانی در بانکها متناسب با استفاده از دادهها ایجاد شده و اهمیت پیدا کرده و بخشهای مستقلی در بانکها برای رسیدگی به این حوزه اختصاص دادهاند.
برای مثال شما پیشتر برای انجام یک تراکنش به شعب بانک مراجعه میکردید و صرفا تراکنش شما در شعبه ثبت میشد اما امروزه وقتی شما تراکنشی را از طریق موبایل بانک، در یک ساعت مشخصی از روز و با یک سیستم و یوزر خاصی انجام میدهید، علاوه بر خود تراکنش، دادههای دیگری نیز ثبت خواهد شد و همه اینها میتواند برای بانک تبدیل به ارزش شود که بعد از جمعآوری آنها را تحلیل کند. همین ثبت حجم زیادی از داده در بانکها باعث شده که به سمت پیادهسازی سیستمهای تحلیل دادهای در سازمانشان شوند و درخواستهای زیادی برای مباحث دادهای در کشور وجود دارد.
تقاضاهای زیادی که برای محصولات دادهای در کشور وجود دارد باعث شد تا گفتوگویی داشته باشیم با عبدالله عشقی مدیر واحد کسبوکاری هوداد (هوشمند داده) یا محصولات هوشمند شرکت کاسپین تا علاوه بر معرفی سطوح مختلفی که برای محصولات دادهای وجود دارد، ببینیم که برای کدام یک در کشور تقاضای بیشتری وجود درد، هر کدام از این سطحها چه چالشهایی دارند و راهکارهای موجود برای رفع چالشها چیست.
اولین سطح؛ سطح توصیفی
اولین و سادهترین سطح سیستمهای تحلیل دادهای، سیستمهای توصیفی هستند و عشقی در توضیح بیشتر درباره عملکرد این سیستمها توضیح داد: «سیستمهای دادهای توصیفی با بررسی دادهها و تحلیل دادههای سازمان به این نتیجه میرسند که چه اتفاقی افتاده است. صرفا هیچ کار دیگری انجام نمیدهند. با ورود به دادهها و بررسی آنها، سیستم میگوید که برای مثال طی سال گذشته این اتفاقات برای مشتریان بانک شما افتاده است. برای مثال روند به دست آوردن مشتری یا از دست دادن مشتریهای شما طی یک سال گذشته به این شکل بوده و یک نمودار هم ارائه میدهد. این سادهترین سطح است و درواقع هیچ تحلیلی در آن انجام نمیشود. صرفا یک سری از دادههای گذشته سازمان گرفته خواهد شد و این دادهها به شکل گزارش در اختیار مدیر و مسئول قرار خواهد گرفت تا نشان دهد چه اتفاقاتی در طول بازه زمانی مشخص برای آن سازمان افتاده است.»
به گفته عشقی در بانکیهای کشور اولین قدم برداشته شده و به این نتیجه رسیدهاند که باید یک سیستم توصیفی از دادههای موجودشان داشته باشند تا مشاهده کنند چه اتفاقی در سازمانشان افتاده و آنها را بررسی کنند.
برای مثال با استفاده از سطح توصیفی، مدیری میبیند که روند از دست دادن مشتریهایش در مهر ماه دو برابر شده و این موضوع جرقهای میشود در ذهنش تا ببیند چرا این اتفاق در مهرماه افتاده است. اما بقیه کارهای مربوطه و بررسیها و اقدامات لازم را خودش باید انجام دهد چراکه این سیستم فقط توصیف میکند و چرایی بروز این اتفاق و اینکه برای جلوگیری از تکرار آن باید چکار کرد از توان سیستم خارج است و عامل انسانی باید آن را انجام دهد. بانکها همگی این سطح از سیستم تحلیل دادهای را در اختیار دارند و این مدل سیستمها، درخواستها واضح و مشخص است.
دومین سطح؛ سطح تشخیص
سطح دومی که برای سیستمهای تحلیل دادهای وجود دارد، کمی پیشرفتهتر از سطح توصیفی است و دخالت عامل انسانی را بهنسبت کمتر میکند. عشقی درباره سطح دوم اینطور توضیح میدهد: «برای مثال فرض کنید در ماه مهر تعداد مشتریهای رویگردان شما دوبرابر شده است. سیستم به صورت اتوماتیک دلیل این اتفاق هم برای شما پیدا میکند. چطور؟ سیستم بقیه دادههای سازمان را هم نگاه میکند و میبیند که در دادههای بانک برای ماه مهر یک سری اتفاقات افتاده است. برای مثال نرخ بهره کمتر شده یا نرخ بهره روزشمار حذف شده است. بنابراین سیستم تحلیل داده به صورت اتوماتیک تشخیص میدهد که در ماه مهر که این رویگردانی مشتریان به وجود آمده، دلیلش به خاطر یک سری از اتفاقات دیگری بوده که رخ داده، مانند همان کاهش نرخ بهره. البته این یک مثال ساده است و نمونهها و اتفاقات پیچیدهتری در این زمینه وجود دارد.»
از این مرحله، عدم قطعیتهایی وارد سیستم میشود چراکه این سیستم پیچیدهتر از سیستم اولی است. با اینکه اینجا سیستم دلیل افزایش نرخ رویگردانی را کاهش نرخ بهره تشخیص داده باشد اما ممکن است مدیر این دلیل را قبول نداشته باشد. چرا؟ چون برای مثال ممکن است در آن ماه قیمت طلا هم افزایش داشته و به همین خاطر مردم سپردههایشان را از بانک بیرون آوردند تا روی طلا سرمایهگذاری کنند. در نتیجه علت عنوانشده توسط سیستم ممکن است صد درصد درست نباشد.
در سطح اول سیستم براساس دادهها، با قاطعیت به شما میگفت که فلان اتفاق افتاده اما زمانی که بحث چرایی پیش میآید، تعداد زیادی پارامتر وجود دارد که باید لحاظ شوند. ممکن است در این میان برخی پارامترها را هم در دادهها نداشته باشیم. برای مثال نرخ کاهش و افزایش قیمت طلا در دادههای بانکی وجود ندارد و شاید دلیلی که سیستم به خاطر رویگردانی مشتریان ارائه داده درست نباشد و واقعا نوسانات قیمت طلا باعث بروز این اتفاق شده باشد.
در این صورت باید چکار کرد؟ به گفته عشقی باید دامنه دادهها را افزایش داد. اگر تا به حال برای تحلیلها از دادههای داخلی استفاده میشد، برای اینکه به تحلیل درستتری برسیم باید به دادههای خارجی نیز وصل شد. عشقی دراین باره میگوید: «این اتصال به دادههای خارجی هم قسمت تحلیل را سختتر میکند و هم هزینه انجام پروژه را بالاتر میبرد. همه اینها در نهایت به چالشهای در انجام پروژه تبدیل خواهد شد. این چالش، عدم قطعیت است چون هیچوقت نمیتوان با اطمینان گفت که همه پارامترها لحاظ شدهاند. در حالت توصیفی ما میتوانیم با اطمینان بگوییم که همه دادهها را وارد کردهایم اما وقتی میخواهیم به چرایی و علت وقوع بپردازیم، نمیتوان با اطمینان اظهار کرد که دقیقا دلیل اتفاق را کشف کردهایم. در اینجا ممکن است پذیرش نتیجه خروجی توسط مشتری به سختی انجام شود و بخواهد بخش بیشتری از دیتا را دخیل کند.»
سومین سطح؛ سطح پیشگویانه
در سومین سطح تحلیل داده، ما به دنبال پیشگویی هستیم؛ یعنی پیشبینی شود که چه اتفاقی خواهد افتاد. در این سطح تحلیلها پیچیدهتر و پیشرفتهتر هستند. در این مرحله علاوه بر روشهای مرسوم تحلیل داده، مانند روشهای آماری و هوش تجاری، روشهای یادگیری ماشین و هوش مصنوعی هم وارد بازی خواهد شد و سیستم از هوش مصنوعی برای انجام برخی پیشگوییها استفاده میکند. پیشگوییها اغلب براساس دادههای تاریخی گذشته و براساس پارامترهایی است که از بیرون وارد میشوند. بنابراین اول باید دید چه اتفاقی رخ داده و مهمتر از آن باید دید که چرا این اتفاق افتاده است. به عقیده عشقی این تشخیص چرایی به ما کمک میکند تا پارامترهای درستتری را انتخاب و در مدل پیشبینیمان استفاده کنیم. درواقع هرچه پارامترهایی که انتخاب میکنیم درستتر و معنیدارتر باشد، ارتباط بین متغیر مستقل و متغیر هدفمان را بهتر نشان میدهد و درنتیجه مدل ما دقیقتر خواهد شد.
به گفته مدیر واحد کسبوکار هوداد کاسپین، در این سطح از تحلیل داده، مدلهای مختلف یادگیری ماشین استفاده میشود تا آن نتیجه دورههای بعد را بتوان پیشبینی کرد. هر سازمانی که بخواهد برای آینده برنامهریزی و استراتژی داشته باشد و بخواهد طی یکی دو سال بعد برای مثال در فلان نقطه قرار بگیرد، باید تخمینی از وضعیت آینده خودش داشته باشد. مدیران همیشه وقتی که برنامههای کسبوکاریشان را میریزند، یک پیشبینی از آیندهشان دارند. حالا اگر به این پیشبینی ابزارهایی مانند هوش مصنوعی و یادگیری ماشین را هم اضافه کنیم، پیشبینیها دقیقتر از آب درخواهد آمد و سازمانها میتوانند اقدامات متناسبتر و دقیقتری برای حل مشکل یا ارتقای خودشان انجام دهند.
در سطح سوم هم به دادههای بیشتری نیاز خواهد بود و علاوه بر عدم قطعیتی که در سطح دوم، یعنی تشخیص، وجود داشت، مدلهای یادگیری ماشین هم خودشان یک عدم قطعیتی به همراه خواهند داشت در نتیجه خروجی کار باز هم با عدم قطعیت بیشتری همراه خواهد بود.
چهارمین سطح؛ سطح تجویزی
چهارمین و آخرین سطح از انواع تحلیل داده، سطح تجویزی است؛ یعنی سیستم علاوه بر اینکه پیشبینی میکند، به شما میگوید که باید چکار کنید. در این سطح، هوش مصنوعی به شما میگوید که وضعیت از این قرار است، دلیلش هم این است و پیشبینی میکند که ماه بعد چنین اتفاقی میافتد و برای اینکه این اتفاق نیفتد باید این کار انجام شود.
عشقی با ارائه مثالی، سطح تجویزی را بیشتر توضیح داد: «برای مثال سیستم به شما میگوید که در ماه بعد قیمت دلار و طلا بالا میرود و در نتیجه مردم سپردههایشان را بیرون میآورند. احتمال اینکه سپردهها کم شود زیاد است. سپس با توجه به تحلیل انجامشده، سیستم به شما میگوید وقتی که تقاضا برای بیرون آوردن سپرده از بانک زیاد میشود، شما میتوانید نرخ بهره خودتان را بالا ببرید. به این ترتیب شما مانع از این میشوید که مشتریان با وجود نوسانات بازار، از سیستم شما خارج شوند.»
سیستم تجویزی دو سطح دارد. در یک سطحش، خود سیستم وارد عمل میشود و به صورت اتوماتیک بهترین تصمیم را اجرا میکند. در سطح دیگر، انواع تصمیمها را در اختیار شما قرار میدهد و کاربر انسان (مدیر) میتواند انتخاب کند که کدام کار را انجام دهد. به گفته عشقی این سطح، پیشرفتهترین و پیچیدهترین سطحی است که در سیستمهای تحلیل داده وجود دارد.
اما آیا با وجود اینهمه عدم قطعیت، تقاضایی برای استفاده از این سطح از تحلیل داده وجود دارد؟ اصلا چرا سازمانها باید بخواهند که از چنین مدلهایی در سازمانشان استفاده کنند؟
چالشی به نام عدم قطعیت
براساس گفتههای عشقی برای چنین پروژهها و سیستمهایی هم در کشور تقاضا وجود دارد اما در حال حاضر این سیستمهای پیشگویانه به آن مرحله از بلوغ نرسیدهاند که بشود از نتایج آنها به طور کامل استفاده کرد زیرا ممکن است تبعات مالی و اعتباری برای بانکها و سازمانها داشته باشد.
برای مثال سیستم کشف تقلب، یکی از سیستمهای موردنیاز همه بانکها است. این سیستم باید وقتی که یک مشتری تراکنشی را انجام میدهد، به طور اتوماتیک تشخیص دهد که آیا این تراکنش متعلق به خود شخص بوده یا تقلبی اتفاق افتاده است. اگر سیستم کاملا دقیق پیشگویی کند، میتواند با دقت بسیار بالایی بگوید که آیا تراکنش متعلق به خود فرد است یا نه اما چون سیستم نمیتواند با دقت بسیار بالا عمل کند و عدم قطعیت هم در سطح تشخیص و هم در سطح پیشگویی وجود دارد، ممکن است تعداد موارد اشتباهی که تشخیص میدهد بالا باشد.
همه اینها هزینههای زیادی برای بانک ایجاد خواهد کرد به همین دلیل هم در استفاده از سیستمهای پیشگویانه، احتیاط بیشتری به خرج داده میشود. هرچند که عشقی این احتیاط بیشتر را فقط مختص ایران نمیداند بلکه در کل دنیا روال به این شکل است. او معتقد است که چکشکاری زیادی باید روی این سیستمها انجام شود. باید براساس دادههای گذشته و دادههای بیرونی به این سیستمها آموزش داده شود تا درنهایت به خروجی قابل قبول و قابل اطمینانی برسد.
نوع نگرشی که نسبت به پروژههای داده محور، پروژههایی که از جنس تحلیل داده، تشخیص، پیشگویانه یا تجویزی هستند، باید تغییر کند. عشقی امیدوار است که شاید طی چند سال آینده این اتفاق بیفتد اما در حال حاضر این شکاف وجود دارد که نوع نگرشی که نسبت به پروژههای تحلیل داده وجود دارد همان نگرشی است که نسبت به پروژههای توصیفی وجود دارد. به همین دلیل انتظارات از سیستمهای تحلیل داده این است که همزمان با شروع پروژه، زمان انتهایی دقیقی هم برایش مشخص شود و همچنین انتظار دارند که با قطعیت کامل به خروجی نهایی برسند.
اما زمانی که نمیشود قول این قطعیت را داد، سازمانها کمی عقبنشینی میکنند. در سطحهای پیشرفتهتر تحلیل داده، خروجی پروژهها مشخص نیست که آیا حتما به نتیجه میرسند یا نه. همچنین ممکن است که زمان انجامش هم خیلی طولانیتر شود و همه اینها پروژه را به یک منبع هزینه بزرگ برای سازمان تبدیل میکند. بنابراین روی درخواست این سیستمها کمی احتیاط بیشتری وجود دارد.
پیشنهادهایی برای دریافت نتیجه بهتر از تحلیل دادهها
مدیر واحد کسبوکاری هوداد استفاده از سیستمهای تحلیل داده را به فرایند یادگیری شنا توصیف میکند و دربارهاش میگوید: «پروژههای تحلیل داده به این شکل نیست که منتظر باشیم همکار یا رقیب ما از آن استفاده کند و به یک قطعیتی برسد و وقتی که مراحل آزمایشیاش را طی کرد سپس ما از آن استفاده کنیم. شاید تا حدی بشود این کار را کرد اما برای اینکه به دقت موردنظر رسید، باید روی دادهها و پارامترهای تاثیرگذار در کسبوکار هر سازمان به صورت جداگانه کار انجام داد تا به نتیجه مطلوب رسید. تحلیل داده مانند شنا کردن است. اگر میخواهید تحلیل داده برای شما و در سازمان شما خروجی داشته باشد، باید خودتان را به آب بزنید. در آب باید دست و پا بزنید و خسته شوید و چند بار به حالت خفگی برسید تا درنهایت شنا کردن را یاد بگیرید. درست است که اینکار برای سازمانها هزینهبر است اما مجبورند خودشان را به آب بزنند و تحلیل داده را شروع کنند. برای اینکه هزینه زیادی هم برای سازمانها ایجاد نشود، بهتر است کارها را در مقیاس کوچک و قدم به قدم شروع کنند. متاسفانه نگرش همه یا هیچ وجود دارد و نگرش قدم به قدم وجود ندارد.»
مثال سادهتر برای این بخش این است که اگر شما میخواهید سیستم پیشبینی را در بانک خودتان پیادهسازی کنید همه کسبوکار را درگیر نکنید. یک هدف بسیار کوچک را مشخص کنید و برای مثال بگویید که میخواهید در حوزه تسهیلات پیشبینی داشته باشید. پس ابتدا کار را با تسهیلات شروع کنید.
پیشنهاد دیگری که عشقی برای رسیدن به نتیجه بهتر از تحلیل دادهها مطرح میکند، تعریف پروژهها است. کسانی که در سازمانها و بانکها تعریف پروژه میکنند، باید با بحثهای تحلیل داده آشنایی داشته باشند و یک بخش تحلیل داده همراه با کارشناسان خبره تحلیل داده باید در سازمان وجود داشته باشد تا بتوانند نیازمندیهای بخش کسبوکار در پروژههای هوش مصنوعی و پیشگویانه را به یک زبان مشترک برای توسعهدهنده و انجام دهنده کار تبدیل کند. برای اینکار عشقی پیشنهاد میدهد که بهتر است کارها با اسکوپهای کوچکتر تعریف شود و یکدفعه همه چیز را با هم نخواهید.
پیشنهاد بعدی ایجاد تغییرات در متدولوژیهایی است که برای قیمتگذاری و زمانبندی پروژهها در نظر گرفته میشود. باید متناسب با روشهای تحلیل داده، از روشهای جدیدتری برای تعریف و تعیین میزان قیمتها و زمانها استفاده شود و به نوعی انعطافپذیری در این حوزه ایجاد شود.
برنامههای ۱۴۰۰ شرکت کاسپین
عشقی در پایان صحبتهایش و قبل از اشاره به برنامههای سال آینده شرکت، به پروژههای موفقی که سال گذشته در حوزههای غیربانکی و پرداخت الکترونیکی داشتند اشاره کرد و گفت: «از این چهار سطح در واحد هوداد، در سطوح توصیفی، تشخیصی و پیشگویانه پروژههای متعدد بانکی و غیربانکی انجام شده است. در سال آینده هدف ما این است که علاوه بر توسعه بازار به حوزههای غیربانکی، در حوزه پروژههای هوش مصنوعی و تحلیلی نیز بتوانیم با استاندارد و بستپرکتیسهایی کارهایمان را شروع کنیم و بتوانیم نتایج قابل قبولی را به کسبوکارها ارائه دهیم.»
به گفته مدیر واحد محصولات هوشمند کاسپین، این شرکت آمده به سازمانها کمک کند تا مشکلاتشان را با استفاده از روشهای تحلیل دادهای حل کنند. بعضی از این مشکلات را ممکن است خود سازمانها متوجهشان شده باشند و همچنین مشکلاتی که ممکن است از آن اطلاعی نداشته باشند هم کاسپین برایشان استخراج میکند. او شعار سال ۱۴۰۰ شرکت را حل مسائل کسبوکاری سازمانها با تکیه بر دانش و فناوری جدید و تحلیل داده عنوان میکند.