راه پرداخت
راه پرداخت؛ رسانه فناوری‌های مالی ایران

بررسی انواع تحلیل داده در گفت‌وگو با مدیر واحد کسب‌وکار هوداد کاسپین / چالشی به اسم عدم قطعیت

عبدالله عشقی مدیر واحد کسب‌وکاری هوداد (هوشمند داده) یا محصولات هوشمند شرکت کاسپین، در گفت‌وگو با راه پرداخت، سطوح مختلف محصولات داده محور را معرفی کرد.

در سال‌های اخیر بحث‌های مربوط به داده، اهمیت آن و همینطور تحلیل داده بسیار پررنگ بوده است. از داده به عنوان طلا یا نفت جدید یاد می‌کنند. داده می‌تواند خلق ارزش و درآمد کند، می‌تواند امنیت ایجاد کند و متقابلا امنیت را به خطر هم بیندازند. هر کار مهمی که در دنیا انجام می‌شود، یک سرش به داده مربوط است. حرکت به سمت داده در دنیا سیر صعودی دارد و در دهه اخیر مباحث بسیاری در این باره مطرح شده و راه‌حل‌های مختلفی برای انجام عملیات مختلف ارائه شده است؛ مانند به دست آوردن داده، ذخیره داده، تجمیع داده، تغییر داده، تحلیل داده و به‌کارگیری خروجی‌های نهایی آن.

خوشبختانه ایران هم از این تغییر و تحولات مستثنی نیست و در کشور ما هم بحث داده و اهمیت آن به تناسب برجسته شده و سازمان‌ها و کسب‌وکارهای مختلف به سمت استفاده از داده، ذخیره داده و تحلیل داده، به صورت کم و بیش، سوق پیدا کردند؛ به خصوص در کسب‌وکارهای بانکی.

باتوجه به ماهیت کسب‌وکارهای بانکی و اینکه روش‌های جدید فناوری اطلاعات سریعتر در بانک‌ها جا می‌افتد و بانک‌ها ناچار به استفاده از روش‌های جدید فناوری اطلاعات هستند، در کسب‌وکارهای بانکی نسبت به دیگر کسب‌وکارها، در مورد جمع‌آوری و تحلیل داده پیشرفت‌های بیشتری شکل گرفته و اهمیت این موضوع در بانک‌ها سریع‌تر و زودتر درک شده است. به همین خاطر واحدها و ساختارهای سازمانی در بانک‌ها متناسب با استفاده از داده‌ها ایجاد شده و اهمیت پیدا کرده و بخش‌های مستقلی در بانک‌ها برای رسیدگی به این حوزه اختصاص داده‌اند.

برای مثال شما پیش‌تر برای انجام یک تراکنش به شعب بانک مراجعه می‌کردید و صرفا تراکنش شما در شعبه ثبت می‌شد اما امروزه وقتی شما تراکنشی را از طریق موبایل بانک، در یک ساعت مشخصی از روز و با یک سیستم و یوزر خاصی انجام می‌دهید، علاوه بر خود تراکنش، داده‌های دیگری نیز ثبت خواهد شد و همه اینها می‌تواند برای بانک تبدیل به ارزش شود که بعد از جمع‌آوری آنها را تحلیل کند. همین ثبت حجم زیادی از داده در بانک‌ها باعث شده که به سمت پیاده‌سازی سیستم‌های تحلیل داده‌ای در سازمانشان شوند و درخواست‌های زیادی برای مباحث داده‌ای در کشور وجود دارد.

تقاضاهای زیادی که برای محصولات داده‌ای در کشور وجود دارد باعث شد تا گفت‌وگویی داشته باشیم با عبدالله عشقی مدیر واحد کسب‌وکاری هوداد (هوشمند داده) یا محصولات هوشمند شرکت کاسپین تا علاوه بر معرفی سطوح مختلفی که برای محصولات داده‌ای وجود دارد، ببینیم که برای کدام یک در کشور تقاضای بیشتری وجود درد، هر کدام از این سطح‌ها چه چالش‌هایی دارند و راهکارهای موجود برای رفع چالش‌ها چیست.


اولین سطح؛ سطح توصیفی


اولین و ساده‌ترین سطح سیستم‌های تحلیل داده‌ای، سیستم‌های توصیفی هستند و عشقی در توضیح بیشتر درباره عملکرد این سیستم‌ها توضیح داد: «سیستم‌های داده‌ای توصیفی با بررسی داده‌ها و تحلیل داده‌های سازمان به این نتیجه می‌رسند که چه اتفاقی افتاده است. صرفا هیچ کار دیگری انجام نمی‌دهند. با ورود به داده‌ها و بررسی آنها، سیستم می‌گوید که برای مثال طی سال گذشته این اتفاقات برای مشتریان بانک شما افتاده است. برای مثال روند به دست آوردن مشتری یا از دست دادن مشتری‌های شما طی یک سال گذشته به این شکل بوده و یک نمودار هم ارائه می‌دهد. این ساده‌ترین سطح است و درواقع هیچ تحلیلی در آن انجام نمی‌شود. صرفا یک سری از داده‌های گذشته سازمان گرفته خواهد شد و این داده‌ها به شکل گزارش در اختیار مدیر و مسئول قرار خواهد گرفت تا نشان دهد چه اتفاقاتی در طول بازه زمانی مشخص برای آن سازمان افتاده است.»

به گفته عشقی در بانکی‌های کشور اولین قدم برداشته شده و به این نتیجه رسیده‌اند که باید یک سیستم توصیفی از داده‌های موجودشان داشته باشند تا مشاهده کنند چه اتفاقی در سازمانشان افتاده و آنها را بررسی کنند.

برای مثال با استفاده از سطح توصیفی، مدیری می‌بیند که روند از دست دادن مشتری‌هایش در مهر ماه دو برابر شده و این موضوع جرقه‌ای می‌شود در ذهنش تا ببیند چرا این اتفاق در مهرماه افتاده است. اما بقیه کارهای مربوطه و بررسی‌ها و اقدامات لازم را خودش باید انجام دهد چراکه این سیستم فقط توصیف می‌کند و چرایی بروز این اتفاق و اینکه برای جلوگیری از تکرار آن باید چکار کرد از توان سیستم خارج است و عامل انسانی باید آن را انجام دهد. بانک‌ها همگی این سطح از سیستم تحلیل داده‌ای را در اختیار دارند و این مدل سیستم‌ها، درخواست‌ها واضح و مشخص است.


دومین سطح؛ سطح تشخیص


سطح دومی که برای سیستم‌های تحلیل داده‎ای وجود دارد، کمی پیشرفته‌تر از سطح توصیفی است و دخالت عامل انسانی را به‌نسبت کمتر می‌کند. عشقی درباره سطح دوم اینطور توضیح می‌دهد: «برای مثال فرض کنید در ماه مهر تعداد مشتری‌های روی‌گردان شما دوبرابر شده است. سیستم به صورت اتوماتیک دلیل این اتفاق هم برای شما پیدا می‌کند. چطور؟ سیستم بقیه داده‌های سازمان را هم نگاه می‌کند و می‌بیند که در داده‌های بانک برای ماه مهر یک سری اتفاقات افتاده است. برای مثال نرخ بهره کمتر شده یا نرخ بهره روزشمار حذف شده است. بنابراین سیستم تحلیل داده به صورت اتوماتیک تشخیص می‌دهد که در ماه مهر که این روی‌گردانی مشتریان به وجود آمده، دلیلش به خاطر یک سری از اتفاقات دیگری بوده که رخ داده، مانند همان کاهش نرخ بهره. البته این یک مثال ساده است و نمونه‌ها و اتفاقات پیچیده‌تری در این زمینه وجود دارد.»

از این مرحله، عدم قطعیت‌هایی وارد سیستم می‌شود چراکه این سیستم پیچیده‌تر از سیستم اولی است. با اینکه اینجا سیستم دلیل افزایش نرخ روی‌گردانی را کاهش نرخ بهره تشخیص داده باشد اما ممکن است مدیر این دلیل را قبول نداشته باشد. چرا؟ چون برای مثال ممکن است در آن ماه قیمت طلا هم افزایش داشته و به همین خاطر مردم سپرده‌هایشان را از بانک بیرون آوردند تا روی طلا سرمایه‌گذاری کنند. در نتیجه علت عنوان‌شده توسط سیستم ممکن است صد درصد درست نباشد.

در سطح اول سیستم براساس داده‌ها، با قاطعیت به شما می‌گفت که فلان اتفاق افتاده اما زمانی که بحث چرایی پیش می‌آید، تعداد زیادی پارامتر وجود دارد که باید لحاظ شوند. ممکن است در این میان برخی پارامترها را هم در داده‌ها نداشته باشیم. برای مثال نرخ کاهش و افزایش قیمت طلا در داده‌های بانکی وجود ندارد و شاید دلیلی که سیستم به خاطر روی‌گردانی مشتریان ارائه داده درست نباشد و واقعا نوسانات قیمت طلا باعث بروز این اتفاق شده باشد.

در این صورت باید چکار کرد؟ به گفته عشقی باید دامنه داده‌ها را افزایش داد. اگر تا به حال برای تحلیل‌ها از داده‌های داخلی استفاده می‌شد، برای اینکه به تحلیل درست‌تری برسیم باید به داده‌های خارجی نیز وصل شد. عشقی دراین باره می‌گوید: «این اتصال به داده‌های خارجی هم قسمت تحلیل را سخت‌تر می‌کند و هم هزینه انجام پروژه را بالاتر می‌برد. همه اینها در نهایت به چالش‌های در انجام پروژه تبدیل خواهد شد. این چالش، عدم قطعیت است چون هیچ‌وقت نمی‌توان با اطمینان گفت که همه پارامترها لحاظ شده‌اند. در حالت توصیفی ما می‌توانیم با اطمینان بگوییم که همه داده‌ها را وارد کرده‌ایم اما وقتی می‌خواهیم به چرایی و علت وقوع بپردازیم، نمی‌توان با اطمینان اظهار کرد که دقیقا دلیل اتفاق را کشف کرده‌ایم. در اینجا ممکن است پذیرش نتیجه خروجی توسط مشتری به سختی انجام شود و بخواهد بخش بیشتری از دیتا را دخیل کند.»


سومین سطح؛ سطح پیشگویانه


در سومین سطح تحلیل داده، ما به دنبال پیشگویی هستیم؛ یعنی پیش‌بینی شود که چه اتفاقی خواهد افتاد. در این سطح تحلیل‌ها پیچیده‌تر و پیشرفته‌تر هستند. در این مرحله علاوه بر روش‌های مرسوم تحلیل داده، مانند روش‌های آماری و هوش تجاری، روش‌های یادگیری ماشین و هوش مصنوعی هم وارد بازی خواهد شد و سیستم از هوش مصنوعی برای انجام برخی پیشگویی‌ها استفاده می‌کند. پیشگویی‌ها اغلب براساس داده‌های تاریخی گذشته و براساس پارامترهایی است که از بیرون وارد می‌شوند. بنابراین اول باید دید چه اتفاقی رخ داده و مهمتر از آن باید دید که چرا این اتفاق افتاده است. به عقیده عشقی این تشخیص چرایی به ما کمک می‌کند تا پارامترهای درست‌تری را انتخاب و در مدل پیش‎بینیمان استفاده کنیم. درواقع هرچه پارامترهایی که انتخاب می‌کنیم درست‌تر و معنی‌دارتر باشد، ارتباط بین متغیر مستقل و متغیر هدفمان را بهتر نشان می‌دهد و درنتیجه مدل ما دقیق‌تر خواهد شد.

به گفته مدیر واحد کسب‌وکار هوداد کاسپین، در این سطح از تحلیل داده، مدل‌های مختلف یادگیری ماشین استفاده می‌شود تا آن نتیجه‌ دوره‌های بعد را بتوان پیش‌بینی کرد. هر سازمانی که بخواهد برای آینده برنامه‌ریزی و استراتژی داشته باشد و بخواهد طی یکی دو سال بعد برای مثال در فلان نقطه قرار بگیرد، باید تخمینی از وضعیت آینده خودش داشته باشد. مدیران همیشه وقتی که برنامه‌های کسب‌وکاری‌شان را می‌ریزند، یک پیش‌بینی از آینده‌شان دارند. حالا اگر به این پیش‌بینی ابزارهایی مانند هوش مصنوعی و یادگیری ماشین را هم اضافه کنیم، پیش‌بینی‌ها دقیق‌تر از آب درخواهد آمد و سازمان‌ها می‌توانند اقدامات متناسب‌تر و دقیق‌تری برای حل مشکل یا ارتقای خودشان انجام دهند.

در سطح سوم هم به داده‌های بیشتری نیاز خواهد بود و علاوه بر عدم قطعیتی که در سطح دوم، یعنی تشخیص، وجود داشت، مدل‌های یادگیری ماشین هم خودشان یک عدم قطعیتی به همراه خواهند داشت در نتیجه خروجی کار باز هم با عدم قطعیت بیشتری همراه خواهد بود.


چهارمین سطح؛ سطح تجویزی


چهارمین و آخرین سطح از انواع تحلیل داده، سطح تجویزی است؛ یعنی سیستم علاوه بر اینکه پیش‌بینی می‌کند، به شما می‌گوید که باید چکار کنید. در این سطح، هوش مصنوعی به شما می‌گوید که وضعیت از این قرار است، دلیلش هم این است و پیش‌بینی می‌کند که ماه بعد چنین اتفاقی می‌افتد و برای اینکه این اتفاق نیفتد باید این کار انجام شود.

عشقی با ارائه مثالی، سطح تجویزی را بیشتر توضیح داد: «برای مثال سیستم به شما می‌گوید که در ماه بعد قیمت دلار و طلا بالا می‌رود و در نتیجه مردم سپرده‌هایشان را بیرون می‌آورند. احتمال اینکه سپرده‌ها کم شود زیاد است. سپس با توجه به تحلیل انجام‌شده، سیستم به شما می‌گوید وقتی که تقاضا برای بیرون آوردن سپرده از بانک زیاد می‌شود، شما می‌توانید نرخ بهره خودتان را بالا ببرید. به این ترتیب شما مانع از این می‌شوید که مشتریان با وجود نوسانات بازار، از سیستم شما خارج شوند.»

سیستم تجویزی دو سطح دارد. در یک سطحش، خود سیستم وارد عمل می‌شود و به صورت اتوماتیک بهترین تصمیم را اجرا می‌کند. در سطح دیگر، انواع تصمیم‌ها را در اختیار شما قرار می‌دهد و کاربر انسان (مدیر) می‌تواند انتخاب کند که کدام کار را انجام دهد. به گفته عشقی این سطح، پیشرفته‌ترین و پیچیده‌ترین سطحی است که در سیستم‌های تحلیل داده وجود دارد.

اما آیا با وجود اینهمه عدم قطعیت، تقاضایی برای استفاده از این سطح از تحلیل داده وجود دارد؟ اصلا چرا سازمان‌ها باید بخواهند که از چنین مدل‌هایی در سازمانشان استفاده کنند؟


چالشی به نام عدم قطعیت


براساس گفته‌های عشقی برای چنین پروژه‌ها و سیستم‌هایی هم در کشور تقاضا وجود دارد اما در حال حاضر این سیستم‌های پیشگویانه به آن مرحله از بلوغ نرسیده‌اند که بشود از نتایج آنها به طور کامل استفاده کرد زیرا ممکن است تبعات مالی و اعتباری برای بانک‌ها و سازمان‌ها داشته باشد.

برای مثال سیستم کشف تقلب، یکی از سیستم‌های موردنیاز همه بانک‌ها است. این سیستم باید وقتی که یک مشتری تراکنشی را انجام می‌دهد، به طور اتوماتیک تشخیص دهد که آیا این تراکنش متعلق به خود شخص بوده یا تقلبی اتفاق افتاده است. اگر سیستم کاملا دقیق پیشگویی کند، می‌تواند با دقت بسیار بالایی بگوید که آیا تراکنش متعلق به خود فرد است یا نه اما چون سیستم نمی‌تواند با دقت بسیار بالا عمل کند و عدم قطعیت هم در سطح تشخیص و هم در سطح پیشگویی وجود دارد، ممکن است تعداد موارد اشتباهی که تشخیص می‌دهد بالا باشد.

همه اینها هزینه‌های زیادی برای بانک ایجاد خواهد کرد به همین دلیل هم در استفاده از سیستم‌های پیشگویانه، احتیاط بیشتری به خرج داده می‌شود. هرچند که عشقی این احتیاط بیشتر را فقط مختص ایران نمی‌داند بلکه در کل دنیا روال به این شکل است. او معتقد است که چکش‌کاری زیادی باید روی این سیستم‌ها انجام شود. باید براساس داده‌های گذشته و داده‌های بیرونی به این سیستم‌ها آموزش‌ داده شود تا درنهایت به خروجی قابل قبول و قابل اطمینانی برسد.

نوع نگرشی که نسبت به پروژه‌های داده محور، پروژه‌هایی که از جنس تحلیل داده، تشخیص، پیشگویانه یا تجویزی هستند، باید تغییر کند. عشقی امیدوار است که شاید طی چند سال آینده این اتفاق بیفتد اما در حال حاضر این شکاف وجود دارد که نوع نگرشی که نسبت به پروژه‌های تحلیل داده وجود دارد همان نگرشی است که نسبت به پروژه‌های توصیفی وجود دارد. به همین دلیل انتظارات از سیستم‌های تحلیل داده این است که هم‌زمان با شروع پروژه، زمان انتهایی دقیقی هم برایش مشخص شود و همچنین انتظار دارند که با قطعیت کامل به خروجی نهایی برسند.

اما زمانی که نمی‌شود قول این قطعیت را داد، سازمان‌ها کمی عقب‌نشینی می‌کنند. در سطح‌های پیشرفته‌تر تحلیل داده، خروجی پروژه‌ها مشخص نیست که آیا حتما به نتیجه می‌رسند یا نه. همچنین ممکن است که زمان انجامش هم خیلی طولانی‌تر شود و همه اینها پروژه را به یک منبع هزینه بزرگ برای سازمان تبدیل می‌کند. بنابراین روی درخواست این سیستم‌ها کمی احتیاط بیشتری وجود دارد.


پیشنهادهایی برای دریافت نتیجه بهتر از تحلیل‌ داده‌ها


مدیر واحد کسب‌وکاری هوداد استفاده از سیستم‌های تحلیل داده را به فرایند یادگیری شنا توصیف می‌کند و درباره‌اش می‌گوید: «پروژه‌های تحلیل داده به این شکل نیست که منتظر باشیم همکار یا رقیب ما از آن استفاده کند و به یک قطعیتی برسد و وقتی که مراحل آزمایشی‌اش را طی کرد سپس ما از آن استفاده کنیم. شاید تا حدی بشود این کار را کرد اما برای اینکه به دقت موردنظر رسید، باید روی داده‌ها و پارامترهای تاثیرگذار در کسب‌وکار هر سازمان به صورت جداگانه کار انجام داد تا به نتیجه مطلوب رسید. تحلیل داده مانند شنا کردن است. اگر می‌خواهید تحلیل داده برای شما و در سازمان شما خروجی داشته باشد، باید خودتان را به آب بزنید. در آب باید دست و پا بزنید و خسته شوید و چند بار به حالت خفگی برسید تا درنهایت شنا کردن را یاد بگیرید. درست است که اینکار برای سازمان‌ها هزینه‌بر است اما مجبورند خودشان را به آب بزنند و تحلیل داده را شروع کنند. برای اینکه هزینه زیادی هم برای سازمان‌ها ایجاد نشود، بهتر است کارها را در مقیاس کوچک و قدم به قدم شروع کنند. متاسفانه نگرش همه یا هیچ وجود دارد و نگرش قدم به قدم وجود ندارد.»

مثال ساده‌تر برای این بخش این است که اگر شما می‌خواهید سیستم پیش‌بینی را در بانک خودتان پیاده‌سازی کنید همه کسب‌وکار را درگیر نکنید. یک هدف بسیار کوچک را مشخص کنید و برای مثال بگویید که می‌خواهید در حوزه تسهیلات پیش‌بینی داشته باشید. پس ابتدا کار را با تسهیلات شروع کنید.

پیشنهاد دیگری که عشقی برای رسیدن به نتیجه بهتر از تحلیل داده‌ها مطرح می‌کند، تعریف پروژه‌ها است. کسانی که در سازمان‌ها و بانک‌ها تعریف پروژه می‌کنند، باید با بحث‌های تحلیل داده آشنایی داشته باشند و یک بخش تحلیل داده همراه با کارشناسان خبره تحلیل داده باید در سازمان وجود داشته باشد تا بتوانند نیازمندی‌های بخش کسب‌وکار در پروژه‌های هوش مصنوعی و پیشگویانه را به یک زبان مشترک برای توسعه‌دهنده و انجام دهنده کار تبدیل کند. برای اینکار عشقی پیشنهاد می‌دهد که بهتر است کارها با اسکوپ‌های کوچکتر تعریف شود و یکدفعه همه چیز را با هم نخواهید.

پیشنهاد بعدی ایجاد تغییرات در متدولوژی‌هایی است که برای قیمت‌گذاری و زمان‌بندی پروژه‌ها در نظر گرفته می‌شود. باید متناسب با روش‌های تحلیل داده، از روش‌های جدیدتری برای تعریف و تعیین میزان قیمت‌ها و زمان‌ها استفاده شود و به نوعی انعطاف‌پذیری در این حوزه ایجاد شود.


برنامه‌های ۱۴۰۰ شرکت کاسپین


عشقی در پایان صحبت‌هایش و قبل از اشاره به برنامه‌های سال آینده شرکت، به پروژه‌های موفقی که سال گذشته در حوزه‌های غیربانکی و پرداخت الکترونیکی داشتند اشاره کرد و گفت: «از این چهار سطح در واحد هوداد، در سطوح توصیفی، تشخیصی و پیشگویانه پروژه‌های متعدد بانکی و غیربانکی انجام شده است. در سال آینده هدف ما این است که علاوه بر توسعه بازار به حوزه‌های غیربانکی، در حوزه پروژه‌های هوش مصنوعی و تحلیلی نیز بتوانیم با استاندارد و بست‌پرکتیس‌هایی کارهایمان را شروع کنیم و بتوانیم نتایج قابل قبولی را به کسب‌وکارها ارائه دهیم.»

به گفته مدیر واحد محصولات هوشمند کاسپین، این شرکت آمده به سازمان‌ها کمک کند تا مشکلاتشان را با استفاده از روش‌های تحلیل داده‌ای حل کنند. بعضی از این مشکلات را ممکن است خود سازمان‌ها متوجهشان شده باشند و همچنین مشکلاتی که ممکن است از آن اطلاعی نداشته باشند هم کاسپین برایشان استخراج می‌کند. او شعار سال ۱۴۰۰ شرکت را حل مسائل کسب‌وکاری سازمان‌ها با تکیه بر دانش و فناوری جدید و تحلیل داده عنوان می‌کند.

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.