پایگاه خبری راه پرداخت دارای مجوز به شماره ۷۴۵۷۲ از وزارت فرهنگ و ارشاد اسلامی و بخشی از «شبکه عصر تراکنش» است. راه پرداخت فعالیت خود را از دوم اردیبهشتماه ۱۳۹۰ شروع کرده و اکنون پرمخاطبترین رسانه ایران در زمینه فناوریهای مالی، بانکداری و پرداخت و استارتآپهای فینتک است.
میزگرد کاربردها و چالشهای کلان داده در صنعت بانکی / تولید ثروت از دادهها
« سرورهای گرانقیمت یکی پس از دیگری به صف میشوند، اما تقاضای فناوری اطلاعات بانک برای فضای ذخیرهسازی و توان پردازش بیشتر، تمامی ندارد.»
این داستان کوتاه را اکنون تمام بانکها از حفظ میدانند. تولید دادهها در نتیجه تراکنشهای خرد و کلان مشتریان بانک اکنون با چنان سرعتی در حال رشد است که سازمان فناوری اطلاعات را دچار یک چالش جدی کرده است. شوق و ذوق الکترونیکی شدن اکنون با یک چالش جدی مواجه شده و داستان کوتاه ما سؤالات مهمی را پیش پای نویسنده و خوانندهاش گذاشته است. کوه یخی که قله آن به آهستگی از زیر آب بیرون میآید، همه را به تعجب واداشته است که چگونه فضای ذخیرهسازی لازم را تهیه کنم، چگونه این حجم عظیم داده را پردازش کنم؟ این همه داده را برای چه میخواهم؟ اگر خواستم فرآیندی یا موردی را پیگیری کنم از میان انبوه دادهها چگونه و با چه روشی به آن برسم؟
از این رو ورود به عرصه کلان داده(Big Data) اکنون یک واقعیت محض است و آشنایی با رمز و راز آن و نحوه مدیریت کردنش ضرورت محض. برای شرح داستان کوه عظیم دادهها که نوک قله آن به آرامی در حال بیرون آمدن است، در مرکز فابا میزبان جمعی از اندیشهوران این حوزه بودیم. دکتر سینا سوهانگیر فارغالتحصیل دانشگاه استنفورد با پیشینه فعالیت با دادههای بزرگ در توئیتر، دکتر صادق علیاکبری مدرس دانشگاه صنعتی شریف و عضو هیأت مدیره شرکت مشاوره اعوان، مهدی نصیری مدرس دانشگاه علموصنعت و دکتر فرزاد خندان مدیرعامل شرکت دادهپردازی سیمیاگران دعوت ما را پاسخ گفتند. مهندس عبدالرضا شریفیحسینی معاون بانکداری الکترونیکی بانک آینده هم در این میزگرد حضور داشت و ضمن تشریح ساز و کار فعالیت بخش فناوری اطلاعات در بانکها، نکات کلیدی و ارزشمندی در حوزه کاربردی کلان داده بیان کرد. متن این میزگرد که به صورت گفت و گوی چندجانبه درآمد، پیش روی شماست.
بیات: همانطور که مستحضر هستید موضوع کلان داده (Big data) در حوزه کسبوکارها و به ویژه شبکه بانکی کشور موضوع چندان شناخته شدهای نیست. لذا ضرورت دارد روی مفهوم و کاربردهای آن در کسبوکارها صحبت کنیم تا مخاطبان ما با آن بیشتر آشنا شوند و در کار خود از آن بهره ببرند. لذا از دوستان خواهش میکنیم طرح بحث کنند. در وسط بحث هم به ضرورت سؤالاتی مطرح خواهد شد.
.
مفهومشناسی
خندان: خوب است در ا بتدا بررسی کنیم وقتی صحبت از Big data میکنیم، منظورمان چه چیزی است و این روند از چه زمانی در دنیا مطرح شده است و اساسا وقتی هوش تجاری وجود داشت چه ضرورتی داشت که وارد حوزه کلان داده شویم؟
سوهانگیر: بحث Big data در ابتدا با تبلیغات شروع شده است. در هوش تجاری ما یک سری داده داریم که هدف از کنکاش در آن مشخص است و بعد از تحلیل به یک سری نتایجی میرسیم اما در موضوع تبلیغات، هوش تجاری چندان جایگاه ندارد. برای یک تبلیغ کننده چندان مهم نیست که بینندگان چه کسانی هستند و روی آنها تحقیق کند. هدف این است که تبلیغات با کارایی بیشتری به بیننده نشان داده شود و برایشان جذابتر باشد.
خندان: پس میتوان گفت مساله این نیست که کلان داده یک امر تبلیغاتی است بلکه اولین کاربرد آن صنعت تبلیغات بود.
سوهانگیر: بله، همینطور است و دلیلش هم این بود که در صنعت تبلیغات هر وقت کاربری در مقابل یک مرورگری قرار میگیرد، تعاملی انجام میشود و دادههایی تولید میشوند. کار کلان داده این است که آن دادهها را بگیرد و آنالیز کند.
حجم این دادهها در مقایسه با مثلا تعاملات بانکی خیلی خیلی بیشتر است. بنابراین شرکتهای تبلیغات دیجیتال اولین کاربران آن بودند. البته گوگل علاوه بر استفاده تبلیغاتی، آنالیز وب را هم با آن انجام داد و این که چگونه جستجو کند، اما موقعی این کار باب شد که تبلیغات آنلاین خیلی مرسوم شده بود. چون حجم تعامل کاربران با وب و موبایلشان آنقدر زیاد بود که برای انجام هر کار معناداری، یک جور Big data اتفاق میافتد، لذا انجام محاسبات با یک کامپیوتر شدنی نیست و مجبور هستید آن را روی گروهی از کامپیوترها پخش کنید و محاسبات را انجام دهید.
خندان: بالاخره فرق کلان داده(Big Data) با دادههای خرد(Small Data) چیست؟
سوهانگیر: فرق آنها در این است که هرچیزی را نتوان روی یک کامپیوتر انجام داد و تعدادی کامپیوتر را باید در خدمت گرفت که آن محاسبات را انجام دهد، کار Big data میشود. البته در بحث تبلیغات هیچ کار دیگری نمیشد انجام داد و واقعا مجبور به انجام این کار بودند، اما بعد از شروع کلان داده و ا یجاد زیرساخت، یک سری کارهایی که به طور سنتی در جای دیگر انجام میشد با این روش پیش رفت. مثلا یک زمانی آمریکن اکسپرس تعداد زیادی متخصص داده استخدام کرده بود که فقط دادههای بانک را آنالیز میکردند و نمیدانستند دنبال چه چیزی هستند. با زیرساخت کلان داده، میتوان محاسبات بیشتر و دقیقتر و بزرگتری بر روی دادهها انجام داد و میتوان آدمها را با هم همبسته کرد که چه کسانی با هم رفتار مشابه دارند. این کار شاید قبل از ایجاد آن زیرساخت نه در فکر کسی بود و نه لازم بود، ولی با این زیرساخت، قابل انجام شد.
علیاکبری: چند نکته را در این زمینه که کلان داده چیست، از کجا آمده و با مدلهای قبلی مثل هوش تجاری چه فرقی دارد، عرض میکنم:
در بحث کلان داده، مدل ساختمان دادههایی که با آنها کار میکنیم، مقداری متفاوت شده است. دادههای قبلی معمولا ساختارمند و از پیش قابل توصیف بودند مثلا میگوییم داده یک کاربر در بانک چنین ساختاری دارد و با همان دادهها کار میشد و تغییر در ساختار دادهها خیلی کم بود.
در کلان داده، تغییرات ساختاری هم خیلی زیاد است. یعنی هم دادهها زیادند، هم زیاد تغییر میکنند، هم ساختمان آنها تغییر میکند. امروز برای کاربر یک گونه اطلاعات را نگه می داریم، روز دیگر اطلاعات دیگر و ساختمان دادهای که این دادهها استفاده میشوند نیز به صورت پویا تغییر میکند. این مسأله باعث میشود که مدلهای سنتی مورد استفاده مخصوصا دیتابیسهای رابطهای، کمکم ناکارآمد شوند. یک دوره خیلی طولانی کل بازار در دست دیتابیسهای رابطهای مثل اوراکل، SQL SERVER و مانند آنها بود ولی این دیتابیسها از پس کاربردهای جدید بر نمیآیند.
یک نکته دیگر، در کاربردهای جدید، خیلی اوقات نیازهایی را که در دیتابیسهای قدیم داشتیم دیگر نداریم. مثلا بحث تراکنش، به روز شدن لحظهای در همه پایگاهها یا سازگاری لحظهای، اینها مربوط به پایگاه دادههای رابطهای است و در کاربردهای جدید خیلی اوقات لازم نیستند. به همین خاطر نیازمندیها را سادهتر میکنند تا با کارایی بالاتری کار کنند. ضمن اینکه کاربردهای سنتی دیتابیسها، سرجای خود باقی است. احتمالا تا چند سال آینده بخش زیادی از دادهها روی دیتابیسهای رابطهای باقی میمانند و هوش تجاری همچنان مهم باقی میماند. در واقع هوش تجاری و کلان داده هرکدام یک موضوع مجزا هستند که در جاهایی به هم تنه میزنند. اگر حجم دادهها زیاد شود و تغییرات در آنها زیاد باشد هوش تجاری باید از یک زیرساخت کلانداده استفاده کند. لذا کاربردهای سنتی سرجای خود است و برای برخی نیازهای جدید، کلان داده به وجود آمده است و اینها همدیگر را نفی نمیکنند.
.
پلتفرمها
خندان: تکنولوژیهایی (پلت فرم) که در این زمینه به وجود آمدهاند کداماند و آینده آن به چه سمتی خواهد رفت؟
سوهانگیر: کلان داده عملا باگوگل شروع شد. گوگل در سال ۲۰۰۴ مقالهای منتشر کرد و بدون دادن اطلاعات بیشتر از سورس کد، اعلام کرد پلت فرمی به نام MapReduce ایجاد کردیم و محاسباتمان را اینگونه انجام میدهیم. در آن موقع تعدادی از استادان دانشگاهها و متخصصان با آن مخالفت کردند و این شیوه را ناکارآمد دانستند اما گروهی دیگر تلاش کردند معادل متنباز آن را ایجاد کنند که به Hadoop منجر شد که الان شناخته شده است.
این کار در حدود سالهای ۲۰۰۷ خیلی باب شد و هنوز هم هادوپ در مؤسسات و حتی بانکها مورد استفاده قرار میگیرد. دو شرکت نیز شکل گرفت که این پلت فرم متن باز را به عنوان خدمات به کسبوکارهایی میفروشند که دقت و صحت دادهها برایشان مهم است مثل بانکها که میخواهند مطمئن باشند آیا این پلتفرم آمادگی محاسبات و عملیات مدنظر آنها را دارد یا نه؟ شرکتی مثل cloudera این پلت فرم را آماده میکند و نیازهای آنها را تضمین میکند.
در ادامه ماجرا، گوگل از تکنولوژیهای جدیدتری استفاده کرد. یکی از مشکلات هادوپ و MapReduce این است که ذاتا از روشهایی استفاده میکنند که کند است. هربار که بخواهید روی یک pc، محاسباتی انجام دهید، دادهها روی هارد نوشته میشود، هرکدام از کامپیوترها از روی هارد دیسک خودشان خوانده و محاسباتی انجام میدهند و دوباره روی هارد دیسک خودشان مینویسند. این دادهها بین هارد دیسکها تقسیم و جابهجا میشود و فرایند از نو انجام میگیرد. بنابراین هر مرحله از این عملیات یک مرحله خواندن و نوشتن روی هارد دارد. این باعث میشد که فرایند خیلی کند باشد که با فلسفه Big data برای انجام محاسبات سریع تعارض دارد. به همین خاطر گوگل پلتفرم جدیدی به نام dremel تولید کرد. به طور موازی در دانشگاه برکلی پروژهای به نام spark راه افتاد که اینها نسلهای جدید کلان داده هستند ولی محدودیتهای قبلی را ندارند.
برای اسپارک هم شرکتی تاسیس شده که آمارهای ارائه شده نشان میدهد تا الان هم بیش از ۴۰ میلیون دلار سرمایه جذب کرده است و گفته میشود ۱۰ تا ۱۰۰ برابر از هادوپ سریعتر است ولی هنوز یک پروژه تحقیقاتی محسوب میَشود و برای مثال Bank of America یا آمریکن اکسپرس از آن استفاده نمیکنند با در مقیاس خیلی کوچک بهره میبرند. حتی در توئیتر هم که بودم با وجود شناخت از این تکنولوژی و زبان مشترک برنامهنویسی اسکالا(scala) از آن استفاده نمیکردند.
در حال حاضر، نسخه ۳/۱ اسپارک درآمده است و شرکتهایی که با آن کار میکنند معتقدند به یک تکنولوژی بالغ تبدیل شده است. نسل بعدی چیزی شبیه اسپارک است و به نظر میرسد اسپارک برنده بازی کلان داده خواهد بود. بیشترین فعالیتها هم اکنون روی اسپارک و اسکالا است و بیشترین حقوق مهندسان هم مربوط به کسانی است که با اسپارک کار میکنند.
بنابراین در تکنولوژی کلان داده احتمالا اسپارک برنده بازی خواهد بود و به زودی جای هادوپ را خواهد گرفت. البته هادوپ ۴ بخش دارد که سه قسمت از آن خواهد ماند و در نهایت با تکنولوژی جدید جایگزین خواهد شد و اسپارک فقط یک بخش را جابهجا میکند که این نکته خیلی مثبتی است چون پذیرش آن را آسانتر میکند.
خندان: اگر یک مرور اجمالی بر بخش اول صحبتها داشته باشیم، کلان داده با داده خرد فرق دارد به این خاطر که حجم بیشتری داده داریم و سرعت بیشتری برای پردازش آنها نیاز داریم و به سمت پردازش آنلاین در حرکت هستیم. ضمن این که سرعت تولید داده خیلی بالاست.
امروزه در زمینه کلان داده پلت فرمهایی داریم که نسبتا بالغ هستند. دو پلت فرم هادوپ و اسپارک وجود دارند که اسپارک جدیدتر است و احتمالا در آینده اقبال به آن هم بیشتر خواهد شد و به نظر میرسد در دنیا امروزه با محصول روبهرو هستیم و استفاده واقعی از این فناوری صورت میگیرد. اینها پلت فرم هایی هستند که با وجود سابقه کم به سرعت به مرحله بهرهبرداری رسیدهاند و دیگر تنها یک چیز آزمایشی نیستند.
نصیری: همانطور که اشاره شد وقتی دادههای ما از لحاظ حجم، تنوع و ابعاد دادهها زیاد میَشود، با مبحث کلان داده روبهرو هستیم. گرچه mapreduce در سال ۲۰۰۴ معرفی شد اما پیشینه آن شاید سال ۹۱ بوده است که اینترنت معرفی شد و تولید دادهها سرعت گرفت بعد با دیتابیسهای ارتباطی روبهرو هستیم و بعد از آن با NOSQL مواجه هستیم و بعدتر اینترنت اشیا آمده که اینها همه در روند ایجاد کلان داده خیلی مؤثر بودند. صحبت از اسپارک شد، این پلت فرم شاید به این دلیل آینده بهتری داشته باشد که تحلیل دادهها برای سازمانها مهمتر است مثل داده کاوی. این مساله روی اسپارک خیلی بهتر میتواند انجام شود تا معماری هادوپ.
معماریهای دیگری هم ارائه شده است مثلا فیسبوک یک معماری ارائه داده است یا معماریهایی که برای دادههای نوع گراف ارائه میشود که اینها در حال توسعه است و گارتنر هم اعلام کرده است در سال ۲۰۱۶ سازمانهایی که از کلان داده استفاده کنند، میتوانند تا ۲۰ درصد از نظر درآمدی جلوتر از دیگران باشند. این مساله به خصوص مباحث تحلیلی آنها جز مباحث داغ است و نیازهایی که وجود دارد اطلاعاتی راجع به مشتریان به دست بیاوریم، با توجه به تنوع و حجم دادهها این ساختارها بهتر از ساختارهای سنتی میتواند به ما کمک کند و خیلی از جاها میتوانند با هوش تجاری مکمل هم باشند و هوش تجاری بر روی ساختار آنها مستقر شود.
خندان: ما تا الان در مورد چند وجه کلان داده صحبت کردیم. یکی حجم بود، یکی سرعت تولید دادهها و دیگری تنوع ساختاری که دادههای ساختار نیافته و ساختار یافته در کنار هم هستند. نکته دیگر حذف محدودیتهایی است که در روشهای قدیمی وجود دارد و این یک مسالهای را به نام validity پیش میآورد. وقتی در هنگام ورود دادهها صحت سنجی صورت نگیرد، مجبوریم در هنگام آنالیز به آن توجه کنیم. لذا ۴ مفهوم volume، variety ،velocity و validity را میتوان پایههای اصلی مفهوم کلان داده برشمرد.
علیاکبری: چیزی هم هست که همه آنها را کلا در برمیگیرد و آن ارزش دادههاست(data value) یعنی سعی میشود بدون توجه به اینکه به چه درد میخورد، دادهها را نگهداری و تحلیل کنند.
خندان: از مفهوم و پلتفرمهای کلان داده صحبت کردیم. اکنون سؤال این است که این فناوری چه کاربردهایی میتواند داشته باشد؟
شریفیحسینی: کلان داده میتواند کاربردهای خیلی جدی داشته باشد، البته هنوز استفاده از پلتفرم در کشور رایج نیست و تا آنجا که من میدانم شاید تنها یکی دو بانک به سمت آن رفتهاند، آن هم در سطح تحقیقات و هیچ برنامه کاربردی تاکنون نداشته است. جدیترین کاربرد در بانک میتواند cross- sales باشد. ما با کلان داده میتوانیم فروش منطقهای ایجاد کنیم و با تحلیل دادهای که انجام میشود میتوان به مشتری چیزی را پیشنهاد کرد که شاید اصلا به فکر فروش آن نبوده است. به عنوان نمونه یک موردی را مثال میزنم که نه با کلان داده ولی با مدلهای دیگری سعی کرده است این کار را بکند.
الان مبین نت کار جالبی میکند؛ اگر مشتری در تهران باشد، یک محصول با یک قیمت پیشنهاد میشود و اگر در شیراز یا یزد باشد هرکدام محصول دیگری با قیمتهای دیگر پیشنهاد میکند و کاملا فروش خود را منطقهای کرده است. این شرکت برای انجام این کار CDR مشتریها را در یک دیتابیس خیلی بزرگ میریزد و بعد از روی میانگین حضور آنها در یک منطقه، وطن آنها را تشخیص میدهد. اگر کسی که وطنش شیراز است از هرکجا وصل شود، به آن CDR تحلیلی پشت سیستم کار دارد. عین همین کار را میتوان در بانک انجام داد و محصولات سپردهای یا تسهیلاتی را براساس رفتار قبلی مشتری درست کرد که مناسب حال او باشد. مثلا یک مشتری هست که تسهیلات یک قسطی را راحتتر پرداخت میکند. میتوان از روی رفتار او در بانک، محصول مناسب به او پیشنهاد کرد.
موضوع دیگر که بانکها میتوانند از این فناوری استفاده کنند و بانک مرکزی هم به آن فکر میکند، کشف تقلب است. بانک مرکزی بعد از عید امسال اعلام کرد سقف تراکنش روی پایانههای فروش ۵۰ میلیون تومان باشد و در دنباله بخشنامه مقرر کرده است بانکها ظرف سهماه خودشان را تجهیز کنند که اگر مبلغ کل خریدها روی یک حساب بیش از ۵۰ میلیون تومان میشود، یک تایید از مشتری باید بگیرند.
در حال حاضر مشتری تراکنشهای کلان خود را به چند نوبت تقسیم کرده است ولی با اجرای بند دوم بخشنامه که بانکها ظرف سه ماه باید خودشان را تجهیز کنند، روی این مساله باید ابزار کشف تقلب وجود داشته باشد و بانکها ناچارند چنین کاری بکنند. اینکه این کارت قبلا در کجا خرید میکرده است؟ وطن کارت کجاست؟ چقدر ریسک دارد و موارد مشابه، به ناچار باید روی پلت فرم کلان داده بیاید. به نظر من خیلی از تجربههای کشف تقلب در کشور ما به این خاطر پا نگرفت که ظرفیت پردازش وجود نداشت. چند بانک خیلی جدی به این موضوع ورود کردند، محصول خریدند و نصب کردند ولی به خاطر اینکه ظرفیت پردازش نداشتند، پروژه پیش نرفته است.
نصیری: وقتی بحث تقلب مطرح میشود، مشکلی که وجود دارد عدم وجود زیرساخت است و خیلی جاها دنبال این هستند که این کار به صورت آنی انجام شود. مثلا اگر کارت سرقت شد، بلافاصله این چک شود و اگر خیلی وضعیت حاد است با صاحب کارت تماس و تایید گرفته شود که این ایجاب میکند زیرساختهای کلان داده را به کار بگیریم.
موضوعی که در کشف تقلب خیلی مشکل ساز است و در محصولات داخلی که در حال حاضر داریم، وجود دارند، بحث تشخیص غلط(false positive) است. در موضوع پولشویی هم که چند سال پیش بانک مرکزی اعلام کرد باید ۱۱ قاعده پیادهسازی شود، علاوه بر مبهم بودن خود قواعد، در مرحله دوم با مشکل تشخیص غلط (false positive) روبهرو بودیم. آنچه بانک مرکزی اعلام کرده بود، بیشتر قاعده بود تا تحلیل و روی آن قواعد هم خیلی کار نشده بود که تشخیص غلط آنها را کم کند. به طور کلی در تحلیلهایی که ما دادههای نا متوازن داریم مثل تقلب که نسبت تقلب به کل تراکنشها خیلی کم است، مشکل تشخیص غلط به صورت جدی وجود دارد که باید برای آن فکری کرد.
شریفیحسینی: خیلی از بخشهای تقلب با ابزارهای فعلی قابل پیداکردن نیست و اجبارا باید به پلتفرمهای کلان داده رجوع کنیم. برای مثال چیزی که تحت عنوان ذینفع واحد در بانکها شناخته میشود، نیاز به جستجو در میان انبوهی از شرکتها دارد. اگر از ابهام بخشنامهها هم بگذریم، فرض قرار است به کسی که ذینفع است، وام ندهیم چه خودش باشد یا بستگان او یا شرکتهایی که داخل آن سهام دارد یا عضو هیأت مدیره است. پیدا کردن این ارتباطها وقتی تعداد پروندههای تسهیلاتی زیاد میشود، اصلا کاری نیست که بشود روی پلتفرمهای ساده انجام داد.
مثال دیگراینکه، یکی از انواع تقلب، تبانی کارمند و مشتری است که این کار معمولا شامل شبکه پیچیدهای از آدمها میَشود. مثلا فردی در تهران با افراد دیگری در زاهدان و خوزستان با هم تبانی میکنند. این کارها به راحتی یک قاعده ساده نیستند و حتی قاعدهای نیست که با چند پارامتر قابل چک کردن و کنترل باشد. در اینجا حتی نوع دادهها هم ساختارمند نیست و باید دنبال دادههای تسهیلات، اعتبارات، عملیات بانکی روزمره و … باشیم. یک جاهایی این تقلب پنهان میشود که پردازش آنها فقط در پلتفرمهای کلان داده میسر است.
.
ریزش مشتری
کاربرد بعدی که برای بانکها در شرایط رقابتی امروز مهم میشود، ریزش مشتری است. مشتری که دیگر مایل نیست با بانک کار کند، رفتاراو قابل ردیابی است و با پردازش اطلاعات او میتوان تشخیص داد که این مشتری مثلا سه ماه دیگر در صورت اقدام نکردن، بانک را رها خواهد کرد. ولی اگر کمپینی درست کنیم که با پردازش و شناخت رفتار او بتوانیم او را بشناسیم، میتوان با اقدام مناسب مانع رفتن او شد. ریزش هر مشتری ممکن است به یک علتی باشد و هرکدام به نوبه خود این علامت را به سازمان رساندهاند ولی ممکن است این علامت در میان انبوه اطلاعات گم شده باشد؛ یکی به خاطر درخواست تسهیلات، یکی به خاطر برخورد بد کارمند. یک مشتری ممکن است با تلفن اعلام کرده باشد، دیگری از طریق وب سایت بانک و … .
چون جاهایی که ممکن است مشتری ناراحت شود زیاد است، دادهها ساختار نیافته است. لذا لازم است کار زیادی انجام شود تا بتوان دلایل ریزش را فهمید و بعد برای مشتری کمپین درست کرد و او را به بانک برگرداند. یا ممکن است بخواهیم مشتریانی را که ظرف سالهای گذشته از بانک رفتهاند بشناسیم. این کار ممکن است نیاز به بررسی دادههای چندین سال داشته باشد که از عهده روشهای ساده برنمیآید.
نصیری: اگر بخواهیم یک مثال عینی بزنیم در اواخر سال ۹۱ که رقابت بر سر سود سپردهها در میان بانکها تشدید شد، مسأله ریزش مشتری خیلی جدی شد. برای بانکهایی که ریزش داشتند این مساله مهم بود که تشخیص بدهند چه مشتریانی در حال رفتن از بانک هستند یا در آینده به آرامی از بانک مهاجرت خواهند کرد. در یکی از بانکها که ما این مساله را بررسی میکردیم هیأت مدیره درخواست داشت به سرعت معلوم شود که چه مشتریانی در حال حاضر در حال بیرون رفتن از بانک هستند. عرض من این است که گاهی یک اتفاق خاص بازه بررسی را ممکن است خیلی کوتاه کند و فرصت ارزیابی یک هفته یا ۱۰ روز باشد.
با تنوع دادهها، رفتارهای مختلف و دلایلی متفاوتی روبهرو هستیم که ممکن است مشتری بانک را ترک کند. معمولا عدم رضایت هم به آرامی شکل میگیرد. در تجارت داریم که هزینه جذب مشتری شش برابر نگهداری مشتری است وقتی بتوان از خروج مشتری جلوگیری کرد، بنابراین چندین برابر به نفع بانک است. این کاری است که کلانداده میتواند کمک کندتا گروههای مختلف مشتریان را شناسایی کند تا بر حسب هر کدام پیشنهادهای مشخص و متناسب با آنها ارائه شود و از رفتن مشتری جلوگیری بشود.
.
شخصیسازی خدمات
خندان: این موضوع که پیشنهادهای شخصی(customized offers) به مشتری ارائه شود یک کاربرد خیلی جدی در مبحث کلانداده است. این مساله به نظر من یکی از انقلابهایی است که کلان داده با خود میآورد. لذا کلان داده یک تغییر پارادایم در تکنولوژی است که تغییر ماهوی در نحوه بهرهبرداری از اطلاعات ایجاد میکند و نمیتوان آن را با هوش تجاری مقایسه کرد.
در صنعت خودرو ما در چند مقطع با تغییر پاردایم روبهرو بودیم که یکی تولید انبوه توسط فورد، دیگری تولید خودروهای کممصرف در دهه ۱۹۷۰ و آخری شخصیسازی است که از سالهای ۱۹۹۰ به بعد پیش آمد که از آن به (mass customization) یاد میشود. با ظهور اینترنت و دسترسی مستقیم به تولید کننده، مشتری میتوانست خودرویی را سفارش بدهد که رنگ، تجهیزات فنی و بسیاری از بخشهای آن به انتخاب خودش باشد. این مساله خط تولید خودرو را مشخص میکند یعنی از روی اطلاعات مشتریان برنامهریزی تولید انجام میشود.
امروز با مبحث کلان داده این اتفاق در صنعت IT در حال رخ دادن هست؛ یعنی میتوان شرکتی مثل گوگل یا فیسبوک بود و براساس رفتار و نیازهای مشتری، مشتری به مشتری، پیشنهادهای متفاوتی ارائه کرد نه حتی منطقهای بلکه فرد به فرد و این چیزی است که امروزه باعث تغییر پارادایم در در حوزه کسبوکار فناوری اطلاعات شده است، هر چند که در زمینه فناوری ممکن است تغییر پارادایم نباشد.
همین الان برای بانکها میتوان بدون نیاز به تغییر قوانین و هیچ بار اضافی حقوقی، مکانیزم وامهای خرد را برای مشتریان راه انداخت به این ترتیب که مشتریان را براساس اطلاعات قبل و براساس مکانیزمهای کلان داده میتوان بخشبندی کرد، الگوهای رفتاری را مشخص کرد و مثلا مشتریان را میتوان به ۲۰۰ کلاس اعتباری تقسیم کرد که هرکدام از کلاسها یک رفتاری دارند و به ازای هرکدام یک وجه مشخصه (pattern signature) مشخص کرد مثلا معلمین، پزشکان، وکلا و طبقهبندیهای دیگری که میتوان انجام داد. بعد بر مبنای این تقسیمبندی به سهولت میتوان نیازهای خرد تسهیلاتی را بدون نیاز به فرایند طولانی ارائه درخواست و آوردن ضامن و … برطرف کرد.
اگر بتوان این طبقهبندی را انجام داد، فرآیند کلا عوض میشود. برای یک مشتری ممکن است نیاز به هیچگونه عملیاتی نباشد و به محض تمام شدن پول فرد، خود بانک پیشنهاد بدهد. قطعا پیشنهادی که این گونه داده میشود به چیزی که مشتری نیاز دارد خیلی نزدیکتر است و احتمال خریدن این پیشنهاد بسیار بالاتر خواهد بود و این میتواند یک چیز جدیدی را به صنعت بانکداری ما اضافه کند. ما در حال حاضر در مقایسه با بانکهای مطرح دنیا مثل HSBC خدمت خاصی به مشتریان نمیدهیم. کلان داده میتواند با تمام محدودیتهای بانکی ما، سرویس را برای بانکهای ایرانی به ارمغان بیاورد و نحوه تفکر و رویکرد به کسبوکار را عوض کند.
نصیری: این بحث خیلی جدی است که رفتار هر مشتری با مشتری دیگر متفاوت است. بحث شخصیسازی خدمات موضوع روز است که از سالهای گذشته در کنفرانس KDD به عنوان معتبرترین کنفرانس داده کاوی موضوع مسابقه بوده است. حتی رفتار فرد هم در مقاطع مختلف متفاوت است. لذا با آنالیز میتوان خدمات متفاوتی را پیشنهاد کرد. خروجی این مباحث را میتوان با هوش تجاری ترکیب کرد و مکمل هم، تحلیل انجام داد.
.
تغییر پارادایم
بیات: به تغییر پارادایم اشاره شد. مناسب است در این خصوص بیشتر صحبت کنیم، برای اینکه مخاطبان بانکی ما آمادگی فکری و عملی لازم را برای تغییر در خود فراهم کنند. چون تغییر پارادایم یک تغییر عمده است که میتواند چالشهایی را ایجاد کند.
سوهانگیر: تغییر پارادایم را از دو دید میتوان نگاه کرد: کاربران و مدیران.
برای کاربران نسل اول اینترنت، وبسایتها همه شبیه هم بود اما الان دیگر این طور نیست و امروزه کار به جایی رسیده است که گوگل آنچه را که به افراد ارائه میکند، فرد به فرد متفاوت است و این باعث میشود تجربه افراد متفاوت باشد. این کار یک حسن و خوبی دارد و یک بدی. بدی این است که گوگل است که تعیین میکند که چه کسی چه چیزی ببیند. این شخصیسازی باعث میشود که هم آدمها درکشان از اینترنت و محیط متفاوت باشد هم درک شرکتها از آدمها، تک تک تغییر کند. این مساله به عنوان یک نکته مثبت میتواند باعث شود رفتار بانک با اشخاص دچار تغییر شود. بنابراین افراد از لحاظ اجتماعی هم مسئولیتپذیرتر میَشوند وسعی میکنند رفتارشان را کنترل کنند، به این خاطر که رفتار بد فرد منعکس میشود و نتیجهاش را خواهد دید، در صورتی که در گذشته شخص برای عبور از چراغ قرمز واهمه ای نداشت.
این تغییر را در محیط آنلاین هم داریم. با افراد به نسبت رفتارشان، به نسبت به اینکه فرد در چه فضایی است و چه کار میکند، میتوان برخورد متفاوت کرد. از این جهت واقعا تغییر پارادایم است و دیگر آدمها را یک جور نگاه نمیکنیم. در اقتصاد مبحثی به نام تبعیض قیمت وجود دارد . گرچه به لحاظ فرهنگی ممکن است این مساله مورد قبول نباشد ولی از لحاظ اقتصادی یک بهینه یابی است و از هرکس باید متناسب با مقداری که میتواند خرج کند، پول گرفت. حتی در این سطح کلان هم، کلان داده میتواند به کارایی و بهرهوری یک اقتصاد کمک کند.
علیاکبری: این تغییر پاردایم یک چیز قطعی است. کاربران سیستمهای جدید، جور دیگری از سیستمها استفاده میکنند و آنچه میبینند متفاوت از گذشته است. ولی از پشت صحنهها هم نباید غافل شویم. در وضعیت جدید مدیران پشت سیستمها هم سیستمهای خود را به گونه دیگری مدیریت میکنند. یعنی این تغییر را در آنجا هم میتوان دید. مباحث BIو DSS در آنجا پررنگ میشود و تکنولوژی هوش تجاری به آنها خیلی خیلی کمک میکند و مدیران هم گزارشهای دیگری میخواهند، به گونه دیگری تحلیل میکنند و چون دادهها زیاد است روشهای جدیدی لازم دارند و برای این موضوع ممکن است هزینههای زیادی هم انجام دهند. گفته میشود در انتخابات ریاست جمهوری قبلی آمریکا باراک اوباما یک تیم کلان داده داشته است که توئیتر را آنالیز کردند فقط برای رصد اخبار و توئیتها برای اینکه بفهمند روند به چه سمتی است و بهتر است در سخنرانی بعدی روی چه موضوعاتی تمرکز کند. این مثال خیلی به کاربران ارتباطی ندارد و از یک سیستم تصمیمگیری استفاده شده است که کوچکترین تغییر در آن میتواند نتیجه زیادی داشته باشد. این پارادایم شیفت در تکنولوژی خیلی شدید بوده است و کاربران عام و خاص آن را احساس میکنند.
.
کسب و کار و چالشها
بیات: اگر ممکن است به الزامات و چالشهای استفاده از کلان داده هم بپردازیم. این کار چه زیرساختهایی لازم دارد و با چه موانعی به خصوص در کشور ممکن است روبهرو شود؟
سوهانگیر: اینکه چگونه میتوان مباحث کلان داده را به یک کسبوکار تبدیل کرد، سوال مهمی است. باتوجه به اینکه من در فضای سیلیکون ولی واستنفورد بودم حس کلی من این است که در آنجا هر تکنولوژی جدید که میآید، آنقدر حرفهای با آن برخورد میکنند که جان میگیرد و تبدیل به یک کسبوکار میشود. مثلا اگر قرار بود بحث کلان داده را ابتدا بانکها به آن نگاه کنند و به یک کسبوکار تبدیل کنند، خیلی متفاوت میشد تا اینکه یک عده سرمایهگذار شرکتی درست کردند و آنها شروع به ارائه سرویس کردند. این مساله دوتا ذهینت متفاوت است. فکر نمیکنم کسی در این قضیه که کلان داده امروزه به یک ضرورت تبدیل شده است شکی داشته باشد. و شاید در آینده نزدیک سازمانهایی که داده دارند اگر از دادههای خود استفاده نکنند، به آنهایی که از دادههایشان استفاده میکنند، خواهند باخت.
در مورد الزامات هم باید بگویم، خوشبختانه اغلب نرمافزارهایی که برای کلان داده لازم است متن باز هستند و کسی که در ایران نشسته با کسی که در سانفرانسیسکو هست، تفاوتی ندارد. مهم بحث نیروی انسانی و آموزش آن است برای اینکه از نیروی انسانی آموزش دیده چگونه استفاده شود و یک چرخهای درست شود که برای آن نیروی انسانی نفع داشته باشد که در این کسبوکار باقی بماند و شروع به کار تحلیل داده بکند وگرنه بقیه ملزومات چه سرورها و چه دیتابیس کمابیش در ایران هم وجود دارد. من فکر میکنم در این چرخه آن چه از همه مهمتر است، درست کردن یک کسبوکار سودده است و این که چگونه نیروی انسانی تربیت کنیم که داخل این فضا بتواند به زندگی خود ادامه دهد و کار کند.
در سیلیکون ولی بحث کلان داده طبیعتا باگوگل شروع شد ولی شما به هرکدام از شرکتهای دیگر مثل فیس بوک یا توئیتر بروید، ساختار این شرکتها شبیه یک کپی از روی گوگل است چون آدمهایی که ابتدا در گوگل بودند، بعد به توئیتر بعد به فیس بوک رفتند. خیلی از شرکتها هم هستند که سرمایهگذاری هم در آنها صورت گرفته است ولی به جایی نرسیدهاند، اما آنچه در آنجا اهمیت دارد، آموزش نیروی انسانی است یعنی در این فرایندی که سرمایهگذاری شد، یک گروه مهندس، آموزشی دیدند و یک فرآیندی را طی کردند و حتی اگر محصول خود شان به جایی نرسید به شرکت بعدی میروند و درآنجا یک کار خیلی مفید انجام میدهند.
منظورم این است که اگر ایران یا تهران را در نظر بگیریم و اگر کلان داده وجود داشته باشد و شرکتها شروع به آنالیز داده بکنند، ممکن است در برخی موارد نتیجه خاصی هم گرفته نشود ولی همین که روی این موضوع سرمایهگذاری میشود، متخصصانی تربیت میشوند که در پروژههای بعدی مفید خواهند بود به شرطی که زمینه فعالیت آنها را در کشور ایجاد کنیم تا بعد از مدتی از کشور مهاجرت نکنند.
شریفی حسینی: به نظر من یکی از چالشهایی که ما امروز داریم، همین مزیتی است که دکتر سوهانگیر اشاره کردند که نرمافزارها متن باز است و دسترسی به سرورها و دیتابیس هم وجود دارد. نتیجه نگاه این میشود که بانکها میگویند خودمان کار را انجام میدهیم. این تصمیم منجر به این میشود که در چارچوب سازمانی، به دنبال جذب نیرو با فیلترهای سازمانی میروند، در حالی که دانش و تخصص فرد چندان مهم نیست. بعد از آن وارد فرآیند ساختمان و تعریف پروژه میشوند در نهایت بعد از چند سال و صرف هزینه، عملا چیزی دست بانک را نگرفته است. به نظر من این مساله خودش یک چالش است.
اولین کاری که ما باید بکنیم این است که به بانکها بگوییم شما کار بانکداری بکنید و یک متخصص فناوری اطلاعات هم کار کلان داده بکند. کار بخش فناوری اطلاعات و مدیر فناوری هم نزدیک کردن برنامهها با این شرکتی است که قرار است مجری باشد. میخواهم تاکید کنم که اینگونه پروژهها اگر برونسپاری نشود، انتهای آن فقط شکست است.
نصیری: من یک مثال خاص بانکی میزنم. بانکها دیدند اگر پروژهای را برونسپاری کنند به آن شرکت وابسته مطلق میشوند. برای همین منظور شرکتهای خصوصی ثبت کردند. این مساله باعث شده است شرکتهایی که غیر از شرکت خود بانک هستند نتوانند در پروژههای بانکی وارد شوند. یک گونه رانت برای این شرکتها درست شده است. کما اینکه در بانک پروژهای تعریف میشود که شرکتهای بیرونی زیادی وجود دارند و حاضرند کار خوبی ارائه کنند اما کار به شرکت داخلی واگذار میَشود و بعد از چند سال با شکست پروژه مواجه میشوند. چالش دیگری که وجود دارد و سمت متخصصان فناوری اطلاعات است نه بانک، این است که متخصصان این حوزه هم طبقهبندی شده و شناخته شده نیستند که بانک بداند کار را به چه کسی واگذار کند.
خندان: در مطلبی که فوربس راجع به مدلهای کسبوکار کلان داده نوشته بود، به استارتآپها پیشنهاد کرده بود، این کار هیچ پیشزمینهای نمیخواهد با داشتن مقداری زمینه داده کاوی کار را با مشاوره شروع کنید و ضمن آن تیم فنی خود را تقویت کنند و مثالهای زیادی آورده بود که اینگونه شرکتهای تازهکار وارد حوزه کاری کلان داده شده بودند.
نصیری: من میخواهم به این مساله اشاره کنم که ما در تمام کارها یک دانش نیاز داریم و یک تجربه، فوت و فن را با هم لازم داریم. آن کسی که از دانشگاه میآید فقط از نظر فن قوی است و تجربه لازم را ندارد. در حوزه کلان داده، فوتهای کار خیلی کلیدی و مهم هستند. ارزش تجربه در این فناوری خیلی بیشتر از حوزههای دیگر است.
.
چالشهای داخلی
بیات: به چالش نیروی انسانی و مدیریتی در این حوزه اشاره شد. همچنین اینکه تشخیص سره و ناسره متخصصان از هم دشوار است. چه چالشهای دیگری وجود دارد و چگونه باید با این چالشها مقابله کرد؟
شریفی حسینی: یک چالش اصلی این است که متخصصان فناوری اطلاعات، مسئول کسبوکار بانک نیستند. لذا نیروهای بخش کسبوکار نیاز به آموزش جدی در این حوزه دارند که مستلزم صرف وقت و کار زیاد است که شاید سهلالوصول هم نباشد به این خاطر که به راحتی نمیتوان اعضای هیأت مدیره یک بانک را سر یک کلاس نشاند. تازه بعد از متقاعد کردن آنها و پیداکردن فرصت این کار، ممکن است از نظر آنها این کار راه دور دستیابی به ثروت باشد و آنها موافق راههای کوتاهتری برای پول درآوردن و پیش بردن امور خود باشند. به نظر من از زمانی این اتفاق در کشور میتواند شکل بگیرد که شرایط اقتصادی کشور پایدار شود و کارهایی مثل خلق پول اتفاق نیافتد که خیال بانکها بابت منابع جدید راحت باشد و ناچار باشند که از راه دادههای خودشان به منفعت برسند در آن زمان است که کلان داده پا میگیرد وگرنه در حال حاضر مدیران انگیزهای برای این کار ندارند.
نصیری: در نظرسنجی که دانشگاه بوستون انجام میدهد در مورد چالشهای کلان داده، بزرگترین چالش از سال ۲۰۰۹ همیشه کیفیت دادهها بوده است. چالش محرمانگی همیشه جزء ۳ چالش اول بوده است و بانک تمایلی ندارد دادههای خود را در اختیار یک نهاد بیرونی بگذارد. یک چالش دیگر ارائه این مباحث برای صاحبان کسبوکارها و توجیه آنهاست. در جاهایی که اقتصاد پایداری دارند، پول، پول تولید نمیکند بلکه کار است که ارزش افزوده ایجاد میکند اما در ایران پول، پول تولید میکند لذا اگر بانک پول داشته باشد انگیزهای ندارد که در این زمینهها سرمایهگذاری کند.
سوهانگیر: به هرحال کار کلان داده کارآمد کردن تصمیمگیریهاست. حتی برای گزینههای واسطهگری مثل سرمایهگذاری در املاک و … که در کشور طرفدار بیشتری دارد با استفاده از کلان داده میتوان تشخیص بهتری داشت و تصمیم بهتری گرفت.
.
راهاندازی کسب و کار
خندان: به نظر من مساله این نیست که ارزش افزودهای که با IT میتوان به دست آورد کمتر از سرمایهگذاری در سایر حوزههاست بلکه این است که هیأت مدیره و مدیران تصمیم گیر کسبوکارهای ما از جمله بانکداری با این فضا چندان آشنا نیستند که چگونه میتوانند با راههای خیلی سریعتر و مطمئنتر از سفتهبازی از دادهها ثروت تولید کنند. تفصیر این مساله هم متوجه آنها نیست و به متخصصان IT بر میگردد که باید نحوه کسبوکار در حوزه فناوری را یاد بدهند و با ایجاد ارزش به توسعه بازار آن کمک کنند.
شریفی حسینی: اینجاست که میتوان گفت جای شرکتهای بزرگ مشاورهای که در دنیا هستند در کشور خالی است. مثلا مشابه دیلویت ما در کشور نداریم. آنها هستند که IT را به صنعت نزدیک میکنند.
خندان: امروزه استارتآپها هم میتوانند این نقش را ایفا کنند و با راهاندازی کسبوکارهای کوچک از طریق IT پول در بیاورند. ما هم ناچاریم به این سمت حرکت کنیم چون اقتصاد ما ناچار است از درامدهای نفتی فاصله بگیرد.
علیاکبری: در مورد چالشهای ایران یک نکته عرض کنم. مدلهای کسبوکار کلان داده، دوگونه است یا برون سپاری یا درون سپاری. چه راهی میتوان انتخاب کرد که ریسکهای دو روش را کم کند؟ به نظر میرسد راهحل شرکتهای مشاوره به معنای خاص مشاوره باشد. شرکت هایی که فقط مشورت نمیدهند بلکه زیرساخت در اختیار شرکتها قرار میدهند مثل شرکت Cloudera که یک بانک لزوما تحلیل سیستم خود را به آنها نمیدهد. این شرکت زیرساختهایی آماده میکند از جنس زیرساختهای فنی و نیروی متخصص آموزش میدهد که این نیروها را میتواند کرایه دهد. این موضوع چیزی است که ما در ایران نداریم. این که منابع متنساز هستند فرصت خیلی خوبی است ولی فرق ما با سانفرانسیسکو شاید این باشد که آنها این شرکتهای مشاوره را دارند و اکوسیستم آنها کامل است اما در کشور همه چیز یا باید برون سیاری کامل شود یا درون سیاری و هر دوی این روشها ریسک بالایی دارند، چون پروژههای کلان داده طول عمر کوتاهی ندارند ولی متاسفانه طول عمر مدیریتها در کشور خیلی کوتاهتر از آن است که این پروژه به ثمر برسد.
یک چالش داخلی دیگر این است که مدیران عموما به این حوزهها به چشم یک محصول نگاه میکنند. یعنی دوست دارند که یکباره یک محصول Big Data بخرند و بعد از آن سودشان تغییر محسوس کند در حالی که این کار یک فرایند است، باید روی آن سرمایهگذاری شود، محصول زیرساختی ایجاد شود، فرهنگ سازمانی ایجاد شود، نیروی انسانی متخصص پرورش داده شود و این شرکتها به مرور ایجاد شوند. شرکتهایی که کار انجام نمیدهند اما به انجام آن کمک میکنند. مسئولیت کار ممکن ا ست در بانک یا شرکت فناوری بانک بماند ولی برای زیرساختها به دنبال دانلود هادوپ و اختراع چرخ از ابتدا نباشند، از این شرکتها کمک بگیرند و زیرساخت بخرند نه محصول. البته در ایران یک فرصت هم وجود دارد که ممکن است خارج از ایران نباشد. اقتصاد کشور اقتصاد بستهای است و مخصوصا از بعد امکانات سختافزاری قدرت مانور ما به اندازه گوگل و فیسبوک نیست. در کشور هنوز مدیران بانکی به دنبال خرید سختافزارهای متمرکز گرانقیمت هستند. با این که اقتصاد در مضیقه است اما همه میخواهند z10 آی بیام را بخرند در حالی که کلان داده میتواند با قیمتهای خیلی کمتر دادهها را روی سرورهای خیلی ارزانتر توزیع و پردازش کند و هزینهها را کاهش دهد. حال که به دلیل تحریمها نمیتوان z10 خرید، به جای آن ۱۰۰ سرور ارزان قیمت بخریم. البته این کار زمان میخواهد و این گونه نیست که امروز محصول بخریم مثل تجربه ایران خودرو که محصول SAP خرید ولی به دلیل آماده نبودن سازمان و فرهنگ سازمانی به موفقیت نرسید. باید متخصصان فناوری اطلاعات و کسبوکارها در کنار هم قرار بگیرند و به یک فهم مشترک برسند.
منبع: مرکز فابا