پایگاه خبری راه پرداخت دارای مجوز به شماره ۷۴۵۷۲ از وزارت فرهنگ و ارشاد اسلامی و بخشی از «شبکه عصر تراکنش» است. راه پرداخت فعالیت خود را از دوم اردیبهشتماه ۱۳۹۰ شروع کرده و اکنون پرمخاطبترین رسانه ایران در زمینه فناوریهای مالی، بانکداری و پرداخت و استارتآپهای فینتک است.
کلان داده و یادگیری ماشین / یا جای ماست، یا جای ماشینها!
خواه یا ناخواه، انزوا سرنوشتی است که در انتظار همه ماست. شاید هم همینجا که ایستادهایم، خودش بخشی از انزوایی باشد که ری کورزویل (Ray Kurzweil) نیز وعده داده است. در هر صورت، کلان داده و یادگیری ماشین فناوریهایی هستند که جامعه ما، زندگی ما، آینده و سرنوشت ما را تحت تاثیر قرار خواهند داد و هیچ گریزی از این اتفاق نیست. ذهن ماشینی پدیدهای است که به شکل آنلاین درآمده و شما چارهای ندارید، جز اینکه برای ادامه حیات در این عصر پر از ماشین، آن را بپذیرید.
اما این دو فناوری، کلان داده و یادگیری ماشین حقیقتاً چه هستند؟
کلان داده و یادگیری ماشین
کامپیوترها ظرفیت معینی دارند. این سیستمها، دارای حافظههایی هستند که اطلاعات را در خود ذخیرهسازی میکنند. کامپیوترها دارای توان محاسباتی یا به عبارت دیگر کارایی متفاوتی هستند که بر اساس واحدی با عنوان فلاپس (flops) سنجش میشود. فلاپس، که مخفف عبارت لاتین Floating point Operations per Second است، به معنی عملیات ممیز شناور در ثانیه بوده و میتواند برای برخی از سیستمهای کامپیوتری بالاتر از سایر سیستمها باشد.
اما زمانی که چنین سیستمهایی، با حجم کلانی از دادهها مواجه میشوند که تکنیکهای تحلیلی سنتی رایج عاجز از حل و فصل آنها است، چه اتفاقی میافتد؟ این همان دنیای کلان دادهها است. دنیایی که چند صباحی است شروع شده و ما نیز جزئی از آن هستیم.
آخرین همهفنحریف
توماس یانگ (Thomas Young) فیزیکدانی بود که طی سالهای ۱۷۷۳ الی ۱۸۲۹ میلادی در لندن زندگی میکرد. بر اساس کتاب «آخرین مردی که همهچیز را میدانست (The Last Man Who Knew Everything)»، اثر اندرو رابینسون (Andrew Robinson)، یانگ به معنای واقعی کلمه، آخرین همهچیزدان یا همهفنحریف تاریخ بوده است.
اگرچه ممکن است شما فردی باهوش باشید، اما همه ما این را به خوبی میدانیم که در دنیای امروز، تنها چیزی که برای زنده ماندن نیاز است تخصص است. دنیای مدرن امروز بسیار گستردهتر از آن چیزی است که هوش انفرادی انسان بتواند حتی آن را هضم کند.
اگر ساده بخواهیم بگوییم، در دنیای امروز، دیگر نمیتوان همهکاره بود.
جهانی که نسل گذشته برای ما به ارث گذاشته است، بسیار پیچیدهتر از آن است که بخواهیم سر از همهچیز آن دربیاوریم. این، همان چیزی است که کلان داده نام گرفته است: اینکه در دنیای امروز، دادهها به قدری توسعه یافته و رشد کردهاند که روشهای تحلیلی سابق انسانی، از درک و فائق آمدن بر آن عاجزاند. این جهان و دادههای بیحدوحصر آن، برای ذهن بشر بسیاری پیچیدهتر از آن هستند که بتواند تمامی ابعاد آن را درک کرده و تجزیه و تحلیل کند. این، فرصتی فوقالعاده و چالشی جدی برای نوآورانی است که با ارائه برخی ابتکارات مبتنی بر فناوری، به مدد هوش انسانی بیایند و بخشی از بار پیچیدگیهای جهان مدرن را به دوش بکشند.
بازار سهام، مثالی بسیار ساده برای درک بهتر این موضوع است. کافی است به نوع اطلاعات و حجم دادههای مورد استفاده در چنین بازارهایی دقت کنید. در دنیای بهرهمند از ماشینها، در کسری از ثانیه تمام اطلاعات موردنیاز خود در مورد بورس و سهام را از سیستمهای کامپیوتری دریافت میکنید و بهترین تجارت را برای خود برمیگزینید. بدیهی است که بدون وجود این ماشینها، حتی تصور فعالیت در بازار بورس، با چنین حجم بالایی از داده ممکن نخواهد بود. ذهن انسان، علیرغم تمام قدرتی که دارد، از عهده این کار برنخواهد آمد.
اینجا است که نیاز به یک راهکار کامپیوتری احساس میشود. راهکاری که بتواند اطلاعات موردنیاز شما را در کمترین زمان ممکن گردآوری کرده، تجزیه و تحلیل کند و آنگونه که شما میخواهید در اختیارتان قرار دهد.
یادگیری ماشین چرا مهم است؟
درست زمانی که حرف از کلان داده میشود، پای یادگیری ماشین نیز به میان کشیده میشود. رشتهای که هوش مصنوعی، برنامهنویسی کامپیوتری، فلسفه و کسبوکار را با هم ادغام کرده است.
اما ماهیت این یادگیری ماشین چیست؟ زمانی که چشمان شما به اطلاعات میافتند، ذهن شما در کسری از ثانیه این دادهها را تجزیه و تحلیل کرده و تصمیمگیری میکند. کافی است چشمان خود را ببندید و حالتی را تصور کنید که سر خود را بلند میکنید و یک بوفالوی وحشی را میبینید که به سرعت به سمت شما در حال دویدن است! چه میکنید؟ قطعاً بلافاصله پا به فرار میگذارید! یادگیری ماشین نیز درست مشابه همین فرایند است.
حجم قابل توجهی داده در اختیار ماشین قرار میگیرد و این ماشین، دادهها را تجزیه و تحلیل کرده و آنها را به بهترین شکل ممکن حل و فصل میکند. آنچه که خروجی این فرایند است، نتیجهگیری یا تصمیمگیری است که با توجه به دادههای ورودی، بهترین خروجی ممکن است.
یادگیری ماشین، راهکاری است که بشر امروز از آن، برای حل مشکلاتی استفاده میکند که خودش نمیداند چطور باید حل شوند یا دلیل استفاده از روشهای حل مساله را درک نمیکند. ماشینها قادرند تا تمام راهکارهای ممکن برای حل مساله را شناسایی کرده و با سرعت هرچه تمامتر آنها را امتحان کنند. اگر برای حل یک مساله یک میلیون راهکار احتمالی وجود داشته باشد که فقط یکی از آنها به پاسخ صحیح بیانجامد، ماشینها قادر خواهند بود تا تمام این یک میلیون راهکار را شبیهسازی کرده و در کمترین زمان ممکن، بهصورت سیستماتیک خروجی نهایی را که قطعاً نیز صحیحترین خروجی است تولید کنند.
در فیلم بازیهای جنگی (War Games) اثر جان بدهام (John Badham)، پنتاگون تلاش میکند تا با اتکا به هوش مصنوعی، حمله هستهای خود به جماهیر شوروی را شبیهسازی کند. او تمام راههای ممکن برای این حمله را قبل از اقدام به حمله با استفاده از هوش مصنوعی امتحان میکند و در نهایت نیز به این نتیجه میرسد که «تنها راه موفقیت در جنگ هستهای، شروع نکردن آن است».
این فیلم در زمان نمایش، فیلمی بیش از حد آرمانی به نظر میرسید. در دهه ۱۹۸۰ میلادی (فیلم در سال ۱۹۸۳ در آمریکا ساخته شده است)، فناوری هوش مصنوعی چندان توسعه نیافته بود و هیچکس باور نمیکرد روزی بتواند از پس چنین تجزیه و تحلیلهای پیچیده و پیشرفتهای برآید. اما یادگیری ماشینی که در سال ۲۰۱۹ با آن طرفیم، قدرتی فراتر از حد تصور ما دارد و میتواند در مورد مسائل پیچیدهای حتی در سطح کسبوکارها و فرهنگ حرفی برای گفتن داشته باشد.
بیایید تصور کنیم شما یک توزیع کننده عمده محصولات در سطح جهانی هستید. مثلا کل چکشهای دنیا را شما تامین کنید! تمامی کارخانجات تولید کننده چکش جهان محصولات خود را در اختیار شما قرار میدهند و شما نیز آنها را در میان خریداران توزیع میکنید. حال کسی برای راهنمایی نزد شما آمده و از شما در مورد اینکه «آیا راهاندازی یک کارخانه چکشسازی جدید توجیه عملی دارد یا نه؟» سوال میکند. چه پاسخی دارید که به او بدهید؟
قطعاً مهمترین توجیهی که او میخواهد از شما بشنود این است که آیا تقاضا برای این محصولات تولیدی وجود دارد یا نه؟ برای پاسخ دادن به این سوال، شما مجبور خواهید بود تا تمام خریدها، پرداختها و تقاضای خریداران خود را مورد بررسی قرار دهید. اگر این تراکنشها با استفاده از ۵۰ میلیون کارت اعتباری صورت گرفته باشند، برای بررسی تراکنشهای این ۵۰ میلیون کارت اعتباری، آن هم به صورت دستی، شما به چندبرابر عمر خود نیاز خواهید داشت! البته، این فقط یک بُعد ماجرا است. برای اینکه وحشت نکنید، از بررسی تراکم خریداران در مناطق مختلف جهان، نحوه معیشت و میزان نیاز آنها به چکش، توان خرید و امثال آن چشم پوشیدیم!
اینجا است که کلان داده و یادگیری ماشین میتواند به حل مساله چکشهای شما کمک کند؛ یا دست کم شما را در مسیر درست قرار دهد تا از دادهها، آنگونه که باید استفاده کنید و گمراه نشوید. جهان پر است از چنین مشکلاتی – و چه بسا بسیار پیچیدهتر از این – و کلان داده و یادگیری ماشین، دوستانی هستند که راهحل بسیاری از این مشکلات را در چنته دارند.
مقررات عمومی حفاظت از داده اتحادیه اروپا؛ تهدید یا فرصت؟
در سال ۲۰۱۸، اتحادیه اروپا قانونی را تحت عنوان مقررات عمومی حفاظت از داده (GDPR: General Data Protection Regulation) به تصویب رساند که مبنی بر حفاظت از داده و محرمانگی اطلاعات همه افراد در اتحادیه اروپا است. اگرچه هدف از تصویب این قانون اعطای کنترل دادههای شخصی به شهروندان و تسهیل محیط قانونگذاری برای کسبوکارهای بینالمللی عنوان شده، اما با تصویب آن، بسیاری از فعالیتهای جامعه توسعه نرمافزاری مختل شده است. بسیاری از وبلاگ نویسان بر این عقیدهاند که مقررات عمومی حفاظت از داده اتحادیه اروپا برخی از انواع یادگیری ماشین را غیرقانونی میکند. این در حالی است که هیئات ژوری، در مورد چگونگی همافزایی رگولاتوری و یادگیری ماشین در آینده، تاکنون کنار ایستاده است.
همه میخواهند در امنیت باشند و هیچکس دوست ندارد دادهها و اطلاعات شخصیاش در فضای اطراف پخش باشد و بدتر از آن اینکه به دست برخی نااهلان بیافتد. اما همیشه همهچیز آنطور که ما میخواهیم پیش نمیرود.
قوانین سیاسی وقتی پای دادهها به میان میآید، کمی خطرناک میشوند. رسالتِ مقررات عمومی حفاظت از داده اتحادیه اروپا این است که به شما این امکان را بدهد تا خود، مالکیت دادههای شخصیتان را در اختیار داشته باشید و بتوانید فقط زمانی آنها را در اختیار دیگران قرار دهید که میدانید چگونه و کجا استفاده میشوند و چرا؛ خیلی خوب به نظر میرسد، نه؟!
خب، شاید؛ اما این نکته را هم نباید فراموش کرد که یادگیری ماشین، این قدرت را دارد تا حتی جوانب و اطلاعاتی از شما که به این آسانیها قابل تشخیص نیستند را نیز شناسایی کند. اگر خیلی روی زندگی شخصی و کارهایی که میکنید حساس باشید، این میتواند یک خطر امنیتی بسیار جدی برای حریم شخصی شما و دادههایتان باشد. اینکه یک ماشین بتواند دادهها و اطلاعاتی را در مورد شما به دست آورد، که حتی خودتان هم از آن بیخبر هستید!
اما از طرفی این یک مزیت و فرصت بزرگ هم خواهد بود. بیتردید دلایل قانعکننده زیادی برای دسترسی دولتها به دادههای شخصی مردم با اتکا به یادگیری ماشین وجود دارد که نه فقط دولتمردان، بلکه بسیاری از شهروندان نیز به آن ایمان دارند (البته اگر شهروندان خوبی باشید!).
دنیایی را تصور کنید که در آن، شما قادر باشید از یک مغازه مقداری مواد منفجره خطرناک تهیه کنید و دو روز بعد، هیچکس خبردار نشود که چه کسی ساختمان چند طبقه دو خیابان آنطرفتر را با خاک یکسان کرده است! واقعاً مسخره است اما با تمام این اوصاف، هنوز هم میتوان دوری گزیدن جامعه انسانی از فناوریهایی چون کلان داده و یادگیری ماشین را احساس کرد. این، جدال بین آزادی مفرط و قانونزدگی است…
عصر اطلاعات
بیایید با حقیقت روبهرو شویم: جهان، حقیقتاً مکانی گیج کننده است! دنیایی از اطلاعات آن بیرون در حال رشد هستند و بشریت، مدام در تقلای این است که راهکارهایی نوآورانه بر مبنای فناوری ایجاد کند تا این اطلاعات را مدیریت کند.
خوب یا بد، ما در عصر اطلاعات و دادهها پا به عرصه وجود گذاشتهایم و هیچکس نمیداند انتهای مسیری که در آن قرار گرفتهایم چیست. فقط همین بس، که به تاخت به سمت آن نقطه نامعلوم در حرکتیم…
منبع: Forbes