بیگ دیتا (Big Data) ماشین لرنینگ (Machine Learning)

کلان داده و یادگیری ماشین / یا جای ماست، یا جای ماشین‌ها!

کلان داده و یادگیری ماشین
نوشته شده توسط ثریا حقی

خواه یا ناخواه، انزوا سرنوشتی است که در انتظار همه ماست. شاید هم همین‌جا که ایستاده‌ایم، خودش بخشی از انزوایی باشد که ری کورزویل (Ray Kurzweil) نیز وعده داده است. در هر صورت، کلان داده و یادگیری ماشین فناوری‌هایی هستند که جامعه ما، زندگی ما، آینده و سرنوشت ما را تحت تاثیر قرار خواهند داد و هیچ گریزی از این اتفاق نیست. ذهن ماشینی پدید‌ه‌ای است که به شکل آنلاین درآمده و شما چار‌ه‌ای ندارید، جز این‌که برای ادامه حیات در این عصر پر از ماشین، آن را بپذیرید.

اما این دو فناوری، کلان داده و یادگیری ماشین حقیقتاً چه هستند؟

 

کلان داده و یادگیری ماشین

کامپیو‌تر‌ها ظرفیت معینی دارند. این سیستم‌ها، دارای حافظه‌هایی هستند که اطلاعات را در خود ذخیره‌سازی می‌کنند. کامپیو‌تر‌ها دارای توان محاسباتی یا به عبارت دیگر کارایی متفاوتی هستند که بر اساس واحدی با عنوان فلاپس (flops) سنجش می‌شود. فلاپس، که مخفف عبارت لاتین Floating point Operations per Second است، به معنی عملیات ممیز شناور در ثانیه بوده و می‌تواند برای برخی از سیستم‌های کامپیو‌تری بالا‌تر از سایر سیستم‌ها باشد.

اما زمانی که چنین سیستم‌هایی، با حجم کلانی از داده‌ها مواجه می‌شوند که تکنیک‌های تحلیلی سنتی رایج عاجز از حل و فصل آن‌ها است، چه اتفاقی می‌افتد؟ این همان دنیای کلان داده‌ها است. دنیایی که چند صباحی است شروع شده و ما نیز جزئی از آن هستیم.

 

آخرین همه‌فن‌حریف

توماس یانگ (Thomas Young) فیزیک‌دانی بود که طی سال‌های ۱۷۷۳ الی ۱۸۲۹ میلادی در لندن زندگی می‌کرد. بر اساس کتاب «آخرین مردی که همه‌چیز را می‌دانست (The Last Man Who Knew Everything)»، اثر اندرو رابینسون (Andrew Robinson)، یانگ به معنای واقعی کلمه، آخرین همه‌چیزدان یا همه‌فن‌حریف تاریخ بوده است.

اگرچه ممکن است شما فردی باهوش باشید، اما همه ما این را به خوبی می‌دانیم که در دنیای امروز، تنها ‌چیزی که برای زنده ماندن نیاز است تخصص است. دنیای مدرن امروز بسیار گسترده‌تر از آن ‌چیزی است که هوش انفرادی انسان بتواند حتی آن را هضم کند.

اگر ساده بخواهیم بگوییم، در دنیای امروز، دیگر نمی‌توان همه‌کاره بود.

جهانی که نسل گذشته برای ما به ارث گذاشته است، بسیار پیچیده‌تر از آن است که بخواهیم سر از همه‌چیز آن دربیاوریم. این، همان ‌چیزی است که کلان داده نام گرفته است: این‌که در دنیای امروز، داده‌ها به قدری توسعه یافته و رشد کرده‌اند که روش‌های تحلیلی سابق انسانی، از درک و فائق آمدن بر آن عاجزاند. این جهان و داده‌های بی‌حدوحصر آن، برای ذهن بشر بسیاری پیچیده‌تر از آن هستند که بتواند تمامی‌ ابعاد آن را درک کرده و تجزیه و تحلیل کند. این، فرصتی فوق‌العاده‌ و چالشی جدی برای نوآورانی است که با ارائه برخی ابتکارات مبتنی بر فناوری، به مدد هوش انسانی بیایند و بخشی از بار پیچیدگی‌های جهان مدرن را به دوش بکشند.

بازار سهام، مثالی بسیار ساده برای درک بهتر این موضوع است. کافی است به نوع اطلاعات و حجم داده‌های مورد استفاده در چنین بازار‌هایی دقت کنید. در دنیای ‌بهره‌مند از ماشین‌ها، در کسری از ثانیه تمام اطلاعات موردنیاز خود در مورد بورس و سهام را از سیستم‌های کامپیو‌تری دریافت می‌کنید و بهترین تجارت را برای خود برمی‌گزینید. بدیهی است که بدون وجود این ماشین‌ها، حتی تصور فعالیت در بازار بورس، با چنین حجم بالایی از داده ممکن نخواهد بود. ذهن انسان، علیرغم تمام قدرتی که دارد، از عهده این کار برنخواهد آمد.

این‌جا است که نیاز به یک راهکار کامپیو‌تری احساس می‌شود. راهکاری که بتواند اطلاعات موردنیاز شما را در کم‌ترین زمان ممکن گردآوری کرده، تجزیه و تحلیل کند و آن‌گونه که شما می‌خواهید در اختیارتان قرار دهد.

 

یادگیری ماشین چرا مهم است؟

درست زمانی که حرف از کلان داده می‌شود، پای یادگیری ماشین نیز به میان کشیده می‌شود. رشته‌ای که هوش مصنوعی، برنامه‌نویسی کامپیو‌تری، فلسفه و کسب‌وکار را با هم ادغام کرده است.

اما ماهیت این یادگیری ماشین چیست؟ زمانی که چشمان شما به اطلاعات می‌افتند، ذهن شما در کسری از ثانیه این داده‌ها را تجزیه و تحلیل کرده و تصمیم‌گیری می‌کند. کافی است چشمان خود را ببندید و حالتی را تصور کنید که سر خود را بلند می‌کنید و یک بوفالوی وحشی را می‌بینید که به سرعت به سمت شما در حال دویدن است! چه می‌کنید؟ قطعاً بلافاصله پا به فرار می‌گذارید! یادگیری ماشین نیز درست مشابه همین فرایند است.

حجم قابل توجهی داده در اختیار ماشین قرار می‌گیرد و این ماشین، داده‌ها را تجزیه و تحلیل کرده و آن‌ها را به بهترین شکل ممکن حل و فصل می‌کند. آن‌چه که خروجی این فرایند است، نتیجه‌گیری یا تصمیم‌گیری است که با توجه به داده‌های ورودی، بهترین خروجی ممکن است.

یادگیری ماشین، راهکاری است که بشر امروز از آن، برای حل مشکلاتی استفاده می‌کند که خودش نمی‌داند چطور باید حل شوند یا دلیل استفاده از روش‌های حل مساله را درک نمی‌کند. ماشین‌ها قادرند تا تمام راهکار‌های ممکن برای حل مساله را شناسایی کرده و با سرعت هرچه تمام‌تر آن‌ها را امتحان کنند. اگر برای حل یک مساله یک میلیون راهکار احتمالی وجود داشته باشد که فقط یکی از آن‌ها به ‌پاسخ‌ صحیح بیانجامد، ماشین‌ها قادر خواهند بود تا تمام این یک میلیون راهکار را شبیه‌سازی کرده و در کم‌ترین زمان ممکن، به‌صورت سیستماتیک خروجی نهایی را که قطعاً نیز صحیح‌ترین خروجی است تولید کنند.

یادگیری ماشین

فیلم بازی‌های جنگی (War Games) اثر جان بد‌هام

در فیلم بازی‌های جنگی (War Games) اثر جان بد‌هام (John Badham)، پنتاگون تلاش می‌کند تا با اتکا به هوش مصنوعی، حمله هسته‌ای خود به جماهیر شوروی را شبیه‌سازی کند. او تمام راه‌های ممکن برای این حمله را قبل از اقدام به حمله با استفاده از هوش مصنوعی امتحان می‌کند و در نهایت نیز به این نتیجه می‌رسد که «تنها راه موفقیت در جنگ هسته‌ای، شروع نکردن آن است».

این فیلم در زمان نمایش، فیلمی‌ بیش از حد آرمانی به نظر می‌رسید. در دهه ۱۹۸۰ میلادی (فیلم در سال ۱۹۸۳ در آمریکا ساخته شده است)، فناوری هوش مصنوعی چندان توسعه نیافته بود و هیچ‌کس باور نمی‌کرد روزی بتواند از پس چنین تجزیه و تحلیل‌های پیچیده و پیشرفته‌ای برآید. اما یادگیری ماشینی که در سال ۲۰۱۹ با آن طرفیم، قدرتی فرا‌تر از حد تصور ما دارد و می‌تواند در مورد مسائل پیچید‌ه‌ای حتی در سطح کسب‌وکار‌ها و فرهنگ حرفی برای گفتن داشته باشد.

بیایید تصور کنیم شما یک توزیع کننده عمده محصولات در سطح جهانی هستید. مثلا کل چکش‌های دنیا را شما تامین کنید! تمامی‌ کارخانجات تولید کننده چکش جهان محصولات خود را در اختیار شما قرار می‌دهند و شما نیز آن‌ها را در میان خریداران توزیع می‌کنید. حال کسی برای راهنمایی نزد شما آمده و از شما در مورد این‌که «آیا راه‌اندازی یک کارخانه چکش‌سازی جدید توجیه عملی دارد یا نه؟» سوال می‌کند. چه ‌پاسخی دارید که به او بدهید؟

قطعاً مهم‌ترین توجیهی که او می‌خواهد از شما بشنود این است که آیا تقاضا برای این محصولات تولیدی وجود دارد یا نه؟ برای ‌پاسخ‌ دادن به این سوال، شما مجبور خواهید بود تا تمام خرید‌ها، پرداخت‌ها و تقاضای خریداران خود را مورد بررسی قرار دهید. اگر این ‌تراکنش‌ها با استفاده از ۵۰ میلیون کارت اعتباری صورت گرفته باشند، برای بررسی ‌تراکنش‌های این ۵۰ میلیون کارت اعتباری، آن هم به صورت دستی، شما به چندبرابر عمر خود نیاز خواهید داشت! البته، این فقط یک بُعد ماجرا است. برای این‌که وحشت نکنید، از بررسی ‌تراکم خریداران در مناطق مختلف جهان، نحوه معیشت و میزان نیاز آن‌ها به چکش، توان خرید و امثال آن چشم پوشیدیم!

این‌جا است که کلان داده و یادگیری ماشین می‌تواند به حل مساله چکش‌های شما کمک کند؛ یا دست کم شما را در مسیر درست قرار دهد تا از داده‌ها، آن‌گونه که باید استفاده کنید و گمراه نشوید. جهان پر است از چنین مشکلاتی – و چه بسا بسیار پیچیده‌تر از این – و کلان داده و یادگیری ماشین، دوستانی هستند که راه‌حل بسیاری از این مشکلات را در چنته دارند.

 

مقررات عمومی‌ حفاظت از داده اتحادیه اروپا؛ تهدید یا فرصت؟

در سال ۲۰۱۸، اتحادیه اروپا قانونی را تحت عنوان مقررات عمومی‌ حفاظت از داده (GDPR: General Data Protection Regulation) به تصویب رساند که مبنی بر حفاظت از داده و محرمانگی اطلاعات همه افراد در اتحادیه اروپا است. اگرچه هدف از تصویب این قانون اعطای کنترل داده‌های شخصی به شهروندان و تسهیل محیط قانون‌گذاری برای کسب‌وکار‌های بین‌المللی عنوان شده، اما با تصویب آن، بسیاری از فعالیت‌های جامعه توسعه نرم‌افزاری مختل شده است. بسیاری از وبلاگ نویسان بر این عقیده‌اند که مقررات عمومی‌ حفاظت از داده اتحادیه اروپا برخی از انواع یادگیری ماشین را غیرقانونی می‌کند. این در حالی است که هیئات ژوری، در مورد چگونگی هم‌افزایی رگولاتوری و یادگیری ماشین در آینده، تاکنون کنار ایستاده است.

همه می‌خواهند در امنیت باشند و هیچ‌کس دوست ندارد داده‌ها و اطلاعات شخصی‌اش در فضای اطراف پخش باشد و بد‌تر از آن این‌که به دست برخی نااهلان بیافتد. اما همیشه همه‌چیز آن‌طور که ما می‌خواهیم پیش نمی‌رود.

قوانین سیاسی وقتی پای داده‌ها به میان می‌آید، کمی‌ خطرناک می‌شوند. رسالتِ مقررات عمومی‌ حفاظت از داده اتحادیه اروپا این است که به شما این امکان را بدهد تا خود، مالکیت داده‌های شخصی‌تان را در اختیار داشته باشید و بتوانید فقط زمانی آن‌ها را در اختیار دیگران قرار دهید که می‌دانید چگونه و کجا استفاده می‌شوند و چرا؛ خیلی خوب به نظر می‌رسد، نه؟!

خب، شاید؛ اما این نکته را هم نباید فراموش کرد که یادگیری ماشین، این قدرت را دارد تا حتی جوانب و اطلاعاتی از شما که به این آسانی‌ها قابل تشخیص نیستند را نیز شناسایی کند. اگر خیلی روی زندگی شخصی و کار‌هایی که می‌کنید حساس باشید، این می‌تواند یک خطر امنیتی بسیار جدی برای حریم شخصی شما و داده‌های‌تان باشد. این‌که یک ماشین بتواند داده‌ها و اطلاعاتی را در مورد شما به دست آورد، که حتی خودتان هم از آن بی‌خبر هستید!

اما از طرفی این یک مزیت و فرصت بزرگ هم خواهد بود. بی‌تردید دلایل قانع‌کننده زیادی برای دسترسی دولت‌ها به داده‌های شخصی مردم با اتکا به یادگیری ماشین وجود دارد که نه فقط دولت‌مردان، بلکه بسیاری از شهروندان نیز به آن ایمان دارند (البته اگر شهروندان خوبی باشید!).

دنیایی را تصور کنید که در آن، شما قادر باشید از یک مغازه مقداری مواد منفجره خطرناک تهیه کنید و دو روز بعد، هیچ‌کس خبردار نشود که چه کسی ساختمان چند طبقه دو خیابان آن‌طرف‌تر را با خاک یکسان کرده است! واقعاً مسخره است اما با تمام این اوصاف، هنوز هم می‌توان دوری گزیدن جامعه انسانی از فناوری‌هایی چون کلان داده و یادگیری ماشین را احساس کرد. این، جدال بین آزادی مفرط و قانون‌زدگی است…

 

عصر اطلاعات

بیایید با حقیقت روبه‌رو شویم: جهان، حقیقتاً مکانی گیج کننده است! دنیایی از اطلاعات آن بیرون در حال رشد هستند و بشریت، مدام در تقلای این است که راهکار‌هایی نوآورانه بر مبنای فناوری ایجاد کند تا این اطلاعات را مدیریت کند.

خوب یا بد، ما در عصر اطلاعات و داده‌ها پا به عرصه وجود گذاشته‌ایم و هیچ‌کس نمی‌داند انتهای مسیری که در آن قرار گرفته‌ایم چیست. فقط همین بس، که به تاخت به سمت آن نقطه نامعلوم در حرکتیم…

منبع: Forbes

درباره نویسنده

ثریا حقی

دانش آموخته مهندسی شیمی و در حال حاضر مشغول فعالیت در حیطه طراحی صنعتی و ترجمه متون انگلیسی. علاقه‌مند به مطالعه، تحلیل و نگارش در حوزه تولید محتوا به ویژه در زمینه فناوری‌های مالی بوده و در همین راستا در حیطه فین‌تک با مجموعه راه پرداخت همکاری می‌کند.

دیدگاهتان را بنویسید

/* ]]> */