راه پرداخت
رسانه فناوری‌های مالی ایران

در رویداد هوش مصنوعی و قند پارسی اعلام شد: برای رسیدن به ۱۰ کشور برتر هوش مصنوعی، بودجه‌ای برابر صنعت نفت لازم است

رویداد «هوش مصنوعی و قند پارسی» با تمرکز بر معرفی تازه‌ترین دستاوردهای شرکت پارت در حوزه مدل‌های زبانی فارسی برگزار شد. در این رویداد سخنرانان مختلف از ضرورت توسعه مدل‌های بومی، چالش‌های زیرساختی، نبود نقشه راه و لزوم سرمایه‌گذاری کلان در حوزه هوش مصنوعی صحبت کردند. همچنین مدل‌های جدید توکا، درنا و شاهین معرفی و اهمیت داده‌های فارسی، توکنایزر بومی و همکاری بین ذی‌نفعان مورد تأکید قرار گرفت

رویداد «هوش مصنوعی و قند پارسی» با تمرکز بر نوآوری‌ها و دستاوردهای شرکت پارت در حوزه مدل‌های زبان فارسی برگزار شد و تازه‌ترین فعالیت‌های مرکز تحقیقات هوش مصنوعی پارت مورد بررسی قرار گرفت.

همچنین در این رویداد از جدیدترین شماره ویژه‌نامه «دیده‌بان هوش مصنوعی» با عنوان «نوآوری بی‌پایان» رونمایی شد. در این مراسم، علی‌اصغر انصاری، مشاور مدیرعامل مخابرات ایران در امور هوشمندسازی صنایع و کسب‌وکارها؛ علی رسول‌زاده، مدیرعامل شرکت دانش‌بنیان پارت و ایمان ظهوریان، معاون استراتژیک مرکز تحقیقات هوش مصنوعی پارت حضور داشتند.

ایمان ظهوریان، معاون استراتژیک مرکز تحقیقات هوش مصنوعی پارت، در این مراسم با اشاره به سابقه هفت‌ساله انتشار ویژه‌نامه دیده‌بان گفت: «ما از ابتدا با نگاهی اکوسیستمی به مقوله هوش مصنوعی نگریسته‌ایم و تلاش کرده‌ایم فراتر از چهارچوب‌های سنتی و محدود حرکت کنیم.»

به گفته ظهوریان، این ویژه‌نامه از هفت سال پیش با هدف رصد مستمر تحولات فناوری هوش مصنوعی در جهان و ایران راه‌اندازی شده و تاکنون پنج شماره از آن به‌صورت کتاب منتشر شده است. او افزود: «دو محور اصلی شماره‌های گذشته، آموزش و ترویج مبانی هوش مصنوعی و نیز ترسیم نقشه بوم‌شناختی زیست‌بوم فناوری هوش مصنوعی در ایران بوده است.»

نسخه جدید این ویژه‌نامه با عنوان «نوآوری بی‌پایان» منتشر شده و تمرکز اصلی آن بر آینده‌پژوهی در حوزه هوش مصنوعی مولد است؛ حوزه‌ای که به گفته ظهوریان، دروازه ورود به نسل تازه‌ای از فناوری‌های تحول‌آفرین در ایران محسوب می‌شود.

ایمان ظهوریان، معاون استراتژیک مرکز تحقیقات هوش مصنوعی پارت

او با اشاره به استقبال مخاطبان از محتوای ویژه‌نامه، اعلام کرد که از دو سال پیش انتشار آن به‌صورت شش‌ماهه ادامه یافته و تلاش می‌شود در هر شماره، ابعاد گوناگون هوش مصنوعی در ایران و جهان با نگاهی انتقادی، علمی و آینده‌نگر تحلیل شود.

ظهوریان در ادامه این مراسم، بر اهمیت همکاری میان بازیگران مختلف حوزه فناوری و نقش حاکمیت در تقویت زیست‌بوم هوش مصنوعی تأکید کرد و گفت: «در مسیر آینده‌نگاری هوش مصنوعی مولد در ایران، با دو سناریوی خوش‌بینانه و بدبینانه مواجهیم و امیدواریم با هم‌افزایی میان تمامی ذی‌نفعان، بتوانیم بر کاستی‌های موجود غلبه کنیم.»


صنایع بزرگ ایران از فناوری‌های جدید بی‌بهره‌اند


علی‌اصغر انصاری، مشاور هوشمندسازی پژوهشگاه ارتباطات و فناوری اطلاعات، در ارائه‌ای با عنوان «نقش مدل‌های زبانی فارسی در توسعه اقتصاد دیجیتال» در این مراسم گفت: «براساس برنامه هفتم توسعه، کشور باید به‌طور میانگین سالانه ۸ درصد رشد داشته باشد که ۳۵ درصد از این رشد باید از محل بهره‌وری تأمین شود و این امر مستلزم دیجیتالی‌ شدن صنایع و اقتصاد است.»

او افزود: «صنایع بزرگ ما هنوز از فناوری‌های نوین و نوآوری بی‌بهره‌اند و این نشان می‌دهد که اقتصادهای بزرگ کشور نه‌تنها از فناوری بهره نمی‌گیرند بلکه آمادگی پذیرش آن را نیز ندارند.»

انصاری با طرح این سؤال که چرا پرداختن به توسعه مدل‌های زبانی بومی اهمیت دارد؟ عنوان کرد: «باور داریم که ما مرجع زبان فارسی هستیم و این زبان بخشی از هویت ملی ما را شکل می‌دهد؛ بنابراین، باید در فضای دیجیتال حضوری اثربخش داشته باشیم. زبان فارسی می‌تواند به زبان علم بدل شود و باید در توسعه مدل‌های زبانی مورد توجه قرار گیرد.»

علی‌اصغر انصاری، مشاور هوشمندسازی پژوهشگاه ارتباطات و فناوری اطلاعات

مشاور هوشمندسازی پژوهشگاه ارتباطات و فناوری اطلاعات با اشاره به رشد ۳۷.۲ درصدی بازار مدل‌های زبانی در آمریکا افزود: «زبان عربی با بیش از ۳۷۳ میلیون گویش‌ور، چهارمین زبان پرگویش جهان است و کشورهای عرب‌زبان نیز به دنبال توسعه مدل‌های بومی خود هستند. در مقابل، زبان فارسی با حدود ۱۲۰ میلیون گویش‌ور در جهان نیز نیازمند مدل‌های زبانی مختص به خود است.»

به گفته انصاری، توسعه مدل‌های زبانی بومی توجیه اقتصادی دارد و داده‌های جهانی نیز نشان‌دهنده پتانسیل بالای این بازار هستند.


 نگاهی بر دستاوردها و محصولات شرکت پارت


امیرمحمد صالح‌اوف، مدیر تیم پردازش زبان طبیعی مرکز تحقیقات هوش مصنوعی پارت، در ادامه رویداد، به مرور دستاوردهای شرکت پارت در حوزه مدل‌های زبانی پرداخت و گفت: «امروزه اغلب افراد روزانه از ابزارهای مبتنی بر هوش مصنوعی استفاده می‌کنند. این ابزارها در دسته هوش مصنوعی محدود قرار می‌گیرند که به‌معنای محدود بودن توانمندی آن‌ها نسبت به انسان است. هوش مصنوعی عمومی هوش مصنوعی است که می‌تواند کارها را در حد انسان انجام دهد و فراهوش هوش مصنوعی است که توانایی انجام کارهایی فراتر از توان انسان را دارد.»

او افزود: «با ظهور مدل‌های زبانی، پیشرفت در حوزه هوش مصنوعی شتاب گرفت. در سال ۲۰۱۸ به معماری ترنسفورمرز رسیدیم که سرآغاز مدل‌های یادگیری انتقالی بود و در سال ۲۰۲۰ به مدل‌های زبانی بزرگ رسیدیم که پردازش داده‌ها را با سرعت بیشتری انجام می‌دهند.»

صالح‌اوف درباره دستاوردهای پارت گفت: «در سال ۱۴۰۱ به مدل BigBird دست یافتیم، در ۱۴۰۲ آموزش مدل‌های لاما یک و دو را انجام دادیم و در سال ۱۴۰۳ نیز مدل‌های متن‌باز توکا یک و دو، و مدل‌های لاما سه، درنا یک و درنا دو را منتشر کردیم.»

به گفته او، کیفیت یک مدل هوش مصنوعی بستگی مستقیم به داده‌هایی دارد که با آن آموزش دیده است. پارت تاکنون ۱۵۰ میلیارد توکن فارسی، ۱۳۰۰ میلیارد توکن انگلیسی، ۱۲۰ میلیارد توکن عربی، ۵۰ میلیارد توکن کد خام و همچنین ۲۲۰ میلیارد توکن انگلیسی، ۷۵ میلیارد توکن عربی و ۶۰ میلیارد توکن فارسی تمیز برای آموزش مدل‌های خود جمع‌آوری کرده است.

امیرمحمد صالح‌اوف، مدیر تیم پردازش زبان طبیعی مرکز تحقیقات هوش مصنوعی پارت

او با تأکید بر اهمیت برچسب‌گذاری داده‌ها برای آموزش مدل‌های هوش مصنوعی گفت: «یکی از مشکلات در زبان فارسی، نبود توکنایزر مناسب برای زبان فارسی بود. پارت همزمان با توسعه مدل توکا، اولین توکنایزر فارسی را طراحی کرد و برای مدل درنا، توکنایزری با ۱۲۸ هزار واژه ساخت.»

مدیر تیم پردازش زبان طبیعی پارت ادامه داد: «مدل‌های توکا و درنا در سال گذشته توسعه یافتند. امروز نیز مدل توکا SBERT V2 به‌طور رسمی رونمایی می‌شود که در بازیابی اطلاعات، دقت بالایی دارد.»

صالح‌اوف با طرح این سؤال که چرا باید مدل‌های زبانی بومی را توسعه داد؟ عنوان کرد: «این امر دلایل مختلفی دارد که آنها را به دو گروه از نگاه سرمایه‌گذار و از نگاه مصرف‌کننده تقسیم کردیم. از منظر سرمایه‌گذار، جلوگیری از خروج سرمایه، مهاجرت داده، ملاحظات فرهنگی، محدودیت‌های لایسنس، شخصی‌سازی و بهینه‌سازی اهمیت دارد. از منظر مصرف‌کننده نیز مسائل مربوط به مدیریت داده، نوسان دلاری، پشتیبانی، تحریم و شخصی‌سازی پاسخ‌ها مطرح است.»

او اعلام کرد که آموزش هر نسخه با توان ۱۰ اگزافلاپس یا ۱۸۰ میلیون توکن انجام شده و شرکت پارت با همکاری آزمایشگاه NPL دانشگاه امیرکبیر، دو نسخه بنچمارک مدل‌های زبانی خود را با استفاده از ۶۰ هزار داده ارزیابی منتشر کرده است.

در پایان، صالح‌اوف از توسعه مدل‌های جدید خانواده «شاهین» و انتشار نسخه سوم لیدریورد در سال جاری خبر داد و افزود: «برای رسیدن به جمع ۱۰ کشور برتر حوزه هوش مصنوعی، نیازمند بودجه‌ای در مقیاس صنعت نفت هستیم.»


برای قرارگرفتن در میان ۱۰ کشور برتر حوزه هوش مصنوعی، به بودجه‌ای در حد صنعت نفت نیاز داریم


در ادامه رویداد «هوش مصنوعی و قند پارسی» شرکت پارت، پنل «ترسیم چشم‌انداز مدل‌های زبانی فارسی» با مدیریت ایمان ظهوریان، معاون استراتژیک مرکز تحقیقات هوش مصنوعی پارت، و با حضور علی‌اصغر انصاری، مشاور هوشمندسازی پژوهشگاه ارتباطات و فناوری اطلاعات؛ محمدرضا محمدی، عضو هیئت‌مدیره دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت؛ الهام فراهانی، عضو هیئت‌علمی دانشگاه و هیئت‌مدیره انجمن ملی هوش مصنوعی؛ و سعیده ممتازی، عضو هیئت‌علمی دانشگاه صنعتی امیرکبیر برگزار شد.

پنل ترسیم چشم‌انداز مدل‌های زبانی فارسی در رویداد هوش مصنوعی و قند پارسی

علی‌اصغر انصاری، مشاور هوشمندسازی پژوهشگاه ارتباطات و فناوری اطلاعات، در این پنل درباره اهمیت توسعه مدل‌های زبانی بومی گفت: «بازار ما محدود است و بومی‌سازی محصولات جدید و هزینه‌های بازاریابی آن‌ها، بدون نگاه به بازار صادرات، توجیه اقتصادی ندارد. تنها زمانی که به بازارهای خارجی بیندیشیم، توسعه چنین مدل‌هایی از نظر اقتصادی موجه خواهد بود.»

او افزود: «زمان درک یک فناوری و جاری‌سازی آن در جامعه بسیار اهمیت دارد. اگر در ابتدای دهه ۹۰، زمانی که پیام‌رسان‌های خارجی هنوز فراگیر نشده بودند، روی توسعه پیام‌رسان‌های داخلی و OTT سرمایه‌گذاری می‌کردیم، وضعیت امروز سکوی‌های بومی بسیار متفاوت بود. بنابراین در حوزه مدل‌های زبانی نیز باید به موقع و با درنظر گرفتن منطق اقتصادی وارد عمل شویم. امروز جزو کشورهای پیشرو در بومی‌سازی مدل‌های زبانی هستیم.»

انصاری با اشاره به نبود نقشه راه برای توسعه هوش مصنوعی گفت: «هنوز حتی بودجه مشخصی برای این حوزه درنظر گرفته نشده است. اگر قرار است ایران در میان ۱۰ کشور اول جهان در حوزه هوش مصنوعی قرار بگیرد، نیازمند سرمایه‌گذاری در مقیاس صنعت نفت یا معادن هستیم. در بودجه سال ۱۴۰۴ چه میزان بودجه دلاری برای توسعه زیرساخت‌های هوش مصنوعی پیش‌بینی شده است؟»

به گفته او، تنظیم‌گری به معنای دخالت نیست، بلکه به معنای وضع مقررات است. این حوزه علاوه بر بودجه میلیون‌دلاری برای هر بخش، نیازمند تنظیم‌گری درست است.


توسعه مدل‌های زبانی بومی توجیه اقتصادی ندارد


محمدرضا محمدی، عضو هیئت‌مدیره دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت، در پاسخ به پرسشی درباره لزوم توسعه مدل‌های زبانی بومی گفت: «اگرچه توسعه این مدل‌ها از منظر اقتصادی توجیه‌پذیر نیست و می‌توان از مدل‌های غیربومی نیز استفاده کرد، اما در شرایطی مثل تداوم تحریم‌ها، توانمندی داخلی در این حوزه یک نیاز استراتژیک و ضروری است.»

او ادامه داد: «یکی از نقش‌های مهم مدل‌های هوش مصنوعی، نقش فرهنگی آن‌هاست. مدل‌های زبانی خارجی سوگیری خود را منتقل می‌کنند و درنتیجه، فرهنگ آینده کشور تحت‌تأثیر تصمیم‌ها و خروجی‌های آن‌ها قرار خواهد گرفت.»

او تأکید کرد که تقویت توان داخلی در حوزه هوش مصنوعی، توسعه مدل‌های زبانی بومی برای حفظ منافع ملی کشور در آینده ضروری است.

او با انتقاد از نبود سیاست‌گذاری مشخص در حوزه هوش مصنوعی گفت: «دولت هنوز هدف‌گذاری مشخصی در حوزه هوش مصنوعی ندارد. اگر قرار است منابعی صرف شود، نحوه ورود دولت باید شفاف و مؤثر باشد تا از اتلاف منابع جلوگیری شود.»


نبود عزم ملی برای جهت‌دهی به شرکت‌های فعال در هوش مصنوعی


الهام فراهانی، عضو هیئت‌علمی دانشگاه و عضو هیئت‌مدیره انجمن ملی هوش مصنوعی، در این پنل گفت: «در انجمن رویدادی با عنوان جمعه‌های هوش مصنوعی برگزار می‌کنیم که جلسه آخر آن را به مدل‌های زبانی هوشمند اختصاص دادیم. نتایج نشان داد بسیاری از افراد اطلاعات دقیقی درباره این موضوع ندارند.»

او ادامه داد: «برخی کارها باید به صورت بنیادی و زیرساختی توسط دولت انجام شود. اگرچه می‌توان با تکیه بر مدل‌های اپن‌سورس کارهایی انجام داد، اما شفاف‌سازی و اطلاع‌رسانی درباره آن‌ها ضروری است.»

فراهانی با انتقاد از وضعیت فعلی گفت: «شرکت‌های متعددی در حوزه هوش مصنوعی فعال هستند، اما در رویدادها فقط نام دو یا سه شرکت تکرار می‌شود. عزمی برای هدف‌گذاری و جهت‌دهی به شرکت‌های فعال در هوش مصنوعی وجود ندارد. سؤال اینجاست که چه نهادی مسئول هدایت این حوزه است؟ اگر همه بر ضرورت توسعه مدل‌های بومی توافق دارند، چرا استفاده از آن‌ها جدی گرفته نمی‌شود؟ توسعه این حوزه نیازمند یک اجماع و درگیری ملی است.»


 بهینه‌سازی مدل‌های زبانی هوش مصنوعی برای زبان فارسی ضروری است


سعیده ممتازی، عضو هیئت‌علمی دانشگاه صنعتی امیرکبیر، در سخنان خود با تأکید بر اهمیت توسعه مدل‌های بومی گفت: «اگرچه می‌توان از مدل‌های موجود استفاده کرد، اما زبان فراتر از واژه‌هاست و با فرهنگ پیوند خورده است. استفاده از مدل‌های غیربومی ممکن است چالش‌های فرهنگی ایجاد کند.»

او ادامه داد: «یکی از مسائل کلیدی، بهینه‌سازی مدل‌ها برای زبان فارسی است. برای بهره‌برداری بهتر در کشور و افزایش دقت عملکرد مدل‌ها در پردازش زبان فارسی، باید روی بهینه‌سازی آن‌ها تمرکز کنیم.»

ممتازی با اشاره به چالش‌های زیرساختی در مسیر توسعه این مدل‌ها افزود: «اگر قرار است از مدل‌های زبانی استفاده کنیم، باید ابتدا زیرساخت‌های لازم را فراهم کنیم. بدون زیرساخت مناسب، توسعه مدل‌های بومی امکان‌پذیر نیست.»

او در ادامه بر اهمیت محرمانگی داده‌ها و ضرورت توسعه مدل‌های زبانی بومی تأکید کرد و گفت: «نباید به‌هیچ‌وجه داده‌های حساس را در اختیار مدل‌های بسته قرار داد.»

ممتازی درباره تنظیم‌گری در این حوزه گفت: «اگر بخواهیم با کشورهای پیشرو مقایسه کنیم، باید به روند قانون‌گذاری در اتحادیه اروپا توجه داشته باشیم. تردیدی نیست که تدوین مقررات در این حوزه ضروری است و تجربه کشورهای اروپایی نشان می‌دهد که قوانین باید به‌گونه‌ای باشد که بر توسعه مسئولانه و توزیع‌پذیر هوش مصنوعی اثرگذار باشند.»

او با بیان اینکه در سطح جهانی مدل‌های زبانی بزرگ عمدتاً توسط صنایع و نه دولت‌ها توسعه یافته‌اند، افزود: «شرکت‌هایی مانند متا و گوگل پیشگام این حوزه هستند و رقابت با آنها بسیار دشوار است. در کشور ما نیز باتوجه‌به محدودیت‌های زیرساختی و منابع، لازم است صنایع داخلی وارد این حوزه شوند.»

ممتازی تأکید کرد: «دولت باید نقش تنظیم‌گر را ایفا کند و از طریق حمایت‌های مالی و سایر ابزارهای حمایتی، زمینه ورود بخش صنعتی به توسعه مدل‌های زبانی را فراهم کند.»

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.