پایگاه خبری راه پرداخت دارای مجوز به شماره ۷۴۵۷۲ از وزارت فرهنگ و ارشاد اسلامی و بخشی از «شبکه عصر تراکنش» است. راه پرداخت فعالیت خود را از دوم اردیبهشتماه ۱۳۹۰ شروع کرده و اکنون پرمخاطبترین رسانه ایران در زمینه فناوریهای مالی، بانکداری و پرداخت و استارتآپهای فینتک است.
در رویداد هوش مصنوعی و قند پارسی اعلام شد: برای رسیدن به ۱۰ کشور برتر هوش مصنوعی، بودجهای برابر صنعت نفت لازم است
رویداد «هوش مصنوعی و قند پارسی» با تمرکز بر معرفی تازهترین دستاوردهای شرکت پارت در حوزه مدلهای زبانی فارسی برگزار شد. در این رویداد سخنرانان مختلف از ضرورت توسعه مدلهای بومی، چالشهای زیرساختی، نبود نقشه راه و لزوم سرمایهگذاری کلان در حوزه هوش مصنوعی صحبت کردند. همچنین مدلهای جدید توکا، درنا و شاهین معرفی و اهمیت دادههای فارسی، توکنایزر بومی و همکاری بین ذینفعان مورد تأکید قرار گرفت
رویداد «هوش مصنوعی و قند پارسی» با تمرکز بر نوآوریها و دستاوردهای شرکت پارت در حوزه مدلهای زبان فارسی برگزار شد و تازهترین فعالیتهای مرکز تحقیقات هوش مصنوعی پارت مورد بررسی قرار گرفت.
همچنین در این رویداد از جدیدترین شماره ویژهنامه «دیدهبان هوش مصنوعی» با عنوان «نوآوری بیپایان» رونمایی شد. در این مراسم، علیاصغر انصاری، مشاور مدیرعامل مخابرات ایران در امور هوشمندسازی صنایع و کسبوکارها؛ علی رسولزاده، مدیرعامل شرکت دانشبنیان پارت و ایمان ظهوریان، معاون استراتژیک مرکز تحقیقات هوش مصنوعی پارت حضور داشتند.
ایمان ظهوریان، معاون استراتژیک مرکز تحقیقات هوش مصنوعی پارت، در این مراسم با اشاره به سابقه هفتساله انتشار ویژهنامه دیدهبان گفت: «ما از ابتدا با نگاهی اکوسیستمی به مقوله هوش مصنوعی نگریستهایم و تلاش کردهایم فراتر از چهارچوبهای سنتی و محدود حرکت کنیم.»
به گفته ظهوریان، این ویژهنامه از هفت سال پیش با هدف رصد مستمر تحولات فناوری هوش مصنوعی در جهان و ایران راهاندازی شده و تاکنون پنج شماره از آن بهصورت کتاب منتشر شده است. او افزود: «دو محور اصلی شمارههای گذشته، آموزش و ترویج مبانی هوش مصنوعی و نیز ترسیم نقشه بومشناختی زیستبوم فناوری هوش مصنوعی در ایران بوده است.»
نسخه جدید این ویژهنامه با عنوان «نوآوری بیپایان» منتشر شده و تمرکز اصلی آن بر آیندهپژوهی در حوزه هوش مصنوعی مولد است؛ حوزهای که به گفته ظهوریان، دروازه ورود به نسل تازهای از فناوریهای تحولآفرین در ایران محسوب میشود.
او با اشاره به استقبال مخاطبان از محتوای ویژهنامه، اعلام کرد که از دو سال پیش انتشار آن بهصورت ششماهه ادامه یافته و تلاش میشود در هر شماره، ابعاد گوناگون هوش مصنوعی در ایران و جهان با نگاهی انتقادی، علمی و آیندهنگر تحلیل شود.
ظهوریان در ادامه این مراسم، بر اهمیت همکاری میان بازیگران مختلف حوزه فناوری و نقش حاکمیت در تقویت زیستبوم هوش مصنوعی تأکید کرد و گفت: «در مسیر آیندهنگاری هوش مصنوعی مولد در ایران، با دو سناریوی خوشبینانه و بدبینانه مواجهیم و امیدواریم با همافزایی میان تمامی ذینفعان، بتوانیم بر کاستیهای موجود غلبه کنیم.»
صنایع بزرگ ایران از فناوریهای جدید بیبهرهاند
علیاصغر انصاری، مشاور هوشمندسازی پژوهشگاه ارتباطات و فناوری اطلاعات، در ارائهای با عنوان «نقش مدلهای زبانی فارسی در توسعه اقتصاد دیجیتال» در این مراسم گفت: «براساس برنامه هفتم توسعه، کشور باید بهطور میانگین سالانه ۸ درصد رشد داشته باشد که ۳۵ درصد از این رشد باید از محل بهرهوری تأمین شود و این امر مستلزم دیجیتالی شدن صنایع و اقتصاد است.»
او افزود: «صنایع بزرگ ما هنوز از فناوریهای نوین و نوآوری بیبهرهاند و این نشان میدهد که اقتصادهای بزرگ کشور نهتنها از فناوری بهره نمیگیرند بلکه آمادگی پذیرش آن را نیز ندارند.»
انصاری با طرح این سؤال که چرا پرداختن به توسعه مدلهای زبانی بومی اهمیت دارد؟ عنوان کرد: «باور داریم که ما مرجع زبان فارسی هستیم و این زبان بخشی از هویت ملی ما را شکل میدهد؛ بنابراین، باید در فضای دیجیتال حضوری اثربخش داشته باشیم. زبان فارسی میتواند به زبان علم بدل شود و باید در توسعه مدلهای زبانی مورد توجه قرار گیرد.»
مشاور هوشمندسازی پژوهشگاه ارتباطات و فناوری اطلاعات با اشاره به رشد ۳۷.۲ درصدی بازار مدلهای زبانی در آمریکا افزود: «زبان عربی با بیش از ۳۷۳ میلیون گویشور، چهارمین زبان پرگویش جهان است و کشورهای عربزبان نیز به دنبال توسعه مدلهای بومی خود هستند. در مقابل، زبان فارسی با حدود ۱۲۰ میلیون گویشور در جهان نیز نیازمند مدلهای زبانی مختص به خود است.»
به گفته انصاری، توسعه مدلهای زبانی بومی توجیه اقتصادی دارد و دادههای جهانی نیز نشاندهنده پتانسیل بالای این بازار هستند.
نگاهی بر دستاوردها و محصولات شرکت پارت
امیرمحمد صالحاوف، مدیر تیم پردازش زبان طبیعی مرکز تحقیقات هوش مصنوعی پارت، در ادامه رویداد، به مرور دستاوردهای شرکت پارت در حوزه مدلهای زبانی پرداخت و گفت: «امروزه اغلب افراد روزانه از ابزارهای مبتنی بر هوش مصنوعی استفاده میکنند. این ابزارها در دسته هوش مصنوعی محدود قرار میگیرند که بهمعنای محدود بودن توانمندی آنها نسبت به انسان است. هوش مصنوعی عمومی هوش مصنوعی است که میتواند کارها را در حد انسان انجام دهد و فراهوش هوش مصنوعی است که توانایی انجام کارهایی فراتر از توان انسان را دارد.»
او افزود: «با ظهور مدلهای زبانی، پیشرفت در حوزه هوش مصنوعی شتاب گرفت. در سال ۲۰۱۸ به معماری ترنسفورمرز رسیدیم که سرآغاز مدلهای یادگیری انتقالی بود و در سال ۲۰۲۰ به مدلهای زبانی بزرگ رسیدیم که پردازش دادهها را با سرعت بیشتری انجام میدهند.»
صالحاوف درباره دستاوردهای پارت گفت: «در سال ۱۴۰۱ به مدل BigBird دست یافتیم، در ۱۴۰۲ آموزش مدلهای لاما یک و دو را انجام دادیم و در سال ۱۴۰۳ نیز مدلهای متنباز توکا یک و دو، و مدلهای لاما سه، درنا یک و درنا دو را منتشر کردیم.»
به گفته او، کیفیت یک مدل هوش مصنوعی بستگی مستقیم به دادههایی دارد که با آن آموزش دیده است. پارت تاکنون ۱۵۰ میلیارد توکن فارسی، ۱۳۰۰ میلیارد توکن انگلیسی، ۱۲۰ میلیارد توکن عربی، ۵۰ میلیارد توکن کد خام و همچنین ۲۲۰ میلیارد توکن انگلیسی، ۷۵ میلیارد توکن عربی و ۶۰ میلیارد توکن فارسی تمیز برای آموزش مدلهای خود جمعآوری کرده است.
او با تأکید بر اهمیت برچسبگذاری دادهها برای آموزش مدلهای هوش مصنوعی گفت: «یکی از مشکلات در زبان فارسی، نبود توکنایزر مناسب برای زبان فارسی بود. پارت همزمان با توسعه مدل توکا، اولین توکنایزر فارسی را طراحی کرد و برای مدل درنا، توکنایزری با ۱۲۸ هزار واژه ساخت.»
مدیر تیم پردازش زبان طبیعی پارت ادامه داد: «مدلهای توکا و درنا در سال گذشته توسعه یافتند. امروز نیز مدل توکا SBERT V2 بهطور رسمی رونمایی میشود که در بازیابی اطلاعات، دقت بالایی دارد.»
صالحاوف با طرح این سؤال که چرا باید مدلهای زبانی بومی را توسعه داد؟ عنوان کرد: «این امر دلایل مختلفی دارد که آنها را به دو گروه از نگاه سرمایهگذار و از نگاه مصرفکننده تقسیم کردیم. از منظر سرمایهگذار، جلوگیری از خروج سرمایه، مهاجرت داده، ملاحظات فرهنگی، محدودیتهای لایسنس، شخصیسازی و بهینهسازی اهمیت دارد. از منظر مصرفکننده نیز مسائل مربوط به مدیریت داده، نوسان دلاری، پشتیبانی، تحریم و شخصیسازی پاسخها مطرح است.»
او اعلام کرد که آموزش هر نسخه با توان ۱۰ اگزافلاپس یا ۱۸۰ میلیون توکن انجام شده و شرکت پارت با همکاری آزمایشگاه NPL دانشگاه امیرکبیر، دو نسخه بنچمارک مدلهای زبانی خود را با استفاده از ۶۰ هزار داده ارزیابی منتشر کرده است.
در پایان، صالحاوف از توسعه مدلهای جدید خانواده «شاهین» و انتشار نسخه سوم لیدریورد در سال جاری خبر داد و افزود: «برای رسیدن به جمع ۱۰ کشور برتر حوزه هوش مصنوعی، نیازمند بودجهای در مقیاس صنعت نفت هستیم.»
برای قرارگرفتن در میان ۱۰ کشور برتر حوزه هوش مصنوعی، به بودجهای در حد صنعت نفت نیاز داریم
در ادامه رویداد «هوش مصنوعی و قند پارسی» شرکت پارت، پنل «ترسیم چشمانداز مدلهای زبانی فارسی» با مدیریت ایمان ظهوریان، معاون استراتژیک مرکز تحقیقات هوش مصنوعی پارت، و با حضور علیاصغر انصاری، مشاور هوشمندسازی پژوهشگاه ارتباطات و فناوری اطلاعات؛ محمدرضا محمدی، عضو هیئتمدیره دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت؛ الهام فراهانی، عضو هیئتعلمی دانشگاه و هیئتمدیره انجمن ملی هوش مصنوعی؛ و سعیده ممتازی، عضو هیئتعلمی دانشگاه صنعتی امیرکبیر برگزار شد.
علیاصغر انصاری، مشاور هوشمندسازی پژوهشگاه ارتباطات و فناوری اطلاعات، در این پنل درباره اهمیت توسعه مدلهای زبانی بومی گفت: «بازار ما محدود است و بومیسازی محصولات جدید و هزینههای بازاریابی آنها، بدون نگاه به بازار صادرات، توجیه اقتصادی ندارد. تنها زمانی که به بازارهای خارجی بیندیشیم، توسعه چنین مدلهایی از نظر اقتصادی موجه خواهد بود.»
او افزود: «زمان درک یک فناوری و جاریسازی آن در جامعه بسیار اهمیت دارد. اگر در ابتدای دهه ۹۰، زمانی که پیامرسانهای خارجی هنوز فراگیر نشده بودند، روی توسعه پیامرسانهای داخلی و OTT سرمایهگذاری میکردیم، وضعیت امروز سکویهای بومی بسیار متفاوت بود. بنابراین در حوزه مدلهای زبانی نیز باید به موقع و با درنظر گرفتن منطق اقتصادی وارد عمل شویم. امروز جزو کشورهای پیشرو در بومیسازی مدلهای زبانی هستیم.»
انصاری با اشاره به نبود نقشه راه برای توسعه هوش مصنوعی گفت: «هنوز حتی بودجه مشخصی برای این حوزه درنظر گرفته نشده است. اگر قرار است ایران در میان ۱۰ کشور اول جهان در حوزه هوش مصنوعی قرار بگیرد، نیازمند سرمایهگذاری در مقیاس صنعت نفت یا معادن هستیم. در بودجه سال ۱۴۰۴ چه میزان بودجه دلاری برای توسعه زیرساختهای هوش مصنوعی پیشبینی شده است؟»
به گفته او، تنظیمگری به معنای دخالت نیست، بلکه به معنای وضع مقررات است. این حوزه علاوه بر بودجه میلیوندلاری برای هر بخش، نیازمند تنظیمگری درست است.
توسعه مدلهای زبانی بومی توجیه اقتصادی ندارد
محمدرضا محمدی، عضو هیئتمدیره دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت، در پاسخ به پرسشی درباره لزوم توسعه مدلهای زبانی بومی گفت: «اگرچه توسعه این مدلها از منظر اقتصادی توجیهپذیر نیست و میتوان از مدلهای غیربومی نیز استفاده کرد، اما در شرایطی مثل تداوم تحریمها، توانمندی داخلی در این حوزه یک نیاز استراتژیک و ضروری است.»
او ادامه داد: «یکی از نقشهای مهم مدلهای هوش مصنوعی، نقش فرهنگی آنهاست. مدلهای زبانی خارجی سوگیری خود را منتقل میکنند و درنتیجه، فرهنگ آینده کشور تحتتأثیر تصمیمها و خروجیهای آنها قرار خواهد گرفت.»
او تأکید کرد که تقویت توان داخلی در حوزه هوش مصنوعی، توسعه مدلهای زبانی بومی برای حفظ منافع ملی کشور در آینده ضروری است.
او با انتقاد از نبود سیاستگذاری مشخص در حوزه هوش مصنوعی گفت: «دولت هنوز هدفگذاری مشخصی در حوزه هوش مصنوعی ندارد. اگر قرار است منابعی صرف شود، نحوه ورود دولت باید شفاف و مؤثر باشد تا از اتلاف منابع جلوگیری شود.»
نبود عزم ملی برای جهتدهی به شرکتهای فعال در هوش مصنوعی
الهام فراهانی، عضو هیئتعلمی دانشگاه و عضو هیئتمدیره انجمن ملی هوش مصنوعی، در این پنل گفت: «در انجمن رویدادی با عنوان جمعههای هوش مصنوعی برگزار میکنیم که جلسه آخر آن را به مدلهای زبانی هوشمند اختصاص دادیم. نتایج نشان داد بسیاری از افراد اطلاعات دقیقی درباره این موضوع ندارند.»
او ادامه داد: «برخی کارها باید به صورت بنیادی و زیرساختی توسط دولت انجام شود. اگرچه میتوان با تکیه بر مدلهای اپنسورس کارهایی انجام داد، اما شفافسازی و اطلاعرسانی درباره آنها ضروری است.»
فراهانی با انتقاد از وضعیت فعلی گفت: «شرکتهای متعددی در حوزه هوش مصنوعی فعال هستند، اما در رویدادها فقط نام دو یا سه شرکت تکرار میشود. عزمی برای هدفگذاری و جهتدهی به شرکتهای فعال در هوش مصنوعی وجود ندارد. سؤال اینجاست که چه نهادی مسئول هدایت این حوزه است؟ اگر همه بر ضرورت توسعه مدلهای بومی توافق دارند، چرا استفاده از آنها جدی گرفته نمیشود؟ توسعه این حوزه نیازمند یک اجماع و درگیری ملی است.»
بهینهسازی مدلهای زبانی هوش مصنوعی برای زبان فارسی ضروری است
سعیده ممتازی، عضو هیئتعلمی دانشگاه صنعتی امیرکبیر، در سخنان خود با تأکید بر اهمیت توسعه مدلهای بومی گفت: «اگرچه میتوان از مدلهای موجود استفاده کرد، اما زبان فراتر از واژههاست و با فرهنگ پیوند خورده است. استفاده از مدلهای غیربومی ممکن است چالشهای فرهنگی ایجاد کند.»
او ادامه داد: «یکی از مسائل کلیدی، بهینهسازی مدلها برای زبان فارسی است. برای بهرهبرداری بهتر در کشور و افزایش دقت عملکرد مدلها در پردازش زبان فارسی، باید روی بهینهسازی آنها تمرکز کنیم.»
ممتازی با اشاره به چالشهای زیرساختی در مسیر توسعه این مدلها افزود: «اگر قرار است از مدلهای زبانی استفاده کنیم، باید ابتدا زیرساختهای لازم را فراهم کنیم. بدون زیرساخت مناسب، توسعه مدلهای بومی امکانپذیر نیست.»
او در ادامه بر اهمیت محرمانگی دادهها و ضرورت توسعه مدلهای زبانی بومی تأکید کرد و گفت: «نباید بههیچوجه دادههای حساس را در اختیار مدلهای بسته قرار داد.»
ممتازی درباره تنظیمگری در این حوزه گفت: «اگر بخواهیم با کشورهای پیشرو مقایسه کنیم، باید به روند قانونگذاری در اتحادیه اروپا توجه داشته باشیم. تردیدی نیست که تدوین مقررات در این حوزه ضروری است و تجربه کشورهای اروپایی نشان میدهد که قوانین باید بهگونهای باشد که بر توسعه مسئولانه و توزیعپذیر هوش مصنوعی اثرگذار باشند.»
او با بیان اینکه در سطح جهانی مدلهای زبانی بزرگ عمدتاً توسط صنایع و نه دولتها توسعه یافتهاند، افزود: «شرکتهایی مانند متا و گوگل پیشگام این حوزه هستند و رقابت با آنها بسیار دشوار است. در کشور ما نیز باتوجهبه محدودیتهای زیرساختی و منابع، لازم است صنایع داخلی وارد این حوزه شوند.»
ممتازی تأکید کرد: «دولت باید نقش تنظیمگر را ایفا کند و از طریق حمایتهای مالی و سایر ابزارهای حمایتی، زمینه ورود بخش صنعتی به توسعه مدلهای زبانی را فراهم کند.»