راه پرداخت
رسانه فناوری‌های مالی ایران

اپلیکیشن ویرا، دستیار هوش مصنوعی ویژه فارسی‌زبانان

مدیر محصول اپلیکیشن ویرا در گفت‌وگویی با راه پرداخت به بررسی فعالیت‌های مرکز تحقیقات هوش مصنوعی پارت برای اپلیکیشن هوش مصنوعی ویرا و سرویس‌های مختلف و برنامه‌های آن پرداخت

زمانی تنها در داستان‌ها و فیلم‌های علمی تخیلی بود که تصورات ما از هوش مصنوعی شکل می‌گرفت؛ ربات‌هایی که فکر می‌کردند، ماشین‌هایی که تصمیم می‌گرفتند. اما حالا در چند سال اخیر این تخیلات جای خود را به واقعیتی داده‌اند که شاید حتی از پیش‌بینی‌های گذشته شگفت‌آورتر به نظر برسد. هوش مصنوعی به‌عنوان ابر قدرتی ظهور کرده است که تنها در کشورهای پیشرفته قدم نمی‌زند، بلکه ردپای آن در اکثر نقاط جهان به چشم می‌خورد.

در دهه‌های قبل نیروی انسانی را رکن اساسی تمام فعالیت‌ها می‌دانستیم. هیچ کارخانه‌ای بدون کارگران، هیچ اداره‌ای بدون کارکنان و هیچ سازمانی بدون مدیران انسانی وجود نداشت. اما امروز غیر از انسان فناوری‌هایی هستند که می‌فهمند، یاد می‌گیرندو کار می‌کنند.کسی نمی‌تواند پیش‌بینی کند که جهان مدرن در حال کنارگذاشتن انسان‌هاست یا این فرصتی است تا انسان نقش خود را بازتعریف کند و به خلاقیت‌های دیگری دست پیدا کند.

ایران نیز از این موج فناوری بی‌بهره نمانده است. باوجود چالش‌های زیرساختی و فنی، کم‌کم حرکت به‌سوی بومی‌سازی و توسعه هوش مصنوعی در ابعاد کوچک‌تری به چشم می‌خورد و نمونه‌هایی از آن در ابزارهای نوآورانه‌ای که برای فارسی‌زبانان طراحی شده، دیده می‌شود.

یکی از این پیشگامان اپلیکیشن ویرا است که یک دستیار هوش مصنوعی به زبان فارسی است، و خدماتی در این حوزه ارائه می‌دهد. هرچند این برنامه هنوز جای توسعه زیادی دارد، اما در حال تکمیل و بزرگ‌شدن است.

 در همین راستا برای آشنایی بیشتر با کارکردهای اپلیکیشن ویرا گفت‌وگویی با علی منصوری مدیر محصول اپلیکیشن ویرا داشتیم.


 بزرگ‌ترین مرکز تحقیقات هوش مصنوعی در کشور


شرکت پارت به‌عنوان یک مرکز پیشرو در حوزه تحقیقات هوش مصنوعی فعالیت می‌کند و از دو بخش اصلی تشکیل شده است که شامل مرکز تحقیقات هوش مصنوعی و گروه نرم‌افزاری است.

این شرکت هم از نظر تعداد محصولات و هم از نظر نیروی انسانی، بزرگ‌ترین مرکز تحقیقات هوش مصنوعی در کشور محسوب می‌شود.

به گفته علی منصوری در گروه نرم‌افزاری بیش از ۵۰۰ نیروی متخصص فعالیت می‌کند و در بخش مرکز تحقیقات هوش مصنوعی نیز با بیش از ۲۵۰ نیروی انسانی دارند.

مرکز تحقیقات هوش مصنوعی پارت محصولات متنوعی را توسعه داده است که بسیاری از آن‌ها به‌صورت سرویس‌های ابری از طریق سامانه‌های مختلف ارائه می‌شوند.


ارائه سرویس‌های کاربردی هوش مصنوعی در اپلیکیشن ویرا


علی منصوری درباره هدف و نحوه شروع اپلیکیشن ویرا توضیح داد و گفت:«از سال گذشته، تصمیم گرفتیم محصولی را توسعه دهیم که به طور مستقیم سرویس‌های کاربردی هوش مصنوعی را به عموم مردم ارائه کند. هدف اصلی ما این بود که محصولی بسازیم که در آینده به پرچم‌دار بازار هوش مصنوعی در کشور باشد و برند ویرا به شناخته شده ترین برند بازار هوش مصنوعی تبدیل شود.»

او بیان کرد که این اپلیکیشن از طریق بازار و مایکت قابل‌دانلود است و گفت:«به دلیل محدودیت‌های ناشی از فیلترینگ، در ابتدا تمرکز ما بر روی انتشار اپلیکیشن در اپ‌استورهای داخلی بود، اما در آینده قصد داریم آن را در اپ‌استورهای خارجی نیز قرار دهیم. همچنین به‌زودی کاربران می‌توانند از طریق وب‌سایت به‌صورت مستقیم به این اپلیکیشن دسترسی داشته باشند. فاز بعدی توسعه محصول، مربوط به مولتی پلتفرم کردن آن است.»

 به گفته او این محصول به‌تدریج در حال رسیدن به تعداد قابل‌توجهی از کاربران است. در حال حاضر بیش از ۸۰۰ هزار نصب در کافه‌بازار، بیش از ۴۰۰ هزار نصب در مایکت و حدود ۱۰۰ تا ۲۰۰ هزار نصب دیگر خارج از این دو پلتفرم داشته‌اند که در مقایسه با نزدیک‌ترین رقیب داخلی خود، فاصله قابل‌توجهی دارند.

او بیان کرد که بعد از خارج‌شدن از مرحله آزمایشی خدمات پایه همچنان به‌صورت رایگان در دسترس خواهد بود، اما خدمات پیشرفته‌تری با تعرفه برای کاربران حرفه‌ای ارائه خواهند داد.

 به‌عنوان‌مثال، کاربرانی که نیاز به پردازش سریع‌تر دارند، یا به ویژگی‌های خاص و حرفه‌ای‌تر علاقه‌مندند، می‌توانند به سرویس‌ها با دسترسی محدودتری دست پیدا کنند. این خدمات پیشرفته در قالب اشتراکی به کاربران عرضه خواهد شد.


 سرویس آوانگار، تبدیل گفتار به متن


منصوری با اشاره به سرویس آوانگار در اپلیکیشن ویرا افزود:«حدوداً آبان‌ماه سال گذشته بود که اولین نسخه محصول خود را باعرضه سرویس آوانگار منتشر کردیم. سرویس آوانگار در واقع سرویسی است که از سال ۹۸ توسعه آن آغاز شده و به‌عنوان یک سرویس تبدیل گفتار به متن یا همان تایپ صوتی شناخته می‌شود. این سرویس ویژگی‌های منحصربه‌فردی دارد.»

او توضیح داد که برای اینکه این سرویس بتواند با گویش‌های مختلف فارسی سازگار باشد و لهجه‌های متنوع را پشتیبانی کند، بیش از ۱۰ هزار ساعت صوت از نقاط مختلف کشور با گویش‌های مختلف جمع‌آوری و توسط مرکز تحقیقات هوش مصنوعی پارت مورداستفاده قرار گرفت.

منصوری ادامه داد:«این داده‌ها برای آموزش مدل به کار رفت. به طور فنی، این مدل از ترکیب یک مدل زبانی و یک مدل آکوستیک ساخته شده است. مدل ابتدا صوت ورودی را تحلیل کرده و سپس آن را به مدل زبانی ارسال می‌کند. مدل زبانی با درک ساختار جملات، متن نهایی را تولید می‌کند.»


 سرویس آواشو، تبدیل متن به گفتار


منصوری ادامه داد:«پس از این مرحله، ما شروع به عرضه سایر سرویس‌های پرکاربرد هوش مصنوعی کردیم؛ سرویس‌هایی که بیشترین جستجو را دارند و برای عموم مردم نیز بسیار مفید هستند.»

مدیر محصول اپلیکیشن ویرا درباره سرویس آواشو گفت:«سرویس بعدی که معرفی کردیم، برعکس سرویس قبلی که تبدیل گفتار به متن بود، سرویس تبدیل متن به گفتار است که آن را «آواشو» نام‌گذاری کرده‌ایم. این سرویس نیز از سال ۹۸ توسعه آن آغاز شده و در مقایسه با رقبای خود، صدای بسیار طبیعی‌تری دارد و در آینده گوینده‌های جدیدی به آن اضافه خواهد شد. همچنین، تعداد گوینده‌های باکیفیت بیشتری به این سرویس افزوده خواهد شد و قابلیت‌های جذاب‌تری برای کاربران ارائه خواهد کرد. به طور مثال، کاربران قادر خواهند بود تا سرعت و لحن خوانش متن را تنظیم کنند.»

او اضافه کرد:«اگر بخواهیم ویژگی‌های فنی این سرویس را بررسی کنیم، باید بگویم که متخصصان ما این سرویس را با زبان سی‌پلاس‌پلاس توسعه داده‌اند. این در حالی است که بسیاری از رقبای داخلی این سرویس‌ها از فریم‌ورک پایتون استفاده کرده‌اند. این انتخاب فنی موجب شده که مدل ما دارای سرعت پردازش بسیار بالاتری باشد.»


 سرویس ایماژ، تبدیل متن به عکس


منصوری با اشاره به سرویس تبدیل عکس توضیح داد:«در مرحله بعدی، ما سرویس تولید عکس را راه‌اندازی کردیم که یکی از سرویس‌های پرکاربرد و محبوب در دنیای هوش مصنوعی است و به آن تبدیل متن به عکس می‌گویند. سرویس ایماژ بر اساس همین مبنا از پارسال توسعه داده شد.»

به گفته او پس از اینکه اپلیکیشن ویرا با استقبال خوبی مواجه شد، متخصصان مرکز هوش مصنوعی پارت به توسعه یک سرویس ویژه برای محصول ویرا پرداختند. این سرویس که از ترکیب مدل‌های زبانی داخلی خودمان و مدل‌های اپن‌سورس خارجی ساخته شده، به بازار عرضه شد.

منصوری تأکید کرد که نسخه‌های این سرویس به طور مداوم در حال بهبود هستند و به‌زودی نسخه جدید این محصول به کاربران ارائه خواهد شد و گفت:«خروجی‌های این نسخه کیفیت قابل‌توجهی دارند و قادرند با محصولات خارجی در سطح جهانی رقابت کنند.»

منصوری به ویژگی هایی که در آینده به این سرویس افزوده خواهد شد اشاره کرد و گفت:«سرویس ایماژ ویژگی‌های منحصربه‌فردی را نیز ارائه خوا‌هد کرد. به‌عنوان‌مثال، کاربران می‌توانند تصویری از چهره دلخواه خود ایجاد کنند. همچنین، ما در حال شخصی‌سازی این سرویس برای کاربران فارسی‌زبان هستیم تا بتوانیم تصاویر چهره‌های ایرانی را نیز تولید کنیم، ویژگی‌ای که بسیاری از مدل‌های خارجی قادر به انجام آن نیستند.»


 سرویس هماهنگ، تغییر و تقلید صدا


یکی از سرویس‌های رایج در دنیای هوش مصنوعی تغییر صدا یا تقلید صدا است که در اپلیکیشن ویرا نیز قابل‌مشاهده است.

منصوری درباره این سرویس گفت:«ما مشاهده کردیم که بسیاری از سرویس‌های خارجی در زمینه تغییر صدا یا از زبان فارسی به‌درستی پشتیبانی نمی‌کنند، یا چهره‌ها و سلبریتی‌های ایرانی را ندارند. به همین دلیل، ما تصمیم گرفتیم این کمبود را پوشش دهیم و سرویس «هماهنگ» را معرفی کنیم.»

او تأکید کرد که این سرویس تابه‌حال مشابه داخلی در بازار نداشته و قابلیت این را دارد که کاربران صدای خود را به صدای افراد معروف ایرانی تبدیل کنند.

همچنین گفت:«به‌زودی گویندگان حرفه‌ای بیشتری به سرویس اضافه خواهند شد، تا کاربرانی که نمی‌خواهند صدای خود را روی ویدئوها استفاده کنند، بتوانند با استفاده از این سرویس صدای گویندگان حرفه‌ای را انتخاب کنند.»

مدیر محصول اپلیکیشن ویرا با اشاره به اینکه برخی سرویس های این برنامه در فاز تولد قرار دارد گفت:«در دنیای هوش مصنوعی، این نوع سرویس‌ها معمولاً کمتر از یک یا یک سال و نیم است که ظهور کرده‌اند، به همین دلیل ممکن است در نسخه‌های اولیه کیفیت سرویس کمی ضعف داشته باشد. اما همکاران ما در حال کار بر روی بهبود این سرویس هستند و امیدواریم که به‌زودی کیفیت آن به طرز چشمگیری افزایش یابد.»


 چت‌بات دانیار


منصوری در ادامه به سرویس دانیار اشاره کرد و گفت:«چت‌بات‌هایی مانند چت‌جی‌پی‌تی باوجود توانمندی‌های زیادی که دارند، با مشکلاتی نظیر فیلترشکن روبه‌رو هستند و مدل‌های زبانی که آموزش می‌دهند، هدف اصلی‌شان پوشش کاربران فارسی‌زبان نیست؛ بنابراین، ما تصمیم گرفتیم پروژه اضافه‌کردن چت‌بات «دانیار» را به ویرا آغاز کنیم. هدف ما این است که بزرگ‌ترین چت‌بات تجاری فارسی را در اینجا عرضه کنیم.»

مدیر محصول اپلیکیشن ویرا ادامه داد:«ما در این بخش از ترکیب مدل‌های جی‌پی‌تی و مدل‌ زبانی خودمان به نام درنا استفاده می‌کنیم. این مدل زبانی را خودمان توسعه داده‌ایم و به طور مستمر در حال بهبود آن هستیم.»

او تأکید کرد که به‌مرور، دقت پاسخ‌های مدل زبانی ما نسبت به مدل‌های خارجی مانند جی‌پی‌تی افزایش خواهد یافت.

او افزود:«هدف ما این است که کاربران فارسی‌زبان تجربه کاربری بهتری نسبت به چت‌بات‌های خارجی در چت‌بات دانیار داشته باشند.»


 توسعه خدمات برای کاربران ویرا در آینده


این مرکز برنامه‌ای که برای ویرا در آینده در نظر دارد شامل افزودن چند سرویس دیگر در حوزه هوش مصنوعی مولد است. برای مثال اپلیکیشن های مانند پیکس‌آرت که در بازار ایران استقبال خوبی داشته‌اند و به ویرایش تصویر می‌پردازند.

علی منصوری در این باره توضیح داد:«ما قصد داریم این سرویس‌ها را برای کاربران فارسی‌زبان شخصی‌سازی کنیم و به بازار عرضه کنیم و مجموعه‌ای از سرویس‌های جامع را ارائه دهیم که به کاربران این امکان را بدهد تا با کمک هوش مصنوعی، هر کاری که می‌خواهند با تصاویر انجام دهند.»

او ادامه داد:«کاربران بدون نیاز به دانش تخصصی مانند کار با نرم‌افزار فتوشاپ، بتوانند تصاویر خود را در بخش پالت ویرایش کنند. این بخش هم‌اکنون در برنامه موجود است و به کاربران اجازه می‌دهد تصاویر را به‌راحتی و به هر شکلی که می‌خواهند ویرایش کنند.»

مدیر محصول ویرا در ادامه به سرویس دیگری به نام نویسه ‌نگار اشاره کرد که قابلیت استخراج متن از داخل تصاویر یا فایل‌های PDF را دارد. یکی از ویژگی‌های این سرویس این است که می‌تواند ساختار متن را حفظ کرده و آن را به فرمت‌هایی مانند فایل ورد یا فایل متنی تبدیل کند.

منصوری اضافه کرد:«بسته به نیاز کاربران، افزودن دستیار صوتی به برنامه نیز در چشم‌انداز ما قرار دارد. این قابلیت به کاربران این امکان را می‌دهد که با ارائه فرمان صوتی، تصمیمات روزمره خود را به‌راحتی انجام دهند.»


 تأثیر محدودیت‌های زیرساختی بر هوش مصنوعی کشور


یکی از چالش‌های فنی اصلی که شرکت‌های خصوصی فعال در حوزه هوش مصنوعی با آن مواجه هستند، مسئله GPU یا پردازنده‌های گرافیکی است. در کشور ما، منابع GPU محدود است و بسیاری از سرویس‌های باکیفیتی که می‌خواهند عرضه کنند به پردازنده‌های گرافیکی نسل بالا نیاز دارند.

این منابع محدود در اختیار تعداد کمی از شرکت‌ها هستند و هزینه اجاره آن‌ها نیز بسیار بالا است. شرکت پارت از شرکت‌های بزرگ کشور محسوب می‌شود و تاکنون منابع گرافیکی موردنیاز خود را تأمین کرده است. بااین‌حال، با افزایش تعداد کاربران، طبیعتاً این شرکت نیز با چالش‌ها جدی‌تری مواجه خواهد شد.

علی منصوری در این باره گفت:«مدیران شرکت تدابیری اندیشیده‌اند و ما توانسته‌ایم در مرکز هوش مصنوعی و نرم‌افزاری خود، گروهی از متخصصان جوان و علاقه‌مند به این حوزه را گرد هم آوریم. این افراد باعلاقه و اشتیاق زیادی به کار در زمینه هوش مصنوعی پرداخته‌اند و علی‌رغم تمام محدودیت‌ها، باز هم باور داریم که توسعه محصول فارسی برای کاربران ایرانی اهمیت زیادی دارد.»

منصوری می‌گوید که بسیاری از افراد می‌پرسند چرا باید هزینه کنیم برای توسعه محصولی که مشابه خارجی آن وجود دارد، اما با مشاهده استقبال گسترده از محصولات ما در این یک سال و نیم گذشته، متوجه شدیم که کاربران فارسی‌زبان به محصولاتی نیاز دارند که متناسب با محیط و نیازهای آن‌ها باشد.

 به گفته او مشکلاتی مانند فیلترینگ و دشواری دسترسی به سرویس‌های خارجی باعث می‌شود که کاربران به محصولات داخلی روی بیاورند.


 تأثیر هوش مصنوعی بر بازار کار


علی منصوری معتقد است که هوش مصنوعی، محصولی توسعه‌ای است که خود انسان‌ انجام داده است و قطعاً نمی‌تواند جای انسان را بگیرد.

او در این باره می‌گوید:«بسیاری از مشاغل تحت‌تأثیر این فناوری قرار خواهند گرفت. به‌عنوان‌مثال، مشاغل تولید محتوا ممکن است تغییرات زیادی را تجربه کنند. افرادی که در این زمینه فعالیت می‌کنند و به‌ویژه متخصصانی که در سطح جونیور هستند و ممکن است توانمندی و خلاقیت بالایی نداشته باشند، احتمالاً در آینده شغل خود را از دست خواهند داد. اما متخصصانی که در سطح حرفه‌ای فعالیت می‌کنند و توانایی کار باهوش مصنوعی را دارند، همچنین افرادی که خود خلاقیت و ابتکار دارند، به‌طورقطع از تکنولوژی‌های هوش مصنوعی پیشی خواهند گرفت و همچنان جایگاه خود را حفظ خواهند کرد.»


 اهمیت فرهنگ‌سازی در حوزه هوش مصنوعی


منصوری بیان کرد که هر تکنولوژی مانند لبه تیغ است که می‌تواند هم جنبه‌های مثبت و هم منفی داشته باشد. اما زمانی که یک تکنولوژی وارد زندگی مردم می‌شود، دیگر به بخشی از آن زندگی تبدیل می‌شود و جایگاه خود را در آن حفظ می‌کند.

او افزود:«معتقدیم هوش مصنوعی نه‌تنها در ایران، بلکه در سطح جهانی به‌عنوان یک پدیده نوظهور شناخته می‌شود و احتمالاً سال‌ها به فرهنگ‌سازی نیاز دارد. هدف ما این است که در این مسیر، فرهنگ استفاده از هوش مصنوعی را در کشور خود توسعه دهیم.»

منصوری با انتقاد از توجه نداشتن حاکمیت به موضوع هوش مصنوعی گفت:«در حال حاضر در دنیا شاهد سرمایه‌گذاری‌های بزرگی در حوزه هوش مصنوعی هستیم. آمریکا اعلام کرده که تا سال ۲۰۳۰ قصد دارد حدود ۱۵۰ میلیارد دلار در این حوزه سرمایه‌گذاری کند، درحالی‌که کشورهای اطراف مانند عربستان سعودی هم از رقم‌هایی حدود ۱۰۰ میلیارد دلار صحبت می‌کنند. اما در کشور ما فاصله زیادی با این ارقام وجود دارد و حتی اعداد محدودتری در حدود چند صد میلیون دلار مطرح می‌شود. اگر در کشور ما نیز به این حوزه سرمایه‌گذاری صورت گیرد، باتوجه‌به استعدادهای فراوانی که در ایران وجود دارد، می‌توانیم شاهد پیشرفت‌های چشمگیری باشیم.»

علی منصوری در پایان بیان کرد که پیش‌بینی می‌شود در آینده هوش مصنوعی به‌عنوان یک ابزار قدرت برای کشورها عمل کند و گفت:«امیدواریم که در آینده، توجه بیشتری به این حوزه در کشور ما معطوف شود و فرهنگ استفاده از آن در جامعه رواج پیدا کند. در این صورت، شاهد ورود شرکت‌های بیشتری به این حوزه خواهیم بود و محصولات مشابه ویرا را در بازار ایران خواهیم دید.»

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.