پایگاه خبری راه پرداخت دارای مجوز به شماره ۷۴۵۷۲ از وزارت فرهنگ و ارشاد اسلامی و بخشی از «شبکه عصر تراکنش» است. راه پرداخت فعالیت خود را از دوم اردیبهشتماه ۱۳۹۰ شروع کرده و اکنون پرمخاطبترین رسانه ایران در زمینه فناوریهای مالی، بانکداری و پرداخت و استارتآپهای فینتک است.
OCR در خدمت خودکارسازی اسناد بانکی: راهکار بومی جیبیت چه مزیتهایی دارد؟
وقتی پای خودکارکردن فرایندها به میان میآید، «زمان» و «دقت» مانند دو عقربه ثانیهشمار روی شانه کسبوکار سنگینی میکنند. فناوری OCR فناوری سادهای است که در این مسیر میتواند راهگشای بسیاری از سازمانها باشد. همین حالا صدها سند، از فرمهای افتتاح حساب گرفته تا چک و اسناد مالی، در صف اسکنکردن و ارسال قرار دارند تا پس از یک فرایند طولانی و وقتگیر، بتوان روی آنها کار کرد. در این ازدحام، فناوری OCR بهعنوان راهکاری کلیدی وارد عمل میشود.
به گزارش روابط عمومی جیبیت، OCR فناوری تبدیل هر سند چارچوبمند به داده قابلتحلیل است. در این میان برای استفاده مؤثر از این فناوری باید بدانیم زبان فارسی و نیازهای بانکی شما طراحی شده و چطور میتواند در مسیر خودکارسازی فرایندها بهسرعت با زیرساخت KYC هماهنگ شود.
در این مطلب به این پرسش پاسخ دادهایم که OCR چیست و از کجا شکل گرفته است؛ همینطور توضیح دادهایم که OCR در زبان فارسی با چه چالشهایی مواجه است؛ در پایان نیز راهکار بومی جیبیت برای OCR همه اسناد چارچوبمند را شرح دادهایم.
OCR چیست؟
فناوری OCR یا «تشخیص نوری کاراکتر» روشی برای تبدیل هر سند چارچوبمند به متنی دیجیتالی و قابلجستوجو است. این ابزار مانند عینکی هوشمند، عکس خام را میخواند و آن را سطربهسطر به کد تبدیل میکند. این فرایند همان چیزی که بخش IT برای ذخیرهسازی و تحلیل داده به آن نیاز دارد. سامانههای مدرن OCR با ترکیب پردازش تصویر، یادگیری عمیق و مدلهای زبانی، در کمتر از یک ثانیه یک سند را «میفهمند» و آن را به کد تبدیل میکنند.
OCR از کجا شروع شده است؟
تلاش برای ساخت فناوری OCR از دهه ۱۹۵۰ و تلاش ریموند کرتزویل برای کمک به نابینایان آغاز شد. در آن زمان ماشینهای اولیه فقط چند فونت چاپی محدود را تشخیص میدادند. در دهه ۱۹۹۰ الگوریتمهای تطبیق الگو دقت را تا ۹۰ درصد بالا بردند و راه را برای ابزارهای تبدیل PDF به متن هموار کردند. ورود شبکههای عصبی و Vision Transformerها پس از ۲۰۱۲ دقت را بالای ۹۷ درصد برد و حالا نسل تازه حتی ساختار سند و غلط املایی را هم اصلاح میکند.
OCR چه مزیتهایی برای کسبوکارها ایجاد میکند؟
در صنایع مالی، بانکی و فینتک، سرعت و دقت دو عامل تعیینکننده هستند. OCR، با حذف تایپ دستی و استخراج هوشمند اطلاعات، خطای ورود داده را تا ۹۰ درصد و زمان پردازش را تا ۷۰ درصد کاهش میدهد؛ علاوهبراین داده ساختاریافته خروجی با الزامات GDPR، AML و آییننامههای بانک مرکزی همخوان است؛ این فرایند بهاین معناست که لاگ دقیق، رمزنگاری و امکان ممیزی فراهم میشود. نتیجه کار هم تجربه کاربری روان، کاهش هزینه عملیاتی و البته بهدستآوردن دادههایی برای ممیزی کامل قانونی است.
مزایای دیگر OCR از این قرار است:
- اتوماسیون حسابداری: صورتحسابهای PDF را به سطرهای قابل ورود در نرمافزار مالی تبدیل میکند و هزینه برچسبگذاری دستی را صفر میکند.
- افزایش امنیت داده: خروجی ساختاریافته امکان ماسککردن اطلاعات حساس و کنترل سطح دسترسی را فراهم میکند.
- پشتیبانی چندزبانه: موتورهای مدرن OCR در یک سند متون فارسی و انگلیسی را توأمان تشخیص میدهند. این ویژگی کار روی فاکتورهای بینالمللی بسیار راحت میکند.
- تحلیل داده و BI: وقتی محتوای اسناد به داده ساختاریافته بدل شد، ابزارهای هوش تجاری میتوانند الگوهای هزینه یا ریسک را ظرف چند ثانیه بصریسازی کنند.
راهکار ocr جیبیت چیست؟
خط فارسی با حروف چسبیده، نقطهگذاری حساس و تنوع دستخط مشهور است. موتورهای بینالمللی غالباً برای زبانهای چپبهراست ساخته شدهاند و در مواجهه با حروف سهنقطهای به مشکل بر میخورند. در OCR متن فارسی سه مانع اصلی داریم: کمبود دیتاست دستنویس، تفکیک دشوار حروف متصل و الزام نگهداری داده در ایران. راهکار OCR به همه این مسئلهها پاسخ داده است:
- دیتاست اختصاصی دومیلیونی: مدل ViT جیبیت روی میلیونها سند فارسی آموزش دیده و پردازش شده است.
- لایه پیشبینی واژگان: موتور زبان طبیعی، واژه را در بستر جمله بازسازی میکند و حروف چسبیده را «جدا» میبیند.
- زیرساخت بومی امن: امکان استقرار On-Prem یا Cloud اختصاصی با رمزنگاری سطح بالا، نگرانیهای امنیتی را پاسخ میدهد.
مزیتهای OCR جیبیت چیست؟
جیبیت قابلیت OCR تمامی اسناد چارچوبمند را دارد، از سندهای مالی مانند چک گرفته تا تمامی سندهای هویتی.
- سرعت پاسخ ۰.۸ ثانیه برای هر صفحه، آنهم با نرخ موفقیت ۹۹.۹۹۹ درصد در بیش از هشت میلیون درخواست واقعی.
- ادغام آسان: با روسهای ارائه متنوع، در قالبهای API و SDK و Gateway در محصول شما پیادهسازی میشوند.
- امنیت و گواهینامهها: همه گواهینامههای لازم، ازجمله افتا و مکنا، را دارد و با رمزنگاری لایه انتقال امنیت را تأمین میکند.
- یکپارچه با احراز هویت بایومتریک: وقتی OCR، تطبیق چهره و Liveness در یک پلتفرم کنار هم باشند، مسیر KYC بیاصطکاک میشود؛ کاربر فقط یک عکس میگیرد و باقی مسیر را هوش مصنوعی جیبیت انجام میدهد.
نکته مهم اینجاست که OCR جیبیت صرفاً به موارد گفتهشده محدود نیست؛ جیبیت این امکان را دارد تا تمامی سندهای چارچوبمند، از هر نوعی، را براساس نیاز کسبوکار OCR کند.
OCR در عصر هوش مصنوعی، دیگر یک «امکان اضافه» نیست؛ پیشران تجربه مشتری و کلید انطباق قانونی و البته یکی از عوامل مسیر افزایش درآمد است؛ برای مثال، یک تسهیلاتیار میتواند با اتصال به Jibit OCR زمان ثبتنام را به کمترین زمان ممکن برساند و نرخ تکمیل فرم را بهشکل چشمگیری بالا برد؛ این اعداد مستقیماً به افزایش درآمد ختم میشوند.
OCR جیبیت، با داشتن قیمت رقابتی، زیرساخت امن و امکان قرارگرفتن در مسیر خودکارکردن فرایندهای احراز هویت بایومتریک، میانبری است تا دادههای ساختاریافته بهسرعت آماده استفاده باشد.