Djvu یک قالب محبوب برای توزیع اسناد الکترونیکی در وب است. این مجموعه ای است از تصاویر اسکن شده در یک فایل بدون امکان تغییر داده های وارد شده در آن. برای استخراج متن از یک سند می توانید از ابزارهای ویژه استفاده کنید.
دستورالعمل ها
مرحله 1
برای شناسایی djvu و ذخیره مطالب پرونده به عنوان متن ، باید چندین مرحله را دنبال کنید و از دو برنامه استفاده کنید. اولین برنامه سند مورد نظر را اسکن کرده و آن را به تصویر یا فایل pdf تبدیل می کند. در مرحله دوم ، سند دریافت شده در برنامه های تخصصی OCR شناخته می شود.
گام 2
DjView یا DjvuOCR را روی رایانه خود نصب کنید. برای انجام این کار ، ابزار مورد نیاز را در اینترنت پیدا کنید ، آن را بارگیری کنید و فایل حاصل را اجرا کنید ، و سپس دستورالعمل های روی صفحه را دنبال کنید.
مرحله 3
به منوی برنامه نصب شده بروید و "Open djvu" یا "Decode DjVu file" را انتخاب کنید. مسیر سند مورد نظر را مشخص کرده و سپس منوی مناسب را برای تبدیل آن انتخاب کنید. مسیر ذخیره فایل را مشخص کرده و قالب مورد نظر را انتخاب کنید.
مرحله 4
ABBYY FineReader را نصب کنید. این امکان را به شما می دهد تا فایلهای تصویری را اسکن کرده ، pdf کرده و در قالب های docx ، doc ، txt و html به متن متصل کنید. می توانید این ابزار را از وب سایت رسمی ABBYY بارگیری کنید.
مرحله 5
FineReader نصب شده را با استفاده از میانبر روی دسک تاپ یا منوی شروع باز کنید. "File" - "Open" را انتخاب کرده و مسیر فایل pdf حاصل را مشخص کنید. همچنین می توانید از دکمه "Open" در نوار ابزار استفاده کنید.
مرحله 6
بعد از اینکه برنامه سند را باز کرد ، روی "اسکن" کلیک کنید. منتظر بمانید تا روند شناسایی متن و تصاویر مورد نظر به پایان برسد. سپس روی دکمه Recognize در نوار ابزار کلیک کنید تا متن مورد نظر برجسته و تأیید شود. در قسمت "زبان سند" ، در صورت لزوم ، مورد مورد نیاز را انتخاب کنید.
مرحله 7
پس از اتمام اسکن ، متن دریافت شده را در قسمت سمت راست پنجره برنامه ویرایش کنید. اگر همه چیز به درستی نمایش داده شود ، بر روی دکمه "ذخیره" کلیک کنید و قالب ذخیره را انتخاب کنید ، و همچنین پوشه ای را که می خواهید سند را در آن قرار دهید انتخاب کنید. پس از ذخیره ، می توانید فایل حاصل را با استفاده از هر ویرایشگر متن ویرایش کنید.