Skip to content
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
33 changes: 16 additions & 17 deletions addon/doc/uk/readme.md
Original file line number Diff line number Diff line change
Expand Up @@ -8,15 +8,18 @@

## Інформація

Цей додаток використовує безкоштовну систему Tesseract OCR з відкритим джерельним кодом для оптичного розпізнавання символів у файлі зображення, PDF, JPG, TIF чи іншому, без необхідності його відкривати.
Цей додаток використовує безкоштовну систему Tesseract OCR з відкритим джерельним кодом для оптичного розпізнавання символів у файлі зображення, PDF, JPG, TIF чи іншому, без потреби його відкривати.
Текстовий файл буде розміщено в тій самій папці з тим самим іменем, що й оригінальний файл, але з розширенням .TXT.
Він також використовує wia-cmd-сканер, щоб отримати доступ до сканерів із підтримкою WIA та виконати оптичне розпізнавання для паперового документа.
Finally, it also can get the accessible text from an accessible PDF.
В налаштуваннях NVDA буде створено категорію TesseractOCR, де можна встановити мови, які будуть використовуватися при розпізнаванні, а також типи документів, що розпізнаються.
Також доступний список вибору кількох мов розпізнавання для завантаження та встановлення. Таким чином, тепер додаток надається початково лише з англійською та португальською мовами розпізнавання.
Щоб могти розпізнавати файли PDF, захищені паролем, ви можете позначити в цьому діалозі прапорець «Запитувати пароль».
Якщо ви позначили цей параметр, а PDF-файл не має пароля, просто натисніть Enter у діалозі із запитом пароля.
- Виберіть сканер, який буде використовуватися;
- встановіть роздільну здатність сканера в діапазоні від 150 до 400 dpi.
Результат показується у файлі з назвою OCR.txt, який розміщено в папці «Документи» облікового запису користувача.
Нарешті, він також може видобувати доступний текст з доступних PDF-файлів, використовуючи XPDF tools.
В налаштуваннях NVDA буде створено категорію TesseractOCR, де можна налаштувати такі параметри:
- мови, які будуть використовуватися при розпізнаванні;
- типи документів, що розпізнаються;
- запитувати чи не запитувати пароль до PDF-файлу. Якщо ви позначили цей параметр, а PDF-файл не має пароля, просто натисніть Enter у діалозі з запитом пароля;
- встановити роздільну здатність сканера в діапазоні від 150 до 400 dpi;
- параметр для виявлення орієнтації паперу;
- параметр, який дозволяє вказати, використовувати чи ні звукові сигнали для сигналізування про перебіг процесу.

За винятком англійської й португальської мов, які вже включені в додаток, інші мови буде завантажено та встановлено, коли ви виберете мову, якої ще немає в додатку.
Зауважте, що зі збільшенням кількості вибраних мов, процес розпізнавання триватиме довше.
Expand All @@ -28,23 +31,20 @@ Finally, it also can get the accessible text from an accessible PDF.
## Гарячі клавіші

Початково використовуються такі команди:
Windows+Control+w — для сканування та розпізнавання документа через сканер;
Windows+Control+r — для розпізнавання вибраного документа;
Windows+Control+w — для сканування та розпізнавання документа через сканер.
Windows+Control+t - To get the text from an accessible PDF;
Windows+Control+c - для скасування процесу сканування.
Windows+Control+t — для отримання тексту з доступних PDF-файлів;
Windows+Control+c — для скасування процесу сканування.
Зверніть увагу: комбінація повинна бути застосована до того, як з'явиться діалог із запитом про те, чи хочете ви відсканувати більше сторінок!

Потім просто зачекайте, поки ocr.pdf відкриється з розпізнаним текстом.
Якщо ви хочете зберегти розпізнаний текст, не забудьте зберегти документ під іншим ім'ям та в іншому місці, тому що всі файли в тимчасовому каталозі видаляються на початку наступного оптичного розпізнавання!
Потім просто зачекайте, поки відкриється текстовий файл із розпізнаним текстом.

Ці команди можна змінити в діалозі «Жести вводу» в розділі «TesseractOCR».


## Відомі проблеми

* У деяких системах можливо, що додаток не працює через помилку comtypes...
На деяких комп’ютерах достатньо перейти до папки temp і видалити папку comtypes_cache.
* При виборі опції «Різне»» у списку "Тип документів" розпізнаний текст, ймовірно, відображається з великою кількістю порожніх рядків.
* При виборі параметра «Різне»» у списку «Тип документів» розпізнаний текст, ймовірно, відображається з великою кількістю порожніх рядків.
Це відома проблема з Tesseract, і не витрачаючи багато часу на обробку, автор поки що не знайшов рішення. Але він ще не здався!


Expand Down Expand Up @@ -163,7 +163,6 @@ Windows+Control+c - для скасування процесу скануван
* Йоруба



## Підтримувані типи зображень

Цей додаток підтримує такі типи файлів:
Expand Down
Loading