Или положим, есть многостраничный PDF скан книги (с поиском по строкам). Весь разворот (2 странички) на одном листе. Но по краям остаются большие и некрасивые черные поля - тень от обложки и т.д.
Как эту лишние куски убрать? И отцентрировать страницы, если они были отсканены немного неровно и под углом. Опять же, чтобы сохранился поиск по документу.

Пользуюсь самым примитивным сканером, FineReader и АкробатРидер. Сканирую в многостраничный PDF.
Сложность еще в том, что книгу надо отсканить и отдать хозяину довольно быстро. Т.е сразу поштучно медитативно обрабатывать каждую страницу из 600 не вариант. Нужно сначала сосканировать все (Какой прогой и в какой формат?) А потом уже заниматься доведением до ума - убирать поля, выравнивать странички...

Подозреваю, что существует для этого какая-то специальная прога, в сети вижу много очень аккуратных пдф-книг.
Но как?

Пример скрина странички из скана в ПДФ:


@темы: Поиск ПО, Windows 7

Комментарии
16.02.2014 в 18:54

UPD
Вопрос решен, все заработало :)
Версия 1)
В просмотровике DJVU не был переключен режим листать/выделить текст :facepalm:


Версия 2)
1.Помогла установка самой последней версии FR-11, заточенной во много на скан книг в DJVU
2. Прогоняю те первоначальные ТИФФы через ФР-11, обязательно сразу с распознаванием нужного языка(ов).
3. "Сохраняю как" DJVU. Сохраняется сразу с текстовым слоем.

Версия 3) Если и это не помогло
1. Скачать программу DjvuOCR v2.4 beta4 full (Важно, она работает только ABBYY FineReader 11.0.102.583 и выше, но никак не ниже 583, о чем напоминает сама программа)
2. Прогнать через неё полученный в этот ФР-11 (версии 583) DJVU-файл без распознанного слоя. Слой должен появиться.
16.02.2014 в 18:54

UPD
Вопрос решен, все заработало :)
Версия 1)
В просмотровике DJVU не был переключен режим листать/выделить текст :facepalm:


Версия 2)
1.Помогла установка самой последней версии FR-11, заточенной во много на скан книг в DJVU
2. Прогоняю те первоначальные ТИФФы через ФР-11, обязательно сразу с распознаванием нужного языка(ов).
3. "Сохраняю как" DJVU. Сохраняется сразу с текстовым слоем.

Версия 3) Если и это не помогло
1. Скачать программу DjvuOCR v2.4 beta4 full (Важно, она работает только ABBYY FineReader 11.0.102.583 и выше, но никак не ниже 583, о чем напоминает сама программа)
2. Прогнать через неё полученный в этот ФР-11 (версии 583) DJVU-файл без распознанного слоя. Слой должен появиться.