Вы здесьПроблемы и приемы OCR: dewarp
Опубликовано ср, 06/05/2009 - 04:06 пользователем Ulenspiegel
Если при сканировании книжка не прижата плотно к предметному стеклу, участки строк, находящиеся вблизи разворота, искривляются. При сильном искривлении (заползание на уровень соседней строки) программы распознавания приходят от таких червячков в недоумение. Не знает ли всемогущий All алгоритмов и (что еще лучше) готовых программ для борьбы с таким безобразием ?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 16 часов
Isais RE:Семейственность в литературе 1 день Isais RE:Древний Рим. Подборка книг 1 день Саша из Киева RE:"Экс" и "нео": разноликие правые 3 дня medved RE:Предупреждение: "зеркала" флибусты 2 недели Isais RE:Соседи 2 недели babajga RE:Как сова отправилась в отпуск 3 недели Саша из Киева RE:Горящие паруса 4 недели Саша из Киева RE:Подвиг героев - судьба страны. МНР: люди и годы 1 месяц commodore RE:Письма 1 месяц Саша из Киева RE:Три минуты истории 1 месяц nehug@cheaphub.net RE:Как бы с этим побороться и побороть? 1 месяц Саша из Киева RE:Книги на латышском языке 1 месяц stevecepera RE:Список современных французских писателей? 2 месяца etorus2008 RE:Отв: Помогите найти книгу по описанию 2 месяца lemma7 RE:Чёрный нимб и другие истории, исполненные неизъяснимого ужаса 2 месяца Wedmak RE:Помогите найти!.. #2 2 месяца sem14 RE:Координация сканирования и вычитки 2 месяца Впечатления о книгах
мила7 про Куно: Повенчанные временем [litres] (Любовная фантастика)
15 07 Хорошо написано. Мне понравилось. Оценка: отлично!
Lena Stol про Видум: Договор (Фэнтези, Попаданцы, ЛитРПГ, Самиздат, сетевая литература)
15 07 Не понравилось - сюжет почти не двигается, герой занят прокачкой себя любимого. Надоело перечисление навыков, что за чем следует, что ещё надо прокачать и т.д. Оценка: плохо
Саша из Киева про Алексеев: О русской доблести и славе (Историческая проза, Детская проза, История, О войне)
14 07 Как жаль, что Сергей Петрович Алексеев не написал об Александре Невском!
StrelaVV про Зазеркалье [Шарапов]
14 07 Первая книга очень понравилась, читать было интересно и даже страшно, сразу вспомнилось детство, где ночью виделись призраки, бандиты и покойники
Isais про Нури: Дочь ведьмы [СИ : Литрес] (Ужасы)
13 07 Старательно. По правилам. Неубедительно. Читал с полуночи до двух ночи, так и не проникся. Чего-то недоложили в этот борщевой набор. Пластмассово как-то. Оценка: неплохо
nik_ol про Луганцева: Чисто убойное дело [litres] (Иронический детектив, Детективы: прочее)
13 07 А что, Татьяна больше не пишет книжки?... Жду не дождусь новых, люблю читать перед сном и в транспорте, для разгрузки мозга! Оценка: отлично!
Wild_XC70 про Дроздов: Невеста инопланетянина (Альтернативная история, Космическая фантастика, Самиздат, сетевая литература)
12 07 Дождался проды. Лучше бы её не было. Похоже Дроздов перегорел. Оценка: плохо
mysevra про Каверин: Два капитана [с непрозрачными иллюстрациями] (Советская классическая проза, Приключения: прочее)
12 07 Поймала себя на том, что завидую главному герою. «Если вы думаете, что приключения опасны, попробуйте рутину – это смертельно». Оценка: отлично!
mysevra про Свечин: Выстрел на Большой Морской [litres] (Полицейский детектив, Исторический детектив)
12 07 Автор прекрасно ориентируется в датах, чинах и наградах, перечисляя их в восхитительном упоении. Неожиданно отзывается о правящей на тот момент династии. Да и вообще, как приключенческий роман, книги этой серии просто превосходны. ……… Оценка: хорошо
mysevra про Чекмаев: Анафема (Боевая фантастика)
12 07 Как справочник по работе сект – прекрасно. Как художественный текст – депрессивно-занудственно с претензией. Оценка: неплохо
Саша из Киева про Толочко: Древний Киев (История)
12 07 Спасибо большое! Ещё бы издание этой книги 1976 года. У меня было именно оно. |
Комментарии
Отв: Проблемы и приемы OCR: dewarp
Насчет алгоритмов не знаю (хотя Файнридер вроде что то делает) но как вариант решения за $500 смотри тут: http://lib.rus.ec/node/131676
Отв: Проблемы и приемы OCR: dewarp
Э нет, кривой скан в данном случае - уже данность :( В смысле - готовый DJVU
Отв: Проблемы и приемы OCR: dewarp
В FineReader 8, которым я пользуюсь, в настройках "1. Сканировать/открыть" есть опция "Устранить искажение строк". Очень даже помогает.
В 9-й версии наверняка тоже есть.
Отв: Проблемы и приемы OCR: dewarp
Есть , "streighten lines" и "desкew" - кто из них кто уже не помню за ненадобностью.
можно на страницу провести операцию а можно применить ко всем , но я бы советовал постранично ибо некоторые страницы наоборот как раз портит.
Отв: Проблемы и приемы OCR: dewarp
Да вы чего, издеваетесь, панове ?! deskew - есть, это исправление перекоса (когда книжку положили непараллельно границам окна),
Отв: Проблемы и приемы OCR: dewarp
deskew - это совсем из другой оперы.
Возьмите ложку. Положите ее на стол под уголм 45градусов к краю. Исправьте положение ложки. А теперь СОГНИТЕ ложку поплам и попрубуйте исправить перекос относительно края тем же способом
Отв: Проблемы и приемы OCR: dewarp
В моем случае ложка выглядит примерно так: Я думал, что это именно warp
Отв: Проблемы и приемы OCR: dewarp
Я не издеваюсь , я же сказал что не помню, значит не deskew а второй - staighten text lines:
Отв: Проблемы и приемы OCR: dewarp
Теоретически в 8 и 9 Файнридерах имеется встроенный механизм коррекции:
На практике, выработанной на 4м ещё файнридере, лучшим удалителем искажений в зоне разворота служит левая рука, прижимающая книгу к сканеру в момент сканирования... :)
...Каких либо отдельных программ, позволяющих выпрямлять строки я никогда не встречал. Теоретически это можно проделать в фотошопе, но... страницу, пусть две. А сотню? Сомневаюсь.
Отв: Проблемы и приемы OCR: dewarp
АААА!!!! Спасибо, Jolly Roger - ака, и вправду есть! Они его спрятали неочевидным образом.
Если кто-нибудь еще на эти грабли наступит, тулза работает и выглядит вот так:
Отв: Проблемы и приемы OCR: dewarp
Дык а я о чем ?
Отв: Проблемы и приемы OCR: dewarp
Виноват, подумал, что она в опциях сканирования сидит.
Отв: Проблемы и приемы OCR: dewarp
Вроде бы именно такие искривления исправляет Book Restorer. Подробности на ru-board.
Отв: Спасибо!
Век живи - век учись... Действительно, есть и отдельная программа под задачу:
http://djvu-soft.narod.ru/scan/curved_text.htm
...как я понимаю, у неё настроек побогаче будет. Видимо, для сложных случаев может оказаться предпочтительней.
Отв: Проблемы и приемы OCR: dewarp
На сорсфорже была утилитка unpaper - она, кажется, умела автоматически делать обработку сканированных страниц, выравнивая картинки, зачищая поля и выравнивая интенсивность фона. Заодно резала на страницы, если сканировался разворот.
Отв: Проблемы и приемы OCR: dewarp
http://unpaper.berlios.de
А строки, AFAIK, не ровняет.
Но вобщем ничего, пользуюсь периодически.
Отв: Проблемы и приемы OCR: dewarp
Если нужно подготовить скан для создания дежавю, то лучше выпрямить строки программой BookRestorer. Там же можно сделать все остальное (чистка, обрезка и т. д.)
Отв: Проблемы и приемы OCR: dewarp
Покажите, плз, мне нормально выпрямленные букресторером строки
Я пробовал это делалать, у меня не получилось. У моих знакомых по ру-боарду тоже.
Отв: Проблемы и приемы OCR: dewarp
Показать в буквальном смысле не могу, т. к. не сохраняю исходники во-первых, и не помню какие именно строки были выпрямленыв во-вторых. Но этой функцией пользовался не раз и не два. Настройки дефолтные. Правда, изгиб касался максимум 3-4 строк внизу страницы. Обычно все же стараюсь прижимать книгу к сканеру :) Совсем уж бракованный скан проще переснять, чем маяться с ним.