Вы здесьПроблемы и приемы OCR: dewarp
Опубликовано ср, 06/05/2009 - 04:06 пользователем Ulenspiegel
Если при сканировании книжка не прижата плотно к предметному стеклу, участки строк, находящиеся вблизи разворота, искривляются. При сильном искривлении (заползание на уровень соседней строки) программы распознавания приходят от таких червячков в недоумение. Не знает ли всемогущий All алгоритмов и (что еще лучше) готовых программ для борьбы с таким безобразием ?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
edvud RE:Подайте бедному копеечку на книжку с литреса... 15 часов
bmusanov Оплатил, но абонемент не отображается 2 дня holla RE:Багрепорт - 2 2 дня sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 дня konst1 RE:Файнридер для Win11 5 дней larin RE:Оплатил, но абонемент не отображается 1 неделя sem14 RE:Книжная серия «Сlio» издательства "Евразия" 1 неделя Isais RE:Национальный конкурс на лучшее литературное произведение... 1 неделя Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 неделя sem14 RE:Современная корейская литература. Книжная серия... 1 неделя sem14 RE:«Морской роман» — книжная серия Калининградского книжного... 1 неделя larin RE:Оплатил,но абонемент не отображается 1 неделя sd RE:Fishing 2 недели Алексей111111111111 RE:Оплатила,но абонемент не отображается 2 недели sd RE:Доступ 27 2 недели kopak RE:Беженцы с Флибусты 2 недели Isais RE:Вадим Иванович Туманов - Всё потерять - и вновь начать с... 3 недели Isais RE:Семейственность в литературе 3 недели Впечатления о книгах
DGOBLEK про Чепижный: Гагаи. Том 1 (Советская классическая проза)
07 08 о людях донецкого села Крутой Яр ----------------------------------------- нету Крутого Ярауже ....русские с лица земли стерли(
dolle про Мусаниф: Другие грабли. Том 3 [СИ] (Альтернативная история, Боевик, Попаданцы, Самиздат, сетевая литература)
05 08 Можно прочесть вбоквелл физрука. Можно и не читать , ничего не потеряете. Оценка: хорошо
дядя_Андрей про Азимов: Я люблю маленькую киску (Юмористическая фантастика)
04 08 А почему "морально устаревший"? Вполне милый рассказец в духе раннего Марка Твена. Главному герою, конечно нужно посочувствовать. Но не меньшее сочувствие вызывает и Киска. А в целом вполне читабельно и вызывает улыбку. Оценка: отлично!
decim про Азимов: Я люблю маленькую киску (Юмористическая фантастика)
04 08 Необязательный рассказец, морально устаревший лет уж 50 назад. Оценка: плохо
obivatel про Волшебник
04 08 Читабельно, ненапряжно, завлекательно. Причин развала страны масса, не указано ни одной, это типичная "окопная правда". Ну и пусть: это не историческая работа, я "благие пожелания автора из его окопа", я не против. С учетом ………
DiSp про Лорд Системы
03 08 Хорошая серия. Любителям почитать, как герои-попаданцы с нуля налаживают быт, а потом развивают себя и общество до высот, о которых сперва и мечтать не могли - самое то. Слог хороший, юморной. И нет излишней жести и жестокости. ГГ удаётся остаться человеком.
udrees про Лей: Инвазия 3 (Боевая фантастика, Ужасы, Фантастика: прочее, Самиздат, сетевая литература)
03 08 Наверное это завершение трилогии про новых ксеноморфов. Вторая книга растянулась на две части. Вот в этой книге автор описывает продолжение борьбы с монстрами. Получается плохо, несмотря на все технические навороты, наличие ……… Оценка: неплохо
udrees про Вальтер: Точка невозврата (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
03 08 Я так понял это завершение трилогии про Элпис. Мне казалось, что третья книга будет еще слабее чем вторая, но надо сказать, что получилось наоборот. Описания достаточно красочные, до самого конца сюжет кажется предсказуемым, ……… Оценка: хорошо
udrees про Михайлов: Ярость бога [повесть] (ЛитРПГ)
03 08 Прикольный рассказ из мира Вальдиры. Короткий, смешной, увлекательный. Оценка: хорошо
udrees про Михайлов: Кроу [СИ] (ЛитРПГ, Самиздат, сетевая литература)
03 08 Хорошо написанная книга в жанре литРПГ, не сильно перегруженная статами персонажа и эффектами от артефактов. Да и вообще в книге совсем мало боевых эпизодов и приключений, как ни странно. Можно даже сказать, что это симулятор ……… Оценка: хорошо
udrees про Варламова: С ума сойти! Путеводитель по психическим расстройствам для жителя большого города (Психология, Психотерапия и консультирование)
03 08 Хорошая книга, написанная популярным языком про основные психические заболевания, можно многое почерпнуть про самые различные состояния, какие у них симптомы, кому грозит «шиза» и как ее лечить. Из книги я узнал, что шизофрения ……… Оценка: хорошо
Barbud про Ланцов: Железный лев (Альтернативная история, Социальная фантастика, Попаданцы, Самиздат, сетевая литература)
02 08 Тетушки, в первой половине XIX века употребляющие названия "ацетон" и "серная кислота" - явный анахронизм, тогда эти вещества назывались по-другому. А так вообще - типичная махровая ланцовщина. ГГ круче каленых яиц, всяких ……… Оценка: плохо |
Комментарии
Отв: Проблемы и приемы OCR: dewarp
Насчет алгоритмов не знаю (хотя Файнридер вроде что то делает) но как вариант решения за $500 смотри тут: http://lib.rus.ec/node/131676
Отв: Проблемы и приемы OCR: dewarp
Э нет, кривой скан в данном случае - уже данность :( В смысле - готовый DJVU
Отв: Проблемы и приемы OCR: dewarp
В FineReader 8, которым я пользуюсь, в настройках "1. Сканировать/открыть" есть опция "Устранить искажение строк". Очень даже помогает.
В 9-й версии наверняка тоже есть.
Отв: Проблемы и приемы OCR: dewarp
Есть , "streighten lines" и "desкew" - кто из них кто уже не помню за ненадобностью.
можно на страницу провести операцию а можно применить ко всем , но я бы советовал постранично ибо некоторые страницы наоборот как раз портит.
Отв: Проблемы и приемы OCR: dewarp
Да вы чего, издеваетесь, панове ?! deskew - есть, это исправление перекоса (когда книжку положили непараллельно границам окна),
Отв: Проблемы и приемы OCR: dewarp
deskew - это совсем из другой оперы.
Возьмите ложку. Положите ее на стол под уголм 45градусов к краю. Исправьте положение ложки. А теперь СОГНИТЕ ложку поплам и попрубуйте исправить перекос относительно края тем же способом
Отв: Проблемы и приемы OCR: dewarp
В моем случае ложка выглядит примерно так: Я думал, что это именно warp
Отв: Проблемы и приемы OCR: dewarp
Я не издеваюсь , я же сказал что не помню, значит не deskew а второй - staighten text lines:
Отв: Проблемы и приемы OCR: dewarp
Теоретически в 8 и 9 Файнридерах имеется встроенный механизм коррекции:
На практике, выработанной на 4м ещё файнридере, лучшим удалителем искажений в зоне разворота служит левая рука, прижимающая книгу к сканеру в момент сканирования... :)
...Каких либо отдельных программ, позволяющих выпрямлять строки я никогда не встречал. Теоретически это можно проделать в фотошопе, но... страницу, пусть две. А сотню? Сомневаюсь.
Отв: Проблемы и приемы OCR: dewarp
АААА!!!! Спасибо, Jolly Roger - ака, и вправду есть! Они его спрятали неочевидным образом.
Если кто-нибудь еще на эти грабли наступит, тулза работает и выглядит вот так:
Отв: Проблемы и приемы OCR: dewarp
Дык а я о чем ?
Отв: Проблемы и приемы OCR: dewarp
Виноват, подумал, что она в опциях сканирования сидит.
Отв: Проблемы и приемы OCR: dewarp
Вроде бы именно такие искривления исправляет Book Restorer. Подробности на ru-board.
Отв: Спасибо!
Век живи - век учись... Действительно, есть и отдельная программа под задачу:
http://djvu-soft.narod.ru/scan/curved_text.htm
...как я понимаю, у неё настроек побогаче будет. Видимо, для сложных случаев может оказаться предпочтительней.
Отв: Проблемы и приемы OCR: dewarp
На сорсфорже была утилитка unpaper - она, кажется, умела автоматически делать обработку сканированных страниц, выравнивая картинки, зачищая поля и выравнивая интенсивность фона. Заодно резала на страницы, если сканировался разворот.
Отв: Проблемы и приемы OCR: dewarp
http://unpaper.berlios.de
А строки, AFAIK, не ровняет.
Но вобщем ничего, пользуюсь периодически.
Отв: Проблемы и приемы OCR: dewarp
Если нужно подготовить скан для создания дежавю, то лучше выпрямить строки программой BookRestorer. Там же можно сделать все остальное (чистка, обрезка и т. д.)
Отв: Проблемы и приемы OCR: dewarp
Покажите, плз, мне нормально выпрямленные букресторером строки
Я пробовал это делалать, у меня не получилось. У моих знакомых по ру-боарду тоже.
Отв: Проблемы и приемы OCR: dewarp
Показать в буквальном смысле не могу, т. к. не сохраняю исходники во-первых, и не помню какие именно строки были выпрямленыв во-вторых. Но этой функцией пользовался не раз и не два. Настройки дефолтные. Правда, изгиб касался максимум 3-4 строк внизу страницы. Обычно все же стараюсь прижимать книгу к сканеру :) Совсем уж бракованный скан проще переснять, чем маяться с ним.