Вычитка #5 (2010-I)
Опубликовано пн, 04/01/2010 - 14:06 пользователем soshial
Forums: Теперь главная тема по вычитке здесь. Архив тем: таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: Книги из этого списка нуждаются в доработке: форматировании и вычитке. Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе. Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования. Присоединяйтесь к нам! :) golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"! Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
нэнси RE:Подайте бедному копеечку на книжку с литреса... 2 дня
RAINBOWJOSE RE:Домен и сертификаты 2 дня Саша из Киева RE:Меж двух Америк 3 дня Саша из Киева RE:Красная каска 3 дня Isais RE:Семейственность в литературе 5 дней sem14 RE:Баг сервиса "Координация сканирования и вычитки" 1 неделя Isais RE:Древний Рим. Подборка книг 1 неделя konst1 RE:Сборник - Антология сатиры и юмора России XX века. Том 3. ... 2 недели tvnic RE:Багрепорт - 2 2 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 2 недели larin RE:не открывается книга 3 недели Саша из Киева RE:Всё - даже свою жизнь! 3 недели sem14 RE:«Блуждающие звезды», серия издательства «Книжники» 4 недели Саша из Киева RE:Мир на рубеже XXI века. Международная панорама 1 месяц Nicout RE:СПАСТИ FB2 на винте 1 месяц Саша из Киева RE:Америка. Разговор по душам 1 месяц nehug@cheaphub.net RE:Доступ 1 месяц Саша из Киева RE:Помни их имена 1 месяц Впечатления о книгах
Lan2292 про Земляной: Кудесник [СИ] (Альтернативная история, Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
16 09 да. сказка. я бы даже сказала мечта и не одного человека, воплощенная на бумаге, класс Оценка: отлично!
pulochka про Ефиминюк: Ускользающий мир (Любовная фантастика)
16 09 Ужасно. От начала до конца. Невнятный ,занудный сюжет. Герои никакие .Порывалась бросить несколько раз. Закончила из чистого упрямства. И конец не порадовал! А ведь многие книги автора стали любимыми! Наверно нужно Марине ……… Оценка: нечитаемо
Лысенко Владимир Андреевич про Земляной: Князь Серединного мира [СИ] (Боевая фантастика, Героическая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
15 09 Огромная благодарность за книгу! Жду продолжения серии Страж. Оценка: отлично!
Shelest2000 про Земляной: Синий пепел [СИ] (Постапокалипсис, Самиздат, сетевая литература)
15 09 жмека ,увидишь рядом бусик - беги :)
Sello про Труайя: Екатерина Великая (Историческая проза, Биографии и Мемуары)
15 09 В который раз убеждаюсь в таланте этого писателя, умевшего связывать факты, события и необходимое беллетрическое повествование точными и емкими словами, расписывать их яркими сочными красками. Оценка: отлично!
udrees про Александр: Королева Виктория [La Dernière Reine. Victoria 1819–1901 ru] (История, Биографии и Мемуары)
14 09 Впечатление неоднозначное. С одной стороны подробное изложение ее жизни, с разными подробностями личной жизни. С другой стороны, упор сделан на описание удобств что ли, в карете со сколькими лошадями она ехала, какую шляпку ……… Оценка: плохо
udrees про Панчин: Апофения [litres] (Социальная фантастика)
14 09 Просто чумовое произведение про оглупление человечества. И ведь как точно, как прозорливо описано если не наше будущее, то альтернативная реальность. Здесь все вывернуто до гротеска, до максимума, все это упоение астрологией, ……… Оценка: отлично!
udrees про Атаманов: Карантинный мир (Героическая фантастика)
14 09 Написано неплохо, несложно, язык цветистый, наполнен действием и беспрерывным описанием сюжетных завихрений. Поэтому прочитал книгу без трудностей за день. История интересная, смахивает на сказочную про выживание в опасном ……… Оценка: отлично!
Skyns71 про Л.   : Штурм Бахмута, позывной «Констебль» (Документальная литература, О войне)
13 09 Вот только нацистской пропаганды тут недоставало...
Лысенко Владимир Андреевич про Видум: Плюсы и минусы алхимии [СИ] (Фэнтези, Самиздат, сетевая литература)
13 09 Хорошая серия книг, читаются на одном дыхании. Оценка: отлично!
Dongel про Еськов: Евангелие от Афрания [сборник] (Альтернативная история, Научная фантастика)
13 09 Читал несколко лет назад - не мог оторваться. Сейчас хочу перечитать еще раз. Предвкушаю. Оценка: отлично!
udrees про Бастеррика: Особое мясо (Социальная фантастика)
12 09 написано отлично, с большими подробностями, кровавыми конечно. описан технологический процесс убоя мясных особей и разделки тел, описаны работники на производстве. есть даже описание сект, проповедующих новые ценности. ……… Оценка: отлично! |
Отв: Вычитка #5 (2010-I)
Не совсем понял как сообщить о готовности заняться вычиткой одной из предложенных к вычитке книг?
Б. Р. Скотт Падение святого города http://lib.rus.ec/b/170827 вычитать ошибки OCR
Опыта в этом деле у меня нет, но есть желание. Думаю, я смогу разобраться с "инструментарием" и оказать библиотеке посильную помощь.
Отв: Вычитка #5 (2010-I)
Считайте, что сообщили. :)
Будут вопросы, не стесняйтесь их задавать. :)
Отв: Вычитка #5 (2010-I)
начинаю задавать вопросы 8)
Вопрос 1.
Попытался заглянуть, но скачать её не получается по известной причине 8).
Есть какие-нибудь альтернативные ссылки, по которым можно свободно скачать эту книгу?
Вопрос 2. Где взять исходный FB2-файл выбранной на вычитку книги? Скачать оный по указанной вами ссылке http://lib.rus.ec/b/170827 снова-таки не представляется возможным:
Вопрос 3.
Что конкретно подразумевается под этим понятием? Достаточно ли просто исправлять замеченные ошибки и несуразицы по мере прочтения книги, или же требуется обязательное её сравнение с текстом бумажного оригинала? Как быть если бумажный оригинал для этих целей достать проблематично?
Отв: Вычитка #5 (2010-I)
На сайте автора: http://www.yuzzich.narod.ru/mybook1.htm
Отв: Вычитка #5 (2010-I)
1. Странно, что не скачивается Кондратович. Одно время был какой-то глюк, что вообще ничего нельзя было скачать, но вроде бы его исправили. Может быть, опять? :(
2. См. п. 1. Если не получится, сообщите мне свой мэйл в личку, я вышлю Вам файл.
3. 90% всех ошибок OCR можно исправить без оригинала - достаточно просто внимательно читать, а после ещё и пройтись скриптами. Но бывают, конечно, и спорные или вовсе не читаемые места. Если у Вас нет оригинала и достать его сложно/невозможно, оставляйте как есть. Возможно, имеет смысл в хистори упомянуть о том, что в книге остались ещё ошибки OCR.
RE:Отв: Вычитка #5 (2010-I)
Ещё есть вариант: сравнивать текст не с бумажным оригиналом, а с тем файлом, с которого делался OCR, то есть с фотокопией. Часто на сайт выкладывают файлы в формате PDF или DJVU - их можно жрать за исходную точку для сравнения. То, что программы распознавания распознают плохо, человеческий мозг может сделать гораздо лучше. Часто при сканировании некоторые символы или целые слова искажаются, расплываются и т.д. Вот, программы часто сбиваются в таких местах, но люди могут восстановить правильное слово по смыслу, если есть хоть небольшой намёк на правильное слово со стороны расплывающегося текста. Если PDF или DJVU файла нет на сайте, думаю, можно попросить его переслать того пользователя, который занимался OCR.
в какой кодировке сохранять книгу?
скажите пожалуйста какую кодировку делать в книге
оставлять, какая была или есть какие-то предпочтительные кодировки, типа utf-8? но при этом размер чуть увеличится...
редактировал книгу, она была в win-1251, сейчас у меня utf-8, размер сжатой возрос на 50кб, стоит обратно ее в win-1251 переводить?
Отв: в какой кодировке сохранять книгу?
Отв: в какой кодировке сохранять книгу?
Только utf-8. Размер не имеет значения.:)
Отв: в какой кодировке сохранять книгу?
ну и отлично, мне тоже ближе утф
единственное сомневался из-за размера файла и что возможно некоторые читалки для кпк/телефонов не смогут открыть файл в этой кодировке
Отв: Вычитка #5 (2010-I)
В процессе производства журнала Искатель №4 за 1988 выяснилось, что один из рассказов имеется здесь: http://lib.rus.ec/b/150420, но качество плохое - не вычитан. Поставил пометку "вычитывается".
Отв: Вычитка #5 (2010-I)
как можно принять участие в вычитке? Спасибо )))))))))))
Отв: Вычитка #5 (2010-I)
Вы можете присмотреть себе что-нибудь в таблице (ссылка в первом постинге) или выбрать что-нибудь по вкусу из файлов, сделанных LibRusEc kit'ом http://lib.rus.ec/stat/document-author/rusec, или просто читать нравящиеся Вам книги и заодно исправлять ошибки.
На странице редактирования книги следует делать пометку в поле "доп. инф." что-то типа "вычитывается" или "в работе". Чтобы не получилось дублирования.
Отв: Вычитка #5 (2010-I)
Рассказ Андре Рюэллана "Мемо" заменил на вычитанную версию - http://lib.rus.ec/b/180047. Кроме того добавил в библиотеку журнал Искатель, №4, 1988 - http://lib.rus.ec/b/180046, в котором этот рассказ имеется. Не знаю, прав ли...
Отв: Вычитка #5 (2010-I)
Здравствуйте!
Готов что-то повычитывать.
У меня интересы -- история, религоведение. Это означает что тут я лучше вычитаю.
Впрочем, могу вычитывать и то что есть.
Из гугльдока заинтересовало "Ла Сор Обзор Ветхого завета",однако оригинала у меня нет. Есть только doc файл с погаными сканами фотографий.
Из проблем есть то что я использую Linux и не уверен что есть готовые тлзы для создания/редактирования fb2. Но думаю что разберусь...
Так что заявку я оставил :)
Отв: Вычитка #5 (2010-I)
В "Обзоре Ветхого завета" пропущены куски текста. Если в Вашем доке они есть, то и он годится. :)
А откуда взялся Ваш док? Если по тем же ссылкам, что приведены в дескрипторе, то значит, и в нём текст не полностью.
Если Вы умеете распознавать и конвертировать другие форматы в fb2 (и найдёте способ делать это под Линуксом), можно просмотреть книги по жанрам:
http://lib.rus.ec/g/sci_religion
http://lib.rus.ec/g/religion_budda
http://lib.rus.ec/g/religion
http://lib.rus.ec/g/religion_rel
http://lib.rus.ec/g/religion_self
http://lib.rus.ec/g/religion_esoterics
Все файлы, сделанные LibRusEc kit'ом, нуждаются в обработке.
Если возьмёте что-нибудь в работу не из таблицы, оставьте на странице редактирования книги пометку в поле "доп. инф.".
Успехов! :)
Отв: Вычитка #5 (2010-I)
Приветствую всех!
Временами, читая книги в Вашей прекрасной библиотеке, поражаюсь вопиющей малограмотностью некоторых текстов. Хотел бы помочь с вычиткой (благо имею определенный опыт), но... как это реализовать на практике?
Можно ли править "на грамотность" читаемые тексты с их последующей перезаливкой?
И не будет ли это воспринято, как "нарушение авторских прав" и т.п.?
В ожидании ответа, WildKitten.
Отв: Вычитка #5 (2010-I)
Можно и нужно.
Почитайте вступительный пост (особенно ту часть, где говорится о форматах). Если Вам там всё понятно и Вы со всем согласны, можете смело править читаемые Вами книги.
Уточню: речь идёт о грамматических ошибках и форматировании. Всё остальное остаётся на совести автора.
Отв: Вычитка #5 (2010-I)
Поправил и перезалил книгу Тома Шарпа "Флоузы": http://lib.rus.ec/b/180361 Сделал, что мог, но правил в основном ошибки орфографические и огрехи OCR. Оформил стихи тэгом. Внес дополнительную инфу в Description.
Много вопросов у меня было по разбиению книги на абзацы, но поправил лишь явные случаи. При сомнениях оставлял так, как оно есть - такие вещи, ИМХО, лучше сверять со сканом или бумажным изданием. Поскольку не было ни того, ни другого, решил, что лучше не навредить.
Отв: Вычитка #5 (2010-I)
Большое спасибо. Абсолютно верное решение.
Отв: Вычитка #5 (2010-I)
Здравствуйте.Отметьте пож.в таблице - Питер Уоттс "Ложная слепота" вычитан, обновленную версию я залил в базу библиотеки.Встречались сложные понятия в тексте, не разобрать - то ли опечатки,то ли это переводчик так перевел научные термины.Решил оставить как есть.
Беру новую книгу на вычитку из таблицы - Орлов "Смело мы в бой пойдем...".Отметьте пож. в таблице.На страничке книги я отметился.Спасибо.
Отв: Вычитка #5 (2010-I)
Готов заниматься вычиткой. К кому обращаться?
Отв: Вычитка #5 (2010-I)
Добро пожаловать!
Сначала просмотрите таблицу, может быть, там найдётся что-то, над чем Вам интересно будет "поработать". Если нет, то в списке файлов, сделанных LibRusEc kit'ом, можно выбирать любой файл и дорабатывать его. Там всегда отсутствует форматирование и зачастую нужна вычитка.
Если найдёте что-то для себя интересное, сделайте пометку на странице редактирования книги в поле "доп. инф.". Мол, вычитывается. ;)
Отв: Вычитка #5 (2010-I)
Почему-то библиотека не принимает доработанные файлы обратно - пишет что файл слишком короткий и просит паковать стихи по сто килобайт.
Отв: Вычитка #5 (2010-I)
Вечер добрый! Я бы с удовольствием занялась вычиткой, но только текстовых файлов. Таблица не информативна, т.к., посмотрев интересующие меня книги, обнаружила, что в таблице они никак не отмечены цветом, а на странице самой книги отмечено, что она вычитывается.
Киньте в меня, пожалуйста, книжкой, которую нужно вычитать.
Отв: Вычитка #5 (2010-I)
К сожалению, вряд ли кто-то сумеет Вам точно указать такую книгу.
Попробуйте подобрать себе что-нибудь интересное здесь: http://lib.rus.ec/stat/tot, полистав файлы в форматах doc, rtf, txt.
Читайте и правьте заодно. :)
Но заранее сказать, что книга нуждается в вычитке, никто не сможет.
Ой, вспомнила! Вдруг Вам будет интересно:
http://lib.rus.ec/a/36186
Нужно вычитать оба doc-файла.
При этом нужно удалить номера страниц, проставить сноски (если они есть). Сноски можно проставить либо при помощи инструментов Word'a (постраничные сноски), либо поставив их в фигурные скобки за словом, к которому они относятся.
Нужно также провести небольшое форматирование - выделить заголовки и стихи.
Заинтересовала Вас такая работа? :)
Отв: Вычитка #5 (2010-I)
Взяла бы на вычитку вот эту книгу http://lib.rus.ec/b/170065 "Сереброкрыл". Только не понимаю как ее взять. Скачать не могу (хочет абонемент или пользу), а кнопки чтения нет.
Отв: Вычитка #5 (2010-I)
http://lib.ololo.cc/b/170065
Отв: Вычитка #5 (2010-I)
Сегодня еще читала Сергея Лукьяненко не помню точно как называется (что-то вроде "Беседы с дьяволом"). Он в фб2 (я с ним не работаю, пока), но в нем есть опечатки, неверные окончания и пропущенные запятые. Если мне не нужно вставлять никаких тегов (так, по-моему, это нзывается), я могу поправить текст и залить его заново?
Отв: Вычитка #5 (2010-I)
http://lib.ololo.cc/b/170065
по ссылке открывается пустая страница
Отв: Вычитка #5 (2010-I)
Пришлите мне в личку свой мэйл, я Вам вышлю.
Отв: Вычитка #5 (2010-I)
после того, как выслала мейл, смогла открыть страницу и скачать оттуда. Начинаю читать. Отметьте.
Отв: Вычитка #5 (2010-I)
В таблице этой книге нет. А на странице редактирования Вы можете самостоятельно отметить: в графе "доп. инф." проставьте "вычитывается". Или Вы и конвертировать будете? Тогда можно поставить "конвертируется".
Отв: Вычитка #5 (2010-I)
Здравствуйте!
Готова заняться Иосиф Бродский Стихи (2) http://lib.rus.ec/b/9097 разобраться в перемешанных стихах, отформатировать
а также Иван Бунин Дневники 1939-1945 годов http://lib.rus.ec/b/177214 вычитать, сделать структуру, расставить сноски
Отв: Вычитка #5 (2010-I)
Отлично! Занесла в таблицу.
Если Вы на странице редактирования книги сделаете пометку, тоже не помешает. ;)
Отв: Вычитка #5 (2010-I)
Взял на конвертацию в фб2 и вычитку книгу Руперта Шелдрейка "Новая наука о жизни" - http://lib.rus.ec/b/180809
Отв: Вычитка #5 (2010-I)
Взял на конвертацию и вычитку "Поколение свиней" Хантера Томпсона - http://lib.rus.ec/a/20018
Отв: Вычитка #5 (2010-I)
Добрый вечер! Отметьте пожалуйста в таблице, что Иосиф Бродский Стихи (2) вычитан.
:)
Отв: Вычитка #5 (2010-I)
Отметила. Спасибо!
Отв: Вычитка #5 (2010-I)
Отметьте, плиз. Взялся поправить массу ошибок в книге Стивена Кинга "Кэрри": http://lib.rus.ec/b/140451. Сравню с бумажным изданием
Хотел посоветоваться, как сделать лучше: Фактически книга состоит из трех частей, соответственно три секции. Примерно 30-40% книги составляют выдержки из книг, газет и т.д., выделенные тегом cite + внутри курсив или bold. В бумажном издании курсив и bold присутствуют также.
Вопрос у меня заключается в следующем: бегло вычитываю книгу с КПК в AlReader-е и то, что выделяется тэгом cite, да еще с дополнительным курсивом и bold-ом внутри выглядит, мягко говоря аляписто... Есть задумка назначить пустые строки подзаголовками, оставить выделение жирным и курсивом, а вот тэг cite снять - ИМХО, подобное форматирование книги будет выглядеть намного читабельнее и нагляднее, нежели просто выделение тэгом цитаты...
Отв: Вычитка #5 (2010-I)
Подождите, подождите. Я тоже читаю на КПК AlReader'ом и цитаты (cite) выглядят прекрасно. Все стили настраиваются под вкус читателя. Размер, цвет, начертание, отступы и т.д. Например, cite выделяется только цветом и отступами (можно и другим шрифтом), а курсив и bold на этом фоне ничего не портят.
Удалять стилевую разметку совершенно нет никакой необходимости! К тому же подзаголовки (subtitle), поставленные для пустых строк, улетят в FBE при первой же обработке скриптами.
В общем, я бы не советовал.
Отв: Вычитка #5 (2010-I)
Спасибо за замечания. Поэтому прежде и спросил, прежде чем действовать.
Тогда оставляю расстановку тэгов as it и правлю орфографию, расстановку абзацев, добавляю курсив, там, где он отсутствует. Все по бумажному изданию. В воскресенье выложу результат.
Кстати, видел в таблице Волки Кальи того же Стивена Кинга: http://lib.rus.ec/b/67272 Книга вроде бы как в работе с 23.02.09. Если актуально, могу взять на себя - опять же есть бумажный вариант книги, есть по чему править...
Отв: Вычитка #5 (2010-I)
<cite> не удалять ни в коем случае, если это цитаты!
курсив внутри цитаты не нужен, т.к. обычно в печатной книжке для того и выделяют курсивом, чтобы читатель понял, что это цитата! Если там все цитаты выделены и курсивом и болдом, то тогда IMHO, имеет смысл убрать курсив и болд, а вот <cite> лучше оставить.
Отв: Вычитка #5 (2010-I)
papamuller. Раз уж переделываете, найдите обложку покрасивее и русскую и иностранную, в сети их, как грязи. И хорошо-бы выходные данные русской книги в Дескрипшн и автора, название и год написания на английском. А так-же переводчика:) Не много прошу?:)
Отв: Вычитка #5 (2010-I)
Igorek67 Description уже заполнил - я обычно с него начинаю работу. Все данные внес. А обложку... Тогда попутный вопрос - если указывается ISBN книги, издательство ее выпустившее, допустимо ли замена обложки? У меня бумажный вариант в этом же исполнении, разве что цветопередача отличается? Можно ли здесь позволять какие-то вольности, или данные должны стыковаться: ISBN - аутентичная обложка бумажного издания?
Отв: Вычитка #5 (2010-I)
Да должны стыковаться. Если есть бумажный вариант, то лучше конечно обложку самому отсканить и сделать скажем 400 пикселей по горизонтали. Гораздо лучше, чем обложка с Оzona к примеру, где по горизонтали 200.
Сам я ставлю обложку и ISBN по одному изданию, а если есть поинтереснее обложка тоже кладу обычно в файл, как и иностранные, если есть. Уж у Кинга то есть:)
Отв: Вычитка #5 (2010-I)
papamuller, если будете добавлять иностранную обложку - не подцепляйте ее в дескрипшен как обложку (сайт именно ее и выберет для демонстрации на странице книги), разместите иллюстрацией в конце книги.
Отв: Вычитка #5 (2010-I)
Zadd, Нет, тэг цитаты оставляю точно. Часть книги сделана просто в виде отсыла к другим источникам - они как раз и цитируются. С курсивом там я разобрался - вместо него должны стоять обычные кавычки, так что спокойно их заменяю. В бумажном варианте было проще - там эта часть книги просто дается уменьшенным шрифтом. Смотрится очень даже, конечно. Ну а у fb2 инструментарий победнее, это понятно.
Igorek67, сделал бы это с удовольствием, был бы сканер в наличии. Но в этом году прикуплю обязательно.
Ronja_Rovardotter, спасибо за совет!
Да, собственно, спасибо всем помогающим здесь в теме таким вот "чечако" как я
Отв: Вычитка #5 (2010-I)
Уменьшенный шрифт можно делать при помощи тегов sub или sup.
Отв: Вычитка #5 (2010-I)
sub и sup не всеми читалками поддерживаются, а cite и есть cite, зачем его еще как-то особо выделять? Каждый читатель может настроить его вид у себя так, как ему нужно. Разве нет?
Страницы