Вычитка #5 (2010-I)
Опубликовано пн, 04/01/2010 - 14:06 пользователем soshial
Forums: Теперь главная тема по вычитке здесь. Архив тем: таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: Книги из этого списка нуждаются в доработке: форматировании и вычитке. Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе. Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования. Присоединяйтесь к нам! :) golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"! Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
macs1112 RE:Подайте бедному копеечку на книжку с литреса... 8 часов
Ldrozd RE:Сандра Ньюмен - Джулия [1984] 2 дня konst1 RE: Банда Рафаэля 2 дня Isais RE:Лоренс Даррелл - Горькие лимоны 3 дня Isais RE:B157704 Черепаха Киргала 4 дня Oleg V.Cat RE:Беженцы с Флибусты 4 дня sem14 RE:Литературная премия «Ясная Поляна» 4 дня blahblahblah2024 RE:Сборник - Советская морская новелла. Том 1 1 неделя Ма-Рита RE: День рождения человечества 1 неделя Isais RE:Обновление FictionBook Editor 1 неделя Alex_61 RE:Windows 7 безопасна благодаря помощи NSA??? 1 неделя Саша из Киева RE:Лимонные дольки 1 неделя Trinki RE:Любительские переводы 1 неделя nehug@cheaphub.net RE:Подробнее о правилах, если можно? 2 недели Isais RE:Семейственность в литературе 2 недели kopak RE:Небольшой тест. 2 недели nehug@cheaphub.net RE:Как тут читать и скачивать книги? 2 недели nehug@cheaphub.net RE:Домен и сертификаты 2 недели Впечатления о книгах
Ратослава про Конофальский: Божьим промыслом. Пожары и виселицы (Фэнтези, Историческая проза, Неотсортированное)
15 10 В целом, хорошо. Но не пора ли отпустить старого генерала на покой? Оценка: хорошо
Belomor.canal про Заграевский: Новые исследования памятников архитектуры Владимиро-Суздальского музея-заповедника (История, Искусство и Дизайн, Архитектура)
15 10 Книга написана кандидатом мастра спорта по боксу, обладателем коричневого пояса и бывшем председателем банка, не имевшим архитектурного образования - кончил МАДИ и занимался логистикой тары на ЭВМ(!) - но шустрым медийный ……… Оценка: хорошо
Belomor.canal про Анонимус: Каирский дебют. Записки из синей тетради [litres] (Исторический детектив)
14 10 Слишком короткие рассказики для нормального чтения, на любителя! Оценка: неплохо
tvv про Манцуров: Рагнарёк Онлайн. Трансмигратор ( Том 1 и 2 ) (Фанфик, ЛитРПГ, Самиздат, сетевая литература)
14 10 На АТ уже 9 томов, все бесплатно.
DGOBLEK про Микулов: Тропа длиною в жизнь [Книга не полностью] (Фэнтези, Научная фантастика)
14 10 Книга не полностью. Отсутствует в книге - Олег Микулов. Предисловие, стр. 5-6 М. Аникович. Комментарий археолога, стр. 507-526
Oleg V.Cat про Волков: Специалист по выживанию. Том II (Боевая фантастика, Самиздат, сетевая литература)
14 10 Скучно. Когда крыса с человеческим сознанием (первая книга) бегает по крысиным тропам - это, как минимум, забавно. Когда человек косплеит крысу в канализации - это интересно только как сексуальное извращение.
Oleg V.Cat про Волков: Специалист по выживанию (том I) (ЛитРПГ, Самиздат, сетевая литература)
14 10 Так себе. Полное отсутствие какой-либо оригинальности, но читается более-менее гладко. Как практически у любого автора "про там" - некоторые напряги с масштабом цен. Ну ладно, помещение мастерской в подвале в бойком месте ………
Oleg V.Cat про Росс: Наука Шерлока Холмса [методы знаменитого сыщика в расследовании преступлений прошлого и настоящего] [litres] (Юриспруденция, Научная литература: прочее)
14 10 Троечка. Очень "галопом по всему Лондону", несвязно. Много фактических ошибок по шерлокиане, о которые спотыкался и переводчик, в конце концов плюнувший на поиски цитат в переводах. Так что и непонятно, кто ответственен, скажем, ……… Оценка: неплохо
Oleg V.Cat про Барсик
13 10 Первая книга, по нынешним временам, на твердую четвёрку. Поставил бы больше, но терзает диссонанс между сюжетом (милая, пусть и с налётом грусти сказочка про бездомных котиков-сирот) и формой его подачи в стиле "курс молодого ………
Дей про Горбов: Очень светлые неприятности [СИ] (Юмористическая фантастика, Попаданцы, Самиздат, сетевая литература)
13 10 Как-то слито получилось. В отличие от остальных книг серии, эта самая бестолковая, выбивающаяся из серии и завершения внятного нет. Оценка: неплохо
Oleg V.Cat про Cat: Система Диофанта [СИ] (Образовательная литература, Математика, Самиздат, сетевая литература)
13 10 Ежели бы мой тезка прочитал учебник математики (а что ещё делать на уроках ;) ) то он бы прочитал про формулу Виета. А равно о том, что в общем случае её использование приводит ровно к тому же самому квадратному уравнению. ……… Оценка: нечитаемо
Aleks_Sim про Федоров: Воины Новороссии. Подвиги народных героев (Биографии и Мемуары, Спецслужбы)
13 10 trampak Пока видны в основном преступления ЗЕ-воинов, и в Донбассе их благополучно судят(если не пристрелили), а суд будет, но не в Нюрнберге и ответят по полной программе, особо за Курскую область Оценка: отлично! |
Отв: Вычитка #5 (2010-I)
Не совсем понял как сообщить о готовности заняться вычиткой одной из предложенных к вычитке книг?
Б. Р. Скотт Падение святого города http://lib.rus.ec/b/170827 вычитать ошибки OCR
Опыта в этом деле у меня нет, но есть желание. Думаю, я смогу разобраться с "инструментарием" и оказать библиотеке посильную помощь.
Отв: Вычитка #5 (2010-I)
Считайте, что сообщили. :)
Будут вопросы, не стесняйтесь их задавать. :)
Отв: Вычитка #5 (2010-I)
начинаю задавать вопросы 8)
Вопрос 1.
Попытался заглянуть, но скачать её не получается по известной причине 8).
Есть какие-нибудь альтернативные ссылки, по которым можно свободно скачать эту книгу?
Вопрос 2. Где взять исходный FB2-файл выбранной на вычитку книги? Скачать оный по указанной вами ссылке http://lib.rus.ec/b/170827 снова-таки не представляется возможным:
Вопрос 3.
Что конкретно подразумевается под этим понятием? Достаточно ли просто исправлять замеченные ошибки и несуразицы по мере прочтения книги, или же требуется обязательное её сравнение с текстом бумажного оригинала? Как быть если бумажный оригинал для этих целей достать проблематично?
Отв: Вычитка #5 (2010-I)
На сайте автора: http://www.yuzzich.narod.ru/mybook1.htm
Отв: Вычитка #5 (2010-I)
1. Странно, что не скачивается Кондратович. Одно время был какой-то глюк, что вообще ничего нельзя было скачать, но вроде бы его исправили. Может быть, опять? :(
2. См. п. 1. Если не получится, сообщите мне свой мэйл в личку, я вышлю Вам файл.
3. 90% всех ошибок OCR можно исправить без оригинала - достаточно просто внимательно читать, а после ещё и пройтись скриптами. Но бывают, конечно, и спорные или вовсе не читаемые места. Если у Вас нет оригинала и достать его сложно/невозможно, оставляйте как есть. Возможно, имеет смысл в хистори упомянуть о том, что в книге остались ещё ошибки OCR.
RE:Отв: Вычитка #5 (2010-I)
Ещё есть вариант: сравнивать текст не с бумажным оригиналом, а с тем файлом, с которого делался OCR, то есть с фотокопией. Часто на сайт выкладывают файлы в формате PDF или DJVU - их можно жрать за исходную точку для сравнения. То, что программы распознавания распознают плохо, человеческий мозг может сделать гораздо лучше. Часто при сканировании некоторые символы или целые слова искажаются, расплываются и т.д. Вот, программы часто сбиваются в таких местах, но люди могут восстановить правильное слово по смыслу, если есть хоть небольшой намёк на правильное слово со стороны расплывающегося текста. Если PDF или DJVU файла нет на сайте, думаю, можно попросить его переслать того пользователя, который занимался OCR.
в какой кодировке сохранять книгу?
скажите пожалуйста какую кодировку делать в книге
оставлять, какая была или есть какие-то предпочтительные кодировки, типа utf-8? но при этом размер чуть увеличится...
редактировал книгу, она была в win-1251, сейчас у меня utf-8, размер сжатой возрос на 50кб, стоит обратно ее в win-1251 переводить?
Отв: в какой кодировке сохранять книгу?
Отв: в какой кодировке сохранять книгу?
Только utf-8. Размер не имеет значения.:)
Отв: в какой кодировке сохранять книгу?
ну и отлично, мне тоже ближе утф
единственное сомневался из-за размера файла и что возможно некоторые читалки для кпк/телефонов не смогут открыть файл в этой кодировке
Отв: Вычитка #5 (2010-I)
В процессе производства журнала Искатель №4 за 1988 выяснилось, что один из рассказов имеется здесь: http://lib.rus.ec/b/150420, но качество плохое - не вычитан. Поставил пометку "вычитывается".
Отв: Вычитка #5 (2010-I)
как можно принять участие в вычитке? Спасибо )))))))))))
Отв: Вычитка #5 (2010-I)
Вы можете присмотреть себе что-нибудь в таблице (ссылка в первом постинге) или выбрать что-нибудь по вкусу из файлов, сделанных LibRusEc kit'ом http://lib.rus.ec/stat/document-author/rusec, или просто читать нравящиеся Вам книги и заодно исправлять ошибки.
На странице редактирования книги следует делать пометку в поле "доп. инф." что-то типа "вычитывается" или "в работе". Чтобы не получилось дублирования.
Отв: Вычитка #5 (2010-I)
Рассказ Андре Рюэллана "Мемо" заменил на вычитанную версию - http://lib.rus.ec/b/180047. Кроме того добавил в библиотеку журнал Искатель, №4, 1988 - http://lib.rus.ec/b/180046, в котором этот рассказ имеется. Не знаю, прав ли...
Отв: Вычитка #5 (2010-I)
Здравствуйте!
Готов что-то повычитывать.
У меня интересы -- история, религоведение. Это означает что тут я лучше вычитаю.
Впрочем, могу вычитывать и то что есть.
Из гугльдока заинтересовало "Ла Сор Обзор Ветхого завета",однако оригинала у меня нет. Есть только doc файл с погаными сканами фотографий.
Из проблем есть то что я использую Linux и не уверен что есть готовые тлзы для создания/редактирования fb2. Но думаю что разберусь...
Так что заявку я оставил :)
Отв: Вычитка #5 (2010-I)
В "Обзоре Ветхого завета" пропущены куски текста. Если в Вашем доке они есть, то и он годится. :)
А откуда взялся Ваш док? Если по тем же ссылкам, что приведены в дескрипторе, то значит, и в нём текст не полностью.
Если Вы умеете распознавать и конвертировать другие форматы в fb2 (и найдёте способ делать это под Линуксом), можно просмотреть книги по жанрам:
http://lib.rus.ec/g/sci_religion
http://lib.rus.ec/g/religion_budda
http://lib.rus.ec/g/religion
http://lib.rus.ec/g/religion_rel
http://lib.rus.ec/g/religion_self
http://lib.rus.ec/g/religion_esoterics
Все файлы, сделанные LibRusEc kit'ом, нуждаются в обработке.
Если возьмёте что-нибудь в работу не из таблицы, оставьте на странице редактирования книги пометку в поле "доп. инф.".
Успехов! :)
Отв: Вычитка #5 (2010-I)
Приветствую всех!
Временами, читая книги в Вашей прекрасной библиотеке, поражаюсь вопиющей малограмотностью некоторых текстов. Хотел бы помочь с вычиткой (благо имею определенный опыт), но... как это реализовать на практике?
Можно ли править "на грамотность" читаемые тексты с их последующей перезаливкой?
И не будет ли это воспринято, как "нарушение авторских прав" и т.п.?
В ожидании ответа, WildKitten.
Отв: Вычитка #5 (2010-I)
Можно и нужно.
Почитайте вступительный пост (особенно ту часть, где говорится о форматах). Если Вам там всё понятно и Вы со всем согласны, можете смело править читаемые Вами книги.
Уточню: речь идёт о грамматических ошибках и форматировании. Всё остальное остаётся на совести автора.
Отв: Вычитка #5 (2010-I)
Поправил и перезалил книгу Тома Шарпа "Флоузы": http://lib.rus.ec/b/180361 Сделал, что мог, но правил в основном ошибки орфографические и огрехи OCR. Оформил стихи тэгом. Внес дополнительную инфу в Description.
Много вопросов у меня было по разбиению книги на абзацы, но поправил лишь явные случаи. При сомнениях оставлял так, как оно есть - такие вещи, ИМХО, лучше сверять со сканом или бумажным изданием. Поскольку не было ни того, ни другого, решил, что лучше не навредить.
Отв: Вычитка #5 (2010-I)
Большое спасибо. Абсолютно верное решение.
Отв: Вычитка #5 (2010-I)
Здравствуйте.Отметьте пож.в таблице - Питер Уоттс "Ложная слепота" вычитан, обновленную версию я залил в базу библиотеки.Встречались сложные понятия в тексте, не разобрать - то ли опечатки,то ли это переводчик так перевел научные термины.Решил оставить как есть.
Беру новую книгу на вычитку из таблицы - Орлов "Смело мы в бой пойдем...".Отметьте пож. в таблице.На страничке книги я отметился.Спасибо.
Отв: Вычитка #5 (2010-I)
Готов заниматься вычиткой. К кому обращаться?
Отв: Вычитка #5 (2010-I)
Добро пожаловать!
Сначала просмотрите таблицу, может быть, там найдётся что-то, над чем Вам интересно будет "поработать". Если нет, то в списке файлов, сделанных LibRusEc kit'ом, можно выбирать любой файл и дорабатывать его. Там всегда отсутствует форматирование и зачастую нужна вычитка.
Если найдёте что-то для себя интересное, сделайте пометку на странице редактирования книги в поле "доп. инф.". Мол, вычитывается. ;)
Отв: Вычитка #5 (2010-I)
Почему-то библиотека не принимает доработанные файлы обратно - пишет что файл слишком короткий и просит паковать стихи по сто килобайт.
Отв: Вычитка #5 (2010-I)
Вечер добрый! Я бы с удовольствием занялась вычиткой, но только текстовых файлов. Таблица не информативна, т.к., посмотрев интересующие меня книги, обнаружила, что в таблице они никак не отмечены цветом, а на странице самой книги отмечено, что она вычитывается.
Киньте в меня, пожалуйста, книжкой, которую нужно вычитать.
Отв: Вычитка #5 (2010-I)
К сожалению, вряд ли кто-то сумеет Вам точно указать такую книгу.
Попробуйте подобрать себе что-нибудь интересное здесь: http://lib.rus.ec/stat/tot, полистав файлы в форматах doc, rtf, txt.
Читайте и правьте заодно. :)
Но заранее сказать, что книга нуждается в вычитке, никто не сможет.
Ой, вспомнила! Вдруг Вам будет интересно:
http://lib.rus.ec/a/36186
Нужно вычитать оба doc-файла.
При этом нужно удалить номера страниц, проставить сноски (если они есть). Сноски можно проставить либо при помощи инструментов Word'a (постраничные сноски), либо поставив их в фигурные скобки за словом, к которому они относятся.
Нужно также провести небольшое форматирование - выделить заголовки и стихи.
Заинтересовала Вас такая работа? :)
Отв: Вычитка #5 (2010-I)
Взяла бы на вычитку вот эту книгу http://lib.rus.ec/b/170065 "Сереброкрыл". Только не понимаю как ее взять. Скачать не могу (хочет абонемент или пользу), а кнопки чтения нет.
Отв: Вычитка #5 (2010-I)
http://lib.ololo.cc/b/170065
Отв: Вычитка #5 (2010-I)
Сегодня еще читала Сергея Лукьяненко не помню точно как называется (что-то вроде "Беседы с дьяволом"). Он в фб2 (я с ним не работаю, пока), но в нем есть опечатки, неверные окончания и пропущенные запятые. Если мне не нужно вставлять никаких тегов (так, по-моему, это нзывается), я могу поправить текст и залить его заново?
Отв: Вычитка #5 (2010-I)
http://lib.ololo.cc/b/170065
по ссылке открывается пустая страница
Отв: Вычитка #5 (2010-I)
Пришлите мне в личку свой мэйл, я Вам вышлю.
Отв: Вычитка #5 (2010-I)
после того, как выслала мейл, смогла открыть страницу и скачать оттуда. Начинаю читать. Отметьте.
Отв: Вычитка #5 (2010-I)
В таблице этой книге нет. А на странице редактирования Вы можете самостоятельно отметить: в графе "доп. инф." проставьте "вычитывается". Или Вы и конвертировать будете? Тогда можно поставить "конвертируется".
Отв: Вычитка #5 (2010-I)
Здравствуйте!
Готова заняться Иосиф Бродский Стихи (2) http://lib.rus.ec/b/9097 разобраться в перемешанных стихах, отформатировать
а также Иван Бунин Дневники 1939-1945 годов http://lib.rus.ec/b/177214 вычитать, сделать структуру, расставить сноски
Отв: Вычитка #5 (2010-I)
Отлично! Занесла в таблицу.
Если Вы на странице редактирования книги сделаете пометку, тоже не помешает. ;)
Отв: Вычитка #5 (2010-I)
Взял на конвертацию в фб2 и вычитку книгу Руперта Шелдрейка "Новая наука о жизни" - http://lib.rus.ec/b/180809
Отв: Вычитка #5 (2010-I)
Взял на конвертацию и вычитку "Поколение свиней" Хантера Томпсона - http://lib.rus.ec/a/20018
Отв: Вычитка #5 (2010-I)
Добрый вечер! Отметьте пожалуйста в таблице, что Иосиф Бродский Стихи (2) вычитан.
:)
Отв: Вычитка #5 (2010-I)
Отметила. Спасибо!
Отв: Вычитка #5 (2010-I)
Отметьте, плиз. Взялся поправить массу ошибок в книге Стивена Кинга "Кэрри": http://lib.rus.ec/b/140451. Сравню с бумажным изданием
Хотел посоветоваться, как сделать лучше: Фактически книга состоит из трех частей, соответственно три секции. Примерно 30-40% книги составляют выдержки из книг, газет и т.д., выделенные тегом cite + внутри курсив или bold. В бумажном издании курсив и bold присутствуют также.
Вопрос у меня заключается в следующем: бегло вычитываю книгу с КПК в AlReader-е и то, что выделяется тэгом cite, да еще с дополнительным курсивом и bold-ом внутри выглядит, мягко говоря аляписто... Есть задумка назначить пустые строки подзаголовками, оставить выделение жирным и курсивом, а вот тэг cite снять - ИМХО, подобное форматирование книги будет выглядеть намного читабельнее и нагляднее, нежели просто выделение тэгом цитаты...
Отв: Вычитка #5 (2010-I)
Подождите, подождите. Я тоже читаю на КПК AlReader'ом и цитаты (cite) выглядят прекрасно. Все стили настраиваются под вкус читателя. Размер, цвет, начертание, отступы и т.д. Например, cite выделяется только цветом и отступами (можно и другим шрифтом), а курсив и bold на этом фоне ничего не портят.
Удалять стилевую разметку совершенно нет никакой необходимости! К тому же подзаголовки (subtitle), поставленные для пустых строк, улетят в FBE при первой же обработке скриптами.
В общем, я бы не советовал.
Отв: Вычитка #5 (2010-I)
Спасибо за замечания. Поэтому прежде и спросил, прежде чем действовать.
Тогда оставляю расстановку тэгов as it и правлю орфографию, расстановку абзацев, добавляю курсив, там, где он отсутствует. Все по бумажному изданию. В воскресенье выложу результат.
Кстати, видел в таблице Волки Кальи того же Стивена Кинга: http://lib.rus.ec/b/67272 Книга вроде бы как в работе с 23.02.09. Если актуально, могу взять на себя - опять же есть бумажный вариант книги, есть по чему править...
Отв: Вычитка #5 (2010-I)
<cite> не удалять ни в коем случае, если это цитаты!
курсив внутри цитаты не нужен, т.к. обычно в печатной книжке для того и выделяют курсивом, чтобы читатель понял, что это цитата! Если там все цитаты выделены и курсивом и болдом, то тогда IMHO, имеет смысл убрать курсив и болд, а вот <cite> лучше оставить.
Отв: Вычитка #5 (2010-I)
papamuller. Раз уж переделываете, найдите обложку покрасивее и русскую и иностранную, в сети их, как грязи. И хорошо-бы выходные данные русской книги в Дескрипшн и автора, название и год написания на английском. А так-же переводчика:) Не много прошу?:)
Отв: Вычитка #5 (2010-I)
Igorek67 Description уже заполнил - я обычно с него начинаю работу. Все данные внес. А обложку... Тогда попутный вопрос - если указывается ISBN книги, издательство ее выпустившее, допустимо ли замена обложки? У меня бумажный вариант в этом же исполнении, разве что цветопередача отличается? Можно ли здесь позволять какие-то вольности, или данные должны стыковаться: ISBN - аутентичная обложка бумажного издания?
Отв: Вычитка #5 (2010-I)
Да должны стыковаться. Если есть бумажный вариант, то лучше конечно обложку самому отсканить и сделать скажем 400 пикселей по горизонтали. Гораздо лучше, чем обложка с Оzona к примеру, где по горизонтали 200.
Сам я ставлю обложку и ISBN по одному изданию, а если есть поинтереснее обложка тоже кладу обычно в файл, как и иностранные, если есть. Уж у Кинга то есть:)
Отв: Вычитка #5 (2010-I)
papamuller, если будете добавлять иностранную обложку - не подцепляйте ее в дескрипшен как обложку (сайт именно ее и выберет для демонстрации на странице книги), разместите иллюстрацией в конце книги.
Отв: Вычитка #5 (2010-I)
Zadd, Нет, тэг цитаты оставляю точно. Часть книги сделана просто в виде отсыла к другим источникам - они как раз и цитируются. С курсивом там я разобрался - вместо него должны стоять обычные кавычки, так что спокойно их заменяю. В бумажном варианте было проще - там эта часть книги просто дается уменьшенным шрифтом. Смотрится очень даже, конечно. Ну а у fb2 инструментарий победнее, это понятно.
Igorek67, сделал бы это с удовольствием, был бы сканер в наличии. Но в этом году прикуплю обязательно.
Ronja_Rovardotter, спасибо за совет!
Да, собственно, спасибо всем помогающим здесь в теме таким вот "чечако" как я
Отв: Вычитка #5 (2010-I)
Уменьшенный шрифт можно делать при помощи тегов sub или sup.
Отв: Вычитка #5 (2010-I)
sub и sup не всеми читалками поддерживаются, а cite и есть cite, зачем его еще как-то особо выделять? Каждый читатель может настроить его вид у себя так, как ему нужно. Разве нет?
Страницы