Вы здесьПроверка валидности fb2-файла при загрузке ???
Опубликовано ср, 27/08/2008 - 05:42 пользователем Ghost mail
Forums: Сложно ли добавить автоматическую проверку валидности книг перед их загрузкой на сайт и "не пропускать" невалидные файлы ???
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Isais RE:Семейственность в литературе 2 дня
Океана RE:Подайте бедному копеечку на книжку с литреса... 3 дня miri.ness_ RE:Доступ 27 4 дня bmusanov Оплатил, но абонемент не отображается 6 дней holla RE:Багрепорт - 2 1 неделя sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 неделя konst1 RE:Файнридер для Win11 1 неделя larin RE:Оплатил, но абонемент не отображается 1 неделя sem14 RE:Книжная серия «Сlio» издательства "Евразия" 2 недели Isais RE:Национальный конкурс на лучшее литературное произведение... 2 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 2 недели sem14 RE:Современная корейская литература. Книжная серия... 2 недели sem14 RE:«Морской роман» — книжная серия Калининградского книжного... 2 недели larin RE:Оплатил,но абонемент не отображается 2 недели sd RE:Fishing 3 недели Алексей111111111111 RE:Оплатила,но абонемент не отображается 3 недели kopak RE:Беженцы с Флибусты 3 недели Isais RE:Вадим Иванович Туманов - Всё потерять - и вновь начать с... 3 недели Впечатления о книгах
Синявский про Евгений Львович Чижов
11 08 11 авг - РИА Новости. Писатель Евгений Чижов утонул в Балтийском море, сообщил его друг, писатель Дмитрий Данилов.
decim про Астраби: Сумма наших жизней (Современная проза)
11 08 Дамский роман с психологией. На копейку сложнее стандартного "арлекина", но и только. Годится для чтения в зале ожидания или вагоне. Неплохо. Оценка: неплохо
dolle про Михайлов: Инфер-10 (Боевая фантастика, Киберпанк, Постапокалипсис, Самиздат, сетевая литература)
10 08 Оди опять вернулся. Без нейроимплантов и прочих " плюшек" он скрывается от матери. Новый сюжет, новые локации и интрига в конце книги.
udrees про Михайлов: Инфер-10 (Боевая фантастика, Киберпанк, Постапокалипсис, Самиздат, сетевая литература)
10 08 Я думал история Оди завершилась вполне логично в 9-й книге, ан-нет, триумфальное возвращение гоблина. Правда там не объясняется, откуда он выполз и куда подевался его экзо-костюм Ночная гадюка. Помнится в 9-й книге он в нем ……… Оценка: отлично!
udrees про Докинз: Бог как иллюзия [The God Delusion ru] (Религиоведение, Философия)
10 08 Очень познавательная книга, исследующая возникновение и пользу религии в жизни человека. Мне в общем-то понравилось, как автор раскладывает по полочкам основные моменты того, как религия влияет на нашу жизнь, рассматривает ……… Оценка: отлично!
udrees про Жуков: Человек в космосе. Отодвигая границы неизвестного [сборник litres] (Научная литература: прочее)
10 08 Книга – просто набор интервью разных людей, приглашенных на конференцию посвященной космосу. Здесь и космонавты, и ученые, и биологи, астрономы, и певцы) В общем-то большей частью читать скучно, все повторяются. Космонавты ……… Оценка: плохо
udrees про Атаманов: Забаненный 4 (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
10 08 Наверное достойное завершение серии про Забаненного, персонаж наконец-то достигнет своей цели. Написана книга хорошо, сюжет очень живой и не позволяет заскучать, поэтому читается очень легко. Разговоры персонажей тоже нормальные, ……… Оценка: хорошо
mysevra про Муравьева: Как воспитывали русского дворянина. Опыт знаменитых семей России – современным родителям (История, Педагогика)
09 08 Восхитительная книга. Нечто вроде «Лорд должен». Сейчас у нас таких людей уже не делают. Оценка: отлично!
mysevra про Нечуй-Левицкий: Кайдашева сім’я [uk] (Классическая проза)
09 08 Навіщо я його перечитала? Писав майстер, інакше мене б не трусило від злості та огиди. Мені вкрай не подобається історія і персонажі, але ж дійсно шедевр, оскільки одним із завдань літератури є змусити читача задуматися. Оценка: хорошо
mysevra про Чёрч: Во тьме безмолвной под холмом [litres] (Ужасы, Триллер)
09 08 Ну кто же не любит на ночь истории о старых недобрых богах? Живенько так, с фантазией. Оценка: отлично!
edik_m про Филипенко: Кремулятор (Современная проза)
09 08 Тяжелая книга. Вряд ли её можно рассматривать как достоверное историческое свидетельство, но моим представлениям о той эпохе она вполне соответствует. Оценка: хорошо
francuzik про Астахов: Император Пограничья 9 (Боевая фантастика, Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
08 08 Какая-то хрень. Картон и наивняк. Оценка: плохо |
Отв: Проверка валидности fb2-файла при загрузке.
Сложно ли вам, Ghost mail, указать в своем сообщении утилиту для "проверки валидности" fb2, которую вы предлагаете ???
Отв: Проверка валидности fb2-файла при загрузке.
Однако, эти редакторы-утилиты для работы с командной строки, а нужна проверка на php, которая бы работала на веб-сервере перед загрузкой файла книги.
В-действительности, прежде всего этот вопрос нужно решить "политически" - нужно или не нужно 8-)
Мое личное мнение,- нужно. Лучше пусть будет немного меньше книг, но они будут "качественнее" (будут соответствовать стандарту FB2)
Отв: Проверка валидности fb2-файла при загрузке.
Предлагаете "прикрутить" FBE? Или fb2fix? :)
Идеально "валидных" fb2-файлов на сегодня не существует, как и программы, которая бы это определяла - и все благодаря "стандарту FB2". За работой скриптов приходится убирать вручную, валидность книги - определять "на глазок".
От "политического" решения ничего не изменится - кроме громких фраз: программа не появится, вычитка файлов не улучшится. Кроме того, найдя незакрытый тег в fb2-книге - гораздо легче его закрыть, чем брезгливо отбросить этот файл и отсканировать книгу по-новой.
Отв: Проверка валидности fb2-файла при загрузке ???
И файл может быть невалидным, но содержать полный текст, и другого в библиотеке может не быть. Невалидность мы поправим.
Отв: Проверка валидности fb2-файла при загрузке ???
Не пропускать невалидные файлы - это вряд ли реально нужно, а вот некая пометка, позволяющая невалидников обнаружить - не помешала бы.
Отв: Проверка валидности fb2-файла при загрузке ???
А кто-нибудь более-менее формально описать процедуру валидации может?
Разобрать XML, проверить возможность тэгов и словарно-кодируемых полей?
Всё?
Если всё, я в свой скрипт могу это добавить (XML-разбор там уже есть)...
Он, правда, не на ПХП, а на Питоне, но не думаю, что это нынче проблема для большинства хостингов.
Отв: Проверка валидности fb2-файла при загрузке ???
Формализовать процедуру "исправления" невалидного файла, чтобы он стал валидным, почти невозможно. Можно только пытаться проверять и исправлять набор часто встречаемых ошибок (как-то : неправильный порядок тегов 'title' и 'epigraph'; тег 'title' в середине текста; оформление стихов в тексте тегом 'epigraph' и так далее).
Однако задавая вопрос в теме топика я имел в виду : проверять валидность перед загрузкой на сервер и в случае ошибок,- сообщать пользователю об этом и не загружать невалидный файл. Подразумевается, что после этого пользователь потратит еще 1-2 минуту на исправление своего файла, и загрузит этот файл исправленным 8-)
Отв: Проверка валидности fb2-файла при загрузке ???
>тег 'title' в середине текста
А это из чего следует что невалидно? это допускает схема, и, более того, явно присуствует в примерах на fictionbook.org.
Это какой-то тогда не XML уже получается, а некий формат издалека напоминающий XML :-)
Отв: Проверка валидности fb2-файла при загрузке ???
title должно быть в начале секции. Это переводится как заголовок, если вы не в курсе. В середине секции title быть не может.
Правильно:
<section>
<title></title>
<p></p>
<p></p>
</section>
Не правильно:
<section>
<p></p>
<title></title>
<p></p>
</section>
Отв: Проверка валидности fb2-файла при загрузке ???
Отв: Проверка валидности fb2-файла при загрузке ???
Проверка валидности очень не помешала бы.
В некоторых файлах, (в них сказано что сделаны они в "LibRusEc kit") пометки, сноски, перевод разных понятий заключены в знаки < >,хотя по спецификации XML они должны быть в виде
< >
соответственно, также иногда попадается знак & (амперсанд) хотя и он должен быть написан не прямо, а специально вот так&
Из-за таких нарушений формата разметки XML некоторые файлы не возможно читать программами которые четко следуют спецификации XML
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Проверка валидности при загрузке fb2-файлов от автора "LibRusEc kit" - хорошая шутка, спасибо :)
Если серьезно - дайте ссылки на книги, а еще лучше - давайте исправим их вместе.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Я могу сгенерить список. Только, боюсь, в нем будет несколько десятков тысяч (не несколько тысяч, а несколько десятков тысяч) книг. И што мы будем с ими делать?
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Точнее, 47 642 : http://lib.rus.ec/stat/document-author .
Проверить на другие варианты файла - скачать - открыть - поиск символов с автозаменой - сохранить - залить на Либрусек.
repeat
Всего по 23 821 на рыло.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
:) Да, рыла могут треснуть.
На самом деле немножко меньше: у меня готовятся что-то в районе четырех тысяч книг с Алдебарана/Литреса, которые будут заменой Либрусек-Киту. Но пока никак не приспособлюсь чтобы залить их без ручных разборок с дублями... :((
С другой стороны - супротив 47-ми тысяч оно не то чтобы совсем уж мертвому припарки... но и ненамного больше.