скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Океана RE:Подайте бедному копеечку на книжку с литреса... 8 часов
sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 17 часов sem14 RE:Современная корейская литература. Книжная серия... 17 часов monochka RE:<НРЗБ> 4 дня sem14 RE:Серия "Символы времени" издательства "Аграф" 1 неделя sem14 RE:Собираем серию: "Азбука-триллер", издательство "Азбука-Терра" 1 неделя sem14 RE:«Юмористическая серия» 1 неделя larin RE:Оплатил. Абонемент не отображается 1 неделя larin RE:Оплатил, но абонемент не отображается 2 недели nehug@cheaphub.net RE:DNS 2 недели alexk RE:Багрепорт - 2 3 недели Isais RE:Семейственность в литературе 4 недели Violontan RE:Жан Батист Мольер воскрешенный 1 месяц sem14 RE:Гонкуровская премия 1 месяц Dead_Space RE:Беженцы с Флибусты 1 месяц Саша из Киева RE:Приключения белочки Рыжки 1 месяц alex-from RE:Оплатил два раза, но абонемента нет 1 месяц Kiesza RE:На 78-м году жизни скончался советский и российский... 1 месяц Впечатления о книгах
RedRoses3 про Михалёва: Безупречные создания [litres] (Исторический детектив, Исторические любовные романы)
26 12 Очень неплохо. хорошо закрученная интрига и соввершенно неожиданный финал. Оценка: отлично!
Олег Макаров. про Василий Анатольевич Криптонов
26 12 Открытие для меня вчера этот автор Начал читать "Заметки на полях" — прямо восторг от стиля. Последние годы так было только с Капбой и Мусанифом. В общем, если вам важно не только "о чём" написано, но и "как" — рекомендую
vladimir1098 про Кинг: Не дрогни (Триллер)
25 12 Очень много ошибок, сложно читать, я решил подождать официальный перевод, тем не менее спасибо переводчикам за работу
alexk про Павлов: Древесный маг Орловского княжества 10 (Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
25 12 Непонятно мне ни фига: стандартный скрипт FBE не превращает "кто-то" в "кто — то". Это руками тупо все дефисы на тире с пробелами меняются, или автор файла так над скриптом поизгалялся?
Никос Костакис про Панфилов: Улан. Экстремал из будущего (Альтернативная история, Попаданцы)
24 12 ."Одел подштанники" _______________________ На кого?
Олег Макаров. про Карелин: Одиссей Фокс [СИ] (Детективная фантастика, Космическая фантастика, Приключения: прочее, Самиздат, сетевая литература)
24 12 За одно только "пребудет" без "и" в аннотации стоит попробовать почитать
Perca про Первухин: Товарищ маг (Альтернативная история, Приключения: прочее, Попаданцы, Самиздат, сетевая литература)
24 12 Не самый плохой писатель, но и он скатился в победобесие. Осталось только ждать веселые приключения мага на СВО.
tvv про Далин: Фарфор Ее Величества (Героическая фантастика, Фэнтези, Самиздат, сетевая литература)
23 12 Номера 4-6 в серии - это подсерия Костер и Саламандра.
Олег Макаров. про Тыналин: Инженер 1: паровая империя (Альтернативная история, Приключения: прочее, Попаданцы, Самиздат, сетевая литература)
22 12 Barbud спасибо, подтолкнули поинтересоваться. Вот что я нашёл: В 1856 году (в разгар Крымской войны и реформ Флоренс Найтингейл) медперсонал в больницах не носил белые халаты — это гораздо более поздняя традиция. ОДЕЖДА ………
Barbud про Тыналин: Инженер 1: паровая империя (Альтернативная история, Приключения: прочее, Попаданцы, Самиздат, сетевая литература)
22 12 1856 год... По госпиталю ходит медперсонал в белых халатах... ЧТО? Вспомнились строки пародиста Иванова, написанные по другому поводу, но вполне уместные: "Ты бы, дяденька, прежде чем что-то писать, Потрудился хотя бы об этом узнать". Оценка: нечитаемо
mysevra про Есаулкова: Удивительные истории о ведьмах [litres] (Ужасы, Современная проза)
22 12 По сути – очень интересно, но почему-то получилась лютая кустарщина. Одна надежда была на Бобылёву, но я утомилась ждать и не захотела дочитывать. Оценка: неплохо
mysevra про Государев: Треугольный человек (Психология)
22 12 «Научпоп» в лучшем смысле этого слова - мне как не специалисту было и понятно, и интересно. Оценка: отлично! |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.