скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Океана RE:Подайте бедному копеечку на книжку с литреса... 2 дня
Саша из Киева RE:Горящие паруса 4 дня Саша из Киева RE:Подвиг героев - судьба страны. МНР: люди и годы 1 неделя commodore RE:Письма 3 недели Саша из Киева RE:Три минуты истории 3 недели nehug@cheaphub.net RE:Как бы с этим побороться и побороть? 1 месяц Саша из Киева RE:Книги на латышском языке 1 месяц stevecepera RE:Список современных французских писателей? 1 месяц etorus2008 RE:Отв: Помогите найти книгу по описанию 1 месяц lemma7 RE:Чёрный нимб и другие истории, исполненные неизъяснимого ужаса 1 месяц Wedmak RE:Помогите найти!.. #2 1 месяц sem14 RE:Координация сканирования и вычитки 1 месяц babajga RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 месяца Isais RE:Мои открытия 2 месяца kopak RE:О группе Дятлова. О той самой, того самого... 2 месяца A5. RE:Не присылает пароль на почту 2 месяца babajga RE:Плюмаж 2 месяца babajga RE:Блошкинс и Фрю. Опасное путешествие 2 месяца Впечатления о книгах
Лысенко Владимир Андреевич про Аzнеп: Вагнер. Дорога на Бахмут. 300! 30! 3! (О войне)
21 06 У наемников нет Родины, только бабки, им все равно кого убивать, лишь бы платили. Оценка: нечитаемо
trampak про Хоскинг: Россия: народ и империя, 1552–1917 [Russia: People and Empire, 1552–1917 ru] (История)
21 06 Сам себя не похвалишь - день зря прошёл. "Величайшей в истории" ну-ну.Вот оригинальная аннотация английского издания:Знаменитая книга Джеффри Хоскинга дает нам новую призму, через которую можно рассматривать русскую историю, ………
mysevra про Рампо: Чудовище во мраке (Классический детектив)
21 06 Прелесть какая! Есть фильм с Бенуа Мажимелем, адаптированная для западных людей версия, но мне она показалась более прямолинейной и грубой. К тому же в ней нет таких диковинок, как, например, восхищение чувственностью красных ……… Оценка: отлично!
mysevra про Гранже: Обещания богов (Полицейский детектив, Триллер, Детективы: прочее)
21 06 Прочитала запоем, очень необычная подача. Предвоенная паранойя и люди, ещё не отошедшие от последствий первой войны – тревожно-будоражащее впечатление, зато книга не оставляет равнодушной. Никогда не задумывалась, а как себя ……… Оценка: отлично!
mysevra про Дивов: Ночной смотрящий (Фэнтези)
21 06 Выразительный язык, яркие персонажи. Возможно, перебор с чернушным натурализмом и бытовухой. В общем, если вы ждёте привычного романтического взгляда на вампиризм, то лучше читайте Вампирские хроники Райс или Киндрэт. Оценка: отлично!
Drangool про Шайтан Иван
20 06 Идея не нова, текст на уровне ученика 5 класса. Осилил треть первой книги, далее не смог. Автор, научись нормально выделять диалоги в соответствии с правилами русского языка.
udrees про Лей: Выжившие [СИ] (Боевая фантастика, Постапокалипсис, Самиздат, сетевая литература)
20 06 Кому нравится сюжет про выживание в мире когда начался зомби-апокалипсис, книга наверное зайдет. Главные герои не супермены, но с оружием обращаться умеют, страйкболисты, так что шанс выжить умеют. Но конечно психологически ……… Оценка: хорошо
udrees про Вальтер: Я должен её найти 2 (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
20 06 Мир напоминает чем-то мир Каменистого Артему – STICKs, только примитивнее. Сама книга написана достаточно примитивно, автор спешил уложить все приключения в одну книгу. Герои все одинаковые в ином мире – бродяги, алкоголики, ……… Оценка: неплохо
udrees про Вальтер: Жажда [СИ] (Боевая фантастика, Триллер, Постапокалипсис, Самиздат, сетевая литература)
20 06 Хорошая книга про пост-апокалипсис, только не с зомби, а вампирами. Автор ничего не стал нового выдумывать – просто в одну ночь одна часть переродилась в вампиров и напала на другую часть людей. Главный герой хоть не супермен, ……… Оценка: хорошо
udrees про Зандер: Королева праха и боли [litres] (Ужасы, Фэнтези, Любовная фантастика, Попаданцы)
20 06 Вторая книга порнографического романа про связь женщины и дьявола – бессмертного существа, повелевающего мертвыми. В этой связи все сцены в книге замешаны на некрофилии, раз секс происходит с мертвой женщиной. Можно оценить ……… Оценка: неплохо
FVlad про Дэвид Гриннэл
20 06 Нужно его объединить с http://lib.rusec.net/a/316447. Это тот же автор - https://fantlab.ru/work226289
Lan2292 про Богдашов: Реинкарнация архимага (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
20 06 Скучновато, без огонька, не стала дочитывать. Оценка: неплохо |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.