скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
commodore RE:Письма 1 день
Саша из Киева RE:Три минуты истории 2 дня DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 3 дня nehug@cheaphub.net RE:Как бы с этим побороться и побороть? 1 неделя Саша из Киева RE:Книги на латышском языке 1 неделя stevecepera RE:Список современных французских писателей? 3 недели etorus2008 RE:Отв: Помогите найти книгу по описанию 1 месяц lemma7 RE:Чёрный нимб и другие истории, исполненные неизъяснимого ужаса 1 месяц Wedmak RE:Помогите найти!.. #2 1 месяц sem14 RE:Координация сканирования и вычитки 1 месяц babajga RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 месяц Isais RE:Мои открытия 1 месяц kopak RE:О группе Дятлова. О той самой, того самого... 1 месяц A5. RE:Не присылает пароль на почту 1 месяц babajga RE:Плюмаж 2 месяца babajga RE:Блошкинс и Фрю. Опасное путешествие 2 месяца alexk RE:Багрепорт - 2 2 месяца babajga RE:Удивленная сова 2 месяца Впечатления о книгах
nik_ol про Платова: Увидимся в темноте (Детективы: прочее)
03 06 А где Виктория-то, она жива? Почему больше не пишет? Оценка: хорошо
mysevra про Витковский: Земля Святого Витта (Альтернативная история)
02 06 Потрясающий слог. Феерия фантазии. Но автор в своём слое реальности так увлекается построением предложений, что за ним не всегда угнаться. К тому же этот лёгкий привкус хронического стёба – это, знаете ли, не каждому по плечу. Оценка: неплохо
mysevra про Бардуго: Король шрамов [litres] (Героическая фантастика, Фэнтези, Городское фэнтези)
02 06 Немного подростково, немного затянуто – ну, так никто и не обещал большего. Но в целом неплохо, так как продолжает полотно grishaverse. Оценка: хорошо
mysevra про Свечин: Охота на царя [litres] (Исторический детектив)
02 06 Действия капитана Оливопольського полка – беспрецедентная атака на храм – восхитительное в своей простоте решение. Быстро и эффективно. Книга, бесспорно, хороша. Оценка: отлично!
Sello про Джианелла: Меня зовут Грета. Голос, который вдохновил весь мир (Образовательная литература, Публицистика, Экология)
01 06 Настолько все обесценилось в наши дни, что порой оторопь берет. Наблюдается изменение климата? Несомненно. Негативные последствия этого явления имеют место? Конечно. Необходимы ли шаги по улучшению создавшегося положения. ……… Оценка: нечитаемо
Г.Гуслия про Эдуард Тен
01 06 Полное собрание современных российских штампов. Попаданец ГГ - конечно же ветеран спецназа, конечно же владеет любым холодным оружием так, что опытнейшие бойцы падают на пятой секунде боя, конечно же стреляет из карамультука ………
Олег Макаров. про Джианелла: Меня зовут Грета. Голос, который вдохновил весь мир (Образовательная литература, Публицистика, Экология)
31 05 Единственная причина, по которой эта книга имеет право на существование: свобода слова. В смысле, если есть люди, которым это нравится, они имеют право этим наслаждаться. (правда, тогда и любые другие книги не могут быть запрещены) Оценка: нечитаемо
pulochka про Джианелла: Меня зовут Грета. Голос, который вдохновил весь мир (Образовательная литература, Публицистика, Экология)
31 05 Кто такая Грета Тунберг? Тупая и больная на всю голову идиотка.Еще и рекламу этой мрази. создают. Оценка: нечитаемо
Belomor.canal про Иванов: Речфлот. История речного флота Российской империи и Советского Союза (История, Транспорт и авиация, История техники)
31 05 Это матчасть к Бронепараходам. Сам по себе очень интересный текст, ведь речфлот основа купеческой логистики и именно тут кипучая сметливая активность была явлена в чистом виде! Ещё раз интереснейшая сторона нашей Истории. Оценка: отлично!
Олег Макаров. про Адвокат
29 05 Адвокат вольного города Забавно: первая книга прямо совсем неплохо, а вторая - как будто левой задней ногой написано. третью не стал уже читать
Belomor.canal про Лимонов: История его слуги (Современная проза, Контркультура)
29 05 Лимонов Большой Писатель - последний из могикан! читаем и перечитываем! Оценка: отлично!
APN1968 про Три сапога - пара
28 05 Мне понравились первые две книги. Местами есть юмор, сюжет пока интересный. Буду читать дальше. |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.