скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
sem14 RE:Гонкуровская премия 1 час
nehug@cheaphub.net RE:DNS 22 часа нэнси RE:Подайте бедному копеечку на книжку с литреса... 22 часа Dead_Space RE:Беженцы с Флибусты 2 дня Саша из Киева RE:Приключения белочки Рыжки 2 недели alex-from RE:Оплатил два раза, но абонемента нет 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 недели Kiesza RE:На 78-м году жизни скончался советский и российский... 2 недели Paul von Sokolovski RE:Бушков умер. 4 недели lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 4 недели mig2009 RE:Багрепорт - 2 1 месяц Isais RE:Издательство "Медуза" 1 месяц babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 1 месяц Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 месяц sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц Isais RE:Игорь Северянин - Том 2. Поэзоантракт 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц sem14 RE:Семейственность в литературе 1 неделя Впечатления о книгах
Perca про Распопов: Фараон [СИ] (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
21 11 Аннотация коротко: приключения российского дикаря в цивилизованном Древнем Египте. Если подробнее: сын олигарха, на спор с папой выучивший историю античного Египта (и больше ничего), попадает в этот самый Египет в эпоху ………
su24i про Поселягин: Кровь Архов. Книга первая [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
20 11 Лютая поселягинщина. Сдался после 80-й страницы. Оценка: нечитаемо
Лысенко Владимир Андреевич про Москаленко: Юный бастард. Книга 5 [СИ] (Боевая фантастика, Фэнтези, Самиздат, сетевая литература)
20 11 Очень хорошая книга. Жду продолжения. Оценка: отлично!
Дей про Останин: Жнец [СИ] (Детективная фантастика, Юмористическая фантастика, Городское фэнтези, Самиздат, сетевая литература)
19 11 Очень неплохо. Жаль, что автор не настроен на продолжение. Оценка: отлично!
Олег Макаров. про Земляной: Волшебник [СИ] (Альтернативная история, Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
18 11 Полная непонимание автором проблем и причин развала советского союза. Глубочайшая экономическая безграмотность Возможно дальше будет интересно но я бросил в самом начале Оценка: нечитаемо
Анни-Мари про Петросян: Дом, в котором... (Современная проза, Магический реализм)
18 11 Книга странная. Необычная и ни на что не похожая. Собственно, хоть какие-то параллели я лично смогла провести только с книгой "Мастер и Маргарита". И вовсе не потому, что они похожи. Просто в обеих книгах присутствует то, ………
Лысенко Владимир Андреевич про Богдашов: Реинкарнация архимага 3 (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
18 11 Прочитал все книги серии, написано неплохо. Оценка: хорошо
Nicout про Резанова: Чудо и чудовище (Историческое фэнтези)
18 11 дурацкий знак качества" Давно, во времена совка, прошел международный конгресс детективов. Утром выясняется, что около кровати председателя конгресса кто-то насрал. Начинают допрашивать делегации. Французы говорят - это ………
alexk про Резанова: Чудо и чудовище (Историческое фэнтези)
18 11 дурацкий знак качества и мания величия isais, ничего не поправить, ничего не дополнить
mazay про Arladaar
18 11 Жеке сегодня, как минимум, под 70. Так что Аня могла бы быть Жекиной внучкой. Тем более, что писал, всё-таки, мужчина. Или диктовал!
Олег Макаров. про Максимушкин: Бомбардировщики (Альтернативная история)
17 11 строители коммунизма и последователи национал-социализма решили объединиться" ... вот это аттракицон срывания всех и всяческих масок Удивительно, что автор не привлечён до сих пор ни по какой статье |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.