gauloises

вот оно как оказывается


Произведения, наиболее похожие по частоте слов на блог zam0th v. 0.8

Туризм: Дмитрий Кинкулькин.Вернувшись из Непала

Роджер Желязны: Дева и чудовище

Хулио Кортасар: Желтый цветок

Анатолий Алексин: Третий в пятом ряду

Дмитрий Горчев: Красота

Джером Сэлинджер: Над пропастью во ржи

Туризм: Кереть-Луокса-Кереть. Краткий обзор 1999

Александр Лыхвар: Обратная сторона

Дмитрий Каралис: Каков садовник, такова и роза

Александр Сергеевич Пушкин: К.Я.Грот. Пушкинский Лицей (1811-1817)


(c) stanislav_mikov
А какие произведения похожи на ваш блог???


спасибо sandrixxx =)
Tags: ,
Ещё насчёт теста
Как-то я не ожидал, что этот тестик будет таким популярным. Знал бы - подготовился бы получше.
На самом деле, я хотел написать вовсе не о том. Хочется развеять некоторые заблуждения относительно принципов его работы.
1. Тест не учитывает смысловую составляющую постов. Если одним из пунктов в результатах стоит, скажем "Майн Кампф", то это ни в коей мере не означает, что ваш блог похож на это произведение хоть чем-то кроме частоты некоторых слов в словаре. И в нём нет анализа цитат. Если вы вставляете в свой блог кучу цитат из "Библии", вы не получите первой строкой ссылку на Библию.
2. Тест не учитывает стиля текста. Ему совершенно безразлично, как вы пишете, есть ли там знаки препинания и прочее. Все слова переводятся в начальную форму и учитывается только частота по формуле "количество единиц данного слова без учёта формы делить на общее количество слов в тексте". Неизвестные слова приводятся к начальной форме по гипотезе. Все вопросы - к яндексовскому mystem.
3. Чем короче ваши записи, чем больше там неизвестных, заимствованных и искажённых слов, тем меньше будет совпадений по словарям. Конечно, они будут, но не такие интересные.
4. На данный момент не вижу никакой разумной технической возможности получать более 25 последних записей блога без ввода пароля.
5. Адаптировать тест под diary, liveinternet, произвольный RSS итп можно, даже очень легко. Но мне пока неинтересно.