Аналитическое сравнение алгоритмов персонализации Google PageRank

Данная небольшая аналитическая статья представляет собой обзор таких методов персонализации классического алгоритма Google PageRank, как Topic-Sensitive PageRank, Modular PageRank и BlockRank. Она будет интересна, прежде всего, неискушенному читателю.

Дополнение информационного поиска временным измерением — практический пример использования нового подхода на поиске по научным публикациям

В этой статье доказывается, что такие алгоритмы ссылочного ранжирования как PageRank и HITS, отдавая предпочтение старым документам, не берут в расчёт фактор времени: качественные в прошлом, интернет-страницы могут потерять своё качество на данном временном интервале или в перспективе. Результаты экспериментов показывают, что новые подходы являются крайне эффективными.

Алгоритм Google Колибри: стимулирование входного и контент-маркетинга

Относительно недавно Google реализовал новый алгоритм ранжирования под названием «Колибри». В текущем материале представлена точка зрения, в соответствии с которой это нововведение будет способствовать развитию как контентного, так и входного маркетинга.

Методика обнаружения хиджакинга с использованием ссылочных алгоритмов

В текущей работе предлагается методология идентификации сайтов, чья гиперссылочная структура подверглась хиджакингу — одному из основных типов ссылочного спама. Подобного рода веб-сайты сами по себе могут являться надежными, однако их содержимое ссылается на неблагонадежных соседей.

Обучение ранжированию I. Попарный подход. Часть 3: Экспериментальная оценка RankBoost

Познакомившись в предыдущей части с теоретической основой алгоритма RankBoost, мы переходим к анализу тех экспериментальных результатов, которые были достигнуты при его использовании для различных задач.

Крупномасштабное исследование по вычислению ссылочного спама с использованием графовых алгоритмов

Данная работа представляет собой исследование общей структуры и распределения ссылочных ферм на веб-графе. Они извлекаются посредством разложения компонент сильной связанности, сформировавшихся вокруг ядра; перебора максимальных клик, а также с использованием техники минимального разреза для извлечения и расширения числа линкофармов, содержащихся в самом ядре.

Изучение эволюции ссылочных ферм с использованием временного ряда состояний веб-графа

В данном исследовании рассматривается сильно связанные компоненты веб-графа, некоторые из которых являются ссылочными фермами. Детекция линкофармов производится при помощи рекурсивного алгоритма разложения компонент с узловой фильтрацией; исследуется распределение размеров/тематик ссылочных ферм, а также их эволюция на крупномасштабном японском интернет-архиве, собранном за 3 года.

Альянсы ссылочного спама

В текущей работе проводится исследование того, каким образом автономные спам-фермы могут комплексироваться в оптимальные манипулятивные альянсы, которые увеличивают оценки целевых страниц, присваиваемые ссылочными алгоритмами ранжирования. Кроме всего прочего, подробно анализируются две возможные гиперссылочные структуры, использующиеся в крупных альянсах; одна из которых объединяет целевые документы в веб-кольцо, а другая формирует взаимно-связанное ядро.