Дополнение информационного поиска временным измерением — практический пример использования нового подхода на поиске по научным публикациям

В этой статье доказывается, что такие алгоритмы ссылочного ранжирования как PageRank и HITS, отдавая предпочтение старым документам, не берут в расчёт фактор времени: качественные в прошлом, интернет-страницы могут потерять своё качество на данном временном интервале или в перспективе. Результаты экспериментов показывают, что новые подходы являются крайне эффективными.

Алгоритм Google Колибри: стимулирование входного и контент-маркетинга

Относительно недавно Google реализовал новый алгоритм ранжирования под названием «Колибри». В текущем материале представлена точка зрения, в соответствии с которой это нововведение будет способствовать развитию как контентного, так и входного маркетинга.

Методика обнаружения хиджакинга с использованием ссылочных алгоритмов

В текущей работе предлагается методология идентификации сайтов, чья гиперссылочная структура подверглась хиджакингу — одному из основных типов ссылочного спама. Подобного рода веб-сайты сами по себе могут являться надежными, однако их содержимое ссылается на неблагонадежных соседей.

Обучение ранжированию I. Попарный подход. Часть 3: Экспериментальная оценка RankBoost

Познакомившись в предыдущей части с теоретической основой алгоритма RankBoost, мы переходим к анализу тех экспериментальных результатов, которые были достигнуты при его использовании для различных задач.

Крупномасштабное исследование по вычислению ссылочного спама с использованием графовых алгоритмов

Данная работа представляет собой исследование общей структуры и распределения ссылочных ферм на веб-графе. Они извлекаются посредством разложения компонент сильной связанности, сформировавшихся вокруг ядра; перебора максимальных клик, а также с использованием техники минимального разреза для извлечения и расширения числа линкофармов, содержащихся в самом ядре.

Изучение эволюции ссылочных ферм с использованием временного ряда состояний веб-графа

В данном исследовании рассматривается сильно связанные компоненты веб-графа, некоторые из которых являются ссылочными фермами. Детекция линкофармов производится при помощи рекурсивного алгоритма разложения компонент с узловой фильтрацией; исследуется распределение размеров/тематик ссылочных ферм, а также их эволюция на крупномасштабном японском интернет-архиве, собранном за 3 года.

Альянсы ссылочного спама

В текущей работе проводится исследование того, каким образом автономные спам-фермы могут комплексироваться в оптимальные манипулятивные альянсы, которые увеличивают оценки целевых страниц, присваиваемые ссылочными алгоритмами ранжирования. Кроме всего прочего, подробно анализируются две возможные гиперссылочные структуры, использующиеся в крупных альянсах; одна из которых объединяет целевые документы в веб-кольцо, а другая формирует взаимно-связанное ядро.

Под микроскопом: использование статистики пост-поискового маршрута в информационном поиске

Анализ пост-кликовых поисковых маршрутов дал важную информацию о пользовательском поведении и помог улучшить качество поиска. Однако по-прежнему мало изучена полезность различных свойств поисковых маршрутов для использования в современных моделях ранжирования. Данное исследование, проведенное компанией Яндекс, рассказывает о более углубленном изучении пользовательского поведения за пределами страниц с результатами органической выдачи.