Детекция дистрибьюторов вредоносного программного обеспечения с помощью графовых алгоритмов

В данном исследовании компании Яндекс предлагается новый эффективный алгоритм, который вычисляет веб-сайты, занимающиеся распространением вредоносного программного обеспечения. Для этих целей конструируется двудольный граф с двумя типами узлов: интернет-сайты и файловые хостинги.

Майнинг поисковых маршрутов массового серфинга: идентификация релевантных веб-сайтов на основании пользовательской активности

В настоящем исследовании предлагается подход, позволяющий идентифицировать релевантные источники информации на основании истории скомбинированных поведенческих данных множества пользователей, которые собираются на поиске, а также при просмотре страниц интернет-сайтов.

Аналитическое сравнение алгоритмов персонализации Google PageRank

Данная небольшая аналитическая статья представляет собой обзор таких методов персонализации классического алгоритма Google PageRank, как Topic-Sensitive PageRank, Modular PageRank и BlockRank. Она будет интересна, прежде всего, неискушенному читателю.

Дополнение информационного поиска временным измерением — практический пример использования нового подхода на поиске по научным публикациям

В этой статье доказывается, что такие алгоритмы ссылочного ранжирования как PageRank и HITS, отдавая предпочтение старым документам, не берут в расчёт фактор времени: качественные в прошлом, интернет-страницы могут потерять своё качество на данном временном интервале или в перспективе. Результаты экспериментов показывают, что новые подходы являются крайне эффективными.

Алгоритм Google Колибри: стимулирование входного и контент-маркетинга

Относительно недавно Google реализовал новый алгоритм ранжирования под названием «Колибри». В текущем материале представлена точка зрения, в соответствии с которой это нововведение будет способствовать развитию как контентного, так и входного маркетинга.

Методика обнаружения хиджакинга с использованием ссылочных алгоритмов

В текущей работе предлагается методология идентификации сайтов, чья гиперссылочная структура подверглась хиджакингу — одному из основных типов ссылочного спама. Подобного рода веб-сайты сами по себе могут являться надежными, однако их содержимое ссылается на неблагонадежных соседей.

Обучение ранжированию I. Попарный подход. Часть 3: Экспериментальная оценка RankBoost

Познакомившись в предыдущей части с теоретической основой алгоритма RankBoost, мы переходим к анализу тех экспериментальных результатов, которые были достигнуты при его использовании для различных задач.

Ранжирование данных с помощью алгоритма связанных структур

В настоящей работе предлагается оригинальная идея алгоритма ранжирования текстовых и графических данных, с учетом их внутренних связей. Данные, представленные в виде векторов в Евклидовом пространстве, рассматриваются как извлеченные из многообразия. Алгоритм ранжирования связанных структур позволяет достичь впечатляющих результатов в сортировке изображений.