TemporalRank: гиперссылочный анализ с использованием временного ряда состояний веб-графа

В данном материале описывается алгоритм ссылочного ранжирования TemporalRank, который использует множество мгновенных снимков состояния веб-графа как его временную характеристику. В нем также используется кинетическая модель, интерпретирующая предложенный алгоритм.

Микроэволюция веб-страниц с частыми обновлениями

В данной работе рассматривается актуальность использования распределения Пуассона для отображения частотной характеристики обновления веб-страниц, на которых наблюдаются регулярные изменения.

Поведенческие факторы. Часть 5: Детальный анализ алгоритмов ранжирования BrowseRank Plus и MobileRank

В данной части исследования подробно разбираются алгоритмы ранжирования BrowseRank Plus и MobileRank с использованием фреймворка Маркова. В отличие от классического BrowseRank, который получается из непрерывного Марковского процесса, BrowseRank Plus и MobileRank следуют из Зеркального Полумарковского процесса.

Сравнение поиска Google и Bing на предмет наличия в топовых результатах органической выдачи зараженных веб-сайтов

Исследование немецкой лаборатории AV-TEST показало, что вопреки предпринимаемым усилиям по противодействию предоставления пользователям в топовых результатах органической выдачи веб-сайтов, зараженных вредоносным программным обеспечением, в поиске Google, Bing, Яндекс, а также Blekko в ряде случаев наличествуют ресурсы с вредоносным контентом.

Поведенческие факторы. Часть 6: От экспериментов с BrowseRank Plus и MobileRank к алгоритму Fresh BrowseRank

В заключительной части исследований, посвященных поведенческим факторам, рассматриваются эксперименты с алгоритмами ранжирования BrowseRank Plus и MobileRank с последующим знакомством с алгоритмом Fresh BrowseRank, который разработан компанией Яндекс и учитывает фактор свежести интернет-страниц.

Алгоритм HITS: авторитетные источники в гиперссылочной среде

В данной классической научной работе Джона Клейнберга вы познакомитесь с алгоритмом авторитетности, основанного на взаимосвязи между количеством релевантных авторитетных страниц и множеством «хаб-страниц», что объединяет их в ссылочную структуру.

Построение достоверного веб-графа с учетом данных о пользовательском поведении

В задачах оценки качества интернет-документов освещается нестандартное решение: построение специализированного гиперссылочного графа, который использует данные о поведении пользователей при сёрфинге. Результаты эксперимента показывают, что модели, созданные с использованием данных пользовательского поведения являются более эффективными по сравнению с оригинальным Веб-графом при оценке качества веб-сайтов.

Противодействие спаму: новый алгоритм пропагации, основанный на данных пользовательских кликов

В текущей работе предлагается новаторский алгоритм, использующий анализ пользовательских кликов и итеративно распространяющего спам-оценки между пользовательскими запросами и URL-адресами, содержащихся в исходной выборке. В работе используется гиперссылочная структура двудольного кликового графа для обнаружения других страниц/сайтов, которые, с определенной долей вероятности, могут также являться спамом.

Мошенническая двухпоточность: взаимосвязь веб-спамеров с рекламодателями

Кроме рассмотрения технологии сокрытия, в настоящем материале представляется пятислойная двухпоточная модель, предназначенная для исследования спама, использующего перенаправления. В ней рекламные объявления рекламодателей следуют через синдикаторов, агрегаторов и перенаправляющие домены, отображаясь, в конечном счете, на дорвейных страницах; в то время, как трафик следует в обратном направлении.