Время на прочтение: 2 минуты
23 марта 2024
Идея анализа поведения юзеров поисковиками не нова. Но эффективное применение на практике она получила не так давно, благодаря существенному росту числа инструментов для отслеживания, оценки и хранения данных.
Первой системой в этой сфере является американская технология поиска Direct Hit. В девяностых годах прошлого века поисковик начал ранжировать с учетом кликабельности HTML-файла (веб-страницы) в разных рейтингах и выдаче остальных систем. Таким образом, Директ Хит создавал некий каталог самых востребованных у юзеров страниц по конкретным запросам. Данные в ее выдаче использовались и другими поисковиками.
Значительным минусом системы было отсутствие необходимой мощности для хранения всех сведений, инструментов для отслеживания статистики и малое количество критериев поведенческих факторов.
В 2000х годах на смену пришла технология Browse Rank от компании Microsoft. Поисковик учитывал переходы юзеров по ссылкам одного HTML-файла на другой и продолжительность присутствия на конкретном ресурсе.
Аналогия работы данной системы: математический граф, где узлы – это веб-страницы, а связи – клики по ссылкам:
Схема переходов юзеров с одного HTML-файла на другой на примере матграфа
Алгоритм Browse Rank был создан для смены традиционного Page Rank. Это дало возможность убрать из ранжирования ресурсы, созданные лишь для продажи ссылочной массы, и существенно повысить влияние ссылок с актуальных площадок. Учет времени присутствия на ресурсе позволил анализировать востребованность тех или иных сведений. Информация по длительности или числу переходов, которые значительно разнились от средних показателей пользовательской истории поиска, не принимали участие в поисковом анализе, чтобы исключить возможности накрутки.
В отличие от традиционного PageRank, эта система дала возможность существенно повысить качество выдачи и автоматизировать отсеивание большого числа невостребованных площадок.