'

Использование особенностей языка запросов поиска Яндекса для исследований

Понравилась презентация – покажи это...





Слайд 0

Использование особенностей языка запросов поиска Яндекса для исследований Трофименко Е.А. trofimenko.evgeny@rbscorp.ru Корпорация РБС, начальник отдела исследований и аналитики


Слайд 1

Основные идеи доклада Оператор «минус» не применяется к текстам ссылок Оператор «~~» вычищает НПС-результаты из выдачи Можно узнать, как Яндекс расширяет запрос пользователя Контекстных ограничений не существует Польза: Для экспериментов Для оценки конкуренции по запросу Для поиска альтернативных вариантов продвижения Для общей эрудиции


Слайд 2

Операторы Яндекса Присутствие: + (плюс) – слово обязано находиться Исключение: ~~(тильда) – исключение в пределах документа (~ предложения) - (минус) – недокументированный: был исключением в контексте Возможные контексты поиска: Документ (текст), Предложение (текст) Ссылки (анкор-файл) …расстояние в несколько слов или предложений, указанное явно операторами /(-N +N) или &&/(-N +N)


Слайд 3

Запрос [слово -слово]: что найдем? слово – документы, содержащие слово в текстах или во входящих ссылках -слово – исключаются документы, содержащие слово в текстах Итог: найденные по ссылкам документы (сниппет м.б. из Я.Каталога)


Слайд 4

Для чего нужны найденные по ссылке («НПС») результаты с фиксированными словами? Для проведения экспериментов: Выбор множества ссылок на разные документы, которые содержат нужные наборы слов или их последовательности Анализ «весов» конкретных слов в текстах ссылок («анкор-файле») Прикидка весов ссылок


Слайд 5

~ и ~~ : форсируем поиск по текстам и удаляем НПС-результаты Добавляя в любой запрос исключение ~~абракадабры, удаляем НПС: Для длинных запросов доля найденных по ссылке результатов относительно высока:


Слайд 6

Расширение пользовательских запросов Яндекс и раньше мог добавлять в запрос новые слова («что такое Х»), но делал это редко, индивидуально. Сейчас – расширение запроса поставлено на поток. Переходы из одной части речи в другую (гостиницы в Москве -> московские гостиницы) Транслитерация («mazda» -> «мазда») Аббревиатуры (МГУ -> Московский государственный университет) Как узнать слова, которыми расширяется запрос? Используем операторы исключения.


Слайд 7

Исключаем точную форму слова: оставляем переформулировки При исключении слова из запроса – в выдаче остаются и подсвечиваются переформулировки (+найденное в URL):


Слайд 8

Изменение «колдунщика»: отмена ограничения расстояний Колдунщик = расстановка неявных для пользователя ограничений на расстояние между словами, известен с 2004. Например, для запроса «новый год» находились документы, содержащие от «год новый» до «новый [*] [*] год» Эти ограничения можно было посмотреть. Но это закончилось. Однако вручную введенные ограничения отрабатывали. Как узнать реальные ограничения на расстояние между словами? Попробуем подобрать…


Слайд 9

Пытаемся подобрать: перебор 7 частотных операторов По статистике запросов Корпорации РБС, наиболее часто использовались: Перебор вариантов НЕ ДАЕТ РЕЗУЛЬТАТОВ…


Слайд 10

А существуют ли теперь в Яндексе контекстные ограничения? Из релиза Яндекса, Магадан: «Мы смягчили фильтрацию отбора документов для ранжирования, что привело к улучшению ранжирования по запросам, для которых релевантные документы содержат слова запроса далеко друг от друга» Попробуем поискать эти ограничения. Берем запрос (+скачать +реферат), оба слова должны находиться Исключаем результаты поиска, в которых слова находятся «слишком близко» (от 1 слова до 10 тыс. предложений): ~~(+скачать & +реферат) 3. Смотрим, как меняется число найденных документов… Надеемся, что оно станет нулевым тогда, когда расстояние совпадет с расстоянием в заколдованном запросе…


Слайд 11

Кажется, ограничений не существует… находятся документы на любых расстояниях… (+скачать +реферат) ~~(+скачать [ОПЕРАТОР] +реферат)


Слайд 12

Итого: Можно искать «найденные по нужной ссылке» результаты Можно узнать, как Яндекс переформулирует запрос пользователя Можно отказаться от представлений о контекстных ограничениях в Яндексе… ____________________________________________________________ Трофименко Е.А. trofimenko.evgeny@rbscorp.ru Корпорация РБС, начальник отдела исследований и аналитики ВСЁ!!! ?


×

HTML:





Ссылка: