'

Алгоритмические основы разработки поисковой системы

Понравилась презентация – покажи это...





Слайд 0

Алгоритмические основы разработки поисковой системы Трегубов А.А., Кононова Т.С. Таганрогский Государственный Радиотехнический университет Факультет информационной безопасности, кафедра БИТ Росия, г. Таганрог, ул. Чехова 2 E-mail: taa_trtu@mail.ru


Слайд 1

Структура организации поисковой системы


Слайд 2

Пример таблицы парадигм склонения русских существительных Всего для существительных: 36 флективных парадигм в единственном числе 46 флективных парадигм во множественном числе


Слайд 3

Пример таблицы типов машинного склонения русских существительных. Общее количество типов машинного склонения для существительных - 97


Слайд 4

Организация словарной статьи для слова: модель Машинная основа слова: модел В единственном числе данная основа имеет следующий набор флексий: ь-и-и-ь-ью-и Во множественном числе: и-ей-ям-и-ями-ях Из таблицы парадигм: в единственном числе код склонения - 17 во множественном числе код склонения - 57 Из таблицы типов машинного склонения: код машинного склонения - 0018 Словарная статья в автоматическом словаре основ: модел 0018 ь


Слайд 5

Статистический метод индексирования Относительная частота появления термина ti : где Nt – число встречаемости термина в документе, N – число всех терминов в документе. Инверсная частота появления термина: где dfi - количество документов в коллекции, содержащих термин ti, N – число всех терминов в документе. Комбинированный метод индексации:


Слайд 6

Алгебраический метод определения релевантности Представление множества индексов документов коллекции набором векторов в векторном пространстве индексируемых терминов; Представление запроса вектором в векторном пространстве индексируемых терминов; Определение степени релевантности как меры расстояния между векторами индекса документа и запроса по формуле Хемминга: где x – вектор индекса документа, С – вектор запроса.


×

HTML:





Ссылка: