'

Опыт реализации системы контентной фильтрации Интернет-ресурсов на базе технологий АРИОН

Понравилась презентация – покажи это...





Слайд 0

Опыт реализации системы контентной фильтрации Интернет-ресурсов на базе технологий АРИОН


Слайд 1

Принципы контентной фильтрации 1. Эффективная контентная фильтрация обеспечивается глубоким анализом текстового содержимого Интернет-ресурсов 2. Релевантный поиск и проблемный анализ содержимого Интернет-ресурсов должен выполняться специальным программно-аппаратным комплексом 3. Задача комплекса – формирование и «веерное» распространение базы данных запрещенных ресурсов для их последующего блокирования 4. Ресурсы, относящиеся к запрещенной тематике, должны быть классифицированы в соответствии с их информационной направленностью 5. Для каждой категории пользователи может задаваться свой перечень запрещенных классов ресурсов


Слайд 2

Платформа – ИАС «АРИОН»


Слайд 3

Ключевые технологии 1. Автономный поиск и автоматическая загрузка текстового содержания ресурсов Интернета 2. Фактографический разбор и тональный анализ текстов на естественном языке 3. Анализ и классификация ресурсов с использованием полнотекстового и фактографического режимов


Слайд 4

Концептуальная схема


Слайд 5

Аналитическая часть


Слайд 6

Сбор информации - Краулер Назначение поиск в Интернете ресурсов по заданным критериям Основные возможности автономный переход по ссылкам использование поисковых машин извлечение текста из различных форматов: txt, html, rtf, doc, pdf первичный анализ текстового содержимого (с помощью фильтров)


Слайд 7

Сбор информации


Слайд 8

Сбор информации


Слайд 9

Назначение анализ текстового содержания найденных ресурсов Основные возможности Полнотекстовый отбор мощный язык запросов учет морфологии поддержка синонимов и опечаток Фактографический анализ графематический анализ морфологический анализ синтаксический анализ логико-семантический анализ Тональный анализ Модуль индексирования


Слайд 10

Индексирование


Слайд 11

Индексирование


Слайд 12

Индексирование


Слайд 13

Назначение автоматическое рубрицирование ресурсов на основании выполненного анализа Способы рубрицирования анализ характерных слов и выражений (полнотекстовый поиск). анализ описываемых ситуаций (фактографический поиск) анализ отношения автора текста к предмету (анализ тональности высказываний) Модуль рубрикации


Слайд 14

Запросы рубрикации


Слайд 15

Рубрикация на основе полнотекстового поиска


Слайд 16

Рубрикация на основе полнотекстового поиска


Слайд 17

Запросы рубрикации


Слайд 18

Рубрикация на основе фактографического поиска


Слайд 19

Рубрикация на основе фактографического поиска


Слайд 20

Рубрикация на основе фактографического поиска


Слайд 21

Рубрикация на основе фактографического поиска


Слайд 22

Рубрикация на основе фактографического поиска


Слайд 23

Запросы рубрикации


Слайд 24

Рубрикация на основе тональности высказываний


Слайд 25

Рубрикация на основе тональности высказываний


Слайд 26

Рубрикация на основе тональности высказываний


Слайд 27

Рубрикация на основе тональности высказываний


Слайд 28


Слайд 29

Список запрещенных ресурсов Формирование и выгрузка списка запрещенных ресурсов


Слайд 30

Формирование списка запрещенных ресурсов


Слайд 31

Формирование списка запрещенных ресурсов


Слайд 32

Формирование списка запрещенных ресурсов


Слайд 33

Заключение Технологии ИАС «АРИОН» в рамках системы контентной фильтрации Интернет-ресурсов обеспечили решение следующих задач: Сбор и загрузка текстового содержания искомых ресурсов Интернета Анализ и классификация ресурсов с использованием полнотекстового и фактографического режимов Тональный анализ текстов на естественном языке Формирование списка запрещенных ресурсов


Слайд 34

Адрес: 115230, Россия, Москва, Электролитный проезд, дом 5Б, строение 8 Телефон: +7 (495) 589-3929 Факс: +7 (499) 317-4663 Электронная почта: info@sytech.ru Web: www.sytech.ru Контактная информация


×

HTML:





Ссылка: