'

Ярослав Витязев, 2007 г.

Понравилась презентация – покажи это...





Слайд 0

1 Каталог ресурсов интернет с элементами искусственного интеллекта Ярослав Витязев, 2007 г.


Слайд 1

2 Цель и задачи проекта Создание удобного средства поиска информации в сети интернет в виде структурированного хранилища, автоматизирующего функции администратора. Задачи: разработка каталога ресурсов интернет, использующего последние достижения в области интернет-технологий; автоматизация и интеллектуализация каталога; продвижение каталога в сети интернет; продажа рекламы на страницах каталога.


Слайд 2

3 Существующие проблемы каталогов Задержка публикации, связанная с модерацией. Ограниченность целевой аудитории каталога ресурсов интернет. Проблема представления данных и интеграции. Дополнительные затраты на административный персонал. Трудность поиска необходимых интернет-ресурсов в каталоге. Невозможность внесения правок для сайта после публикации. Наличие нежелательного содержания и спама в каталоге. Некачественное и неполное описание интернет-ресурса. Проблема определения автора сайта. Проблема доступности интернет-ресурса.


Слайд 3

4 Исключение администратора из контура управления Исключение администратора из контура управления позволит снизить затраты на административный персонал каталога. Автоматизация функций Интеллектуализация функций Регистрация интернет-ресурсов. Возможность изменения информации об интернет-ресурсах владельцем после регистрации. Проверка доступности интернет-ресурсов. Защита от автоматических и полуавтоматических регистраций. Модерация интернет-ресурсов: первичная регистрация; добавление и редактирование заголовка / описания / тега; Ранжирование интернет- ресурсов в каталоге. Интерпретация документов для нужд пользователей каталога. Фильтрация нежелательного содержания и спама в каталоге.


Слайд 4

5 Классы (компоненты) каталога


Слайд 5

6 Класс: специалист по регистрации сайтов Константы класса: - const DOC_ACT_RESOURCE_REGISTERED = 101; - const DOC_ACT_RESOURCE_SET_STATUS_ENABLED = 102; - const DOC_ACT_RESOURCE_SET_STATUS_DISABLED = 103; - const DOC_REQ_RESOURCE_BLOCKED = 104; - … Методы класса: - public function addResource($url, $title, $ownerId, $lang) - public function updateLastEditTime($rId, $time = false) - public function updateResourceTitle($rId, $title) - public function checkResourceCatTagDescCounts($rId) - public function checkResourcePublicationOrder($rId) - public function setResourceEnabledStatus($rId, $value) - public function getResourceIdByUrl($url) - public function getResourcesListByOwnerId($oId) - static function isCorrectTitle($value) - static function isCorrectName($value) - static function isCorrectKeyword($value) static function isCorrectComment($value) … IKE_Ai_Specialist_RegistrationManager


Слайд 6

7 Регистрация интернет-ресурса в каталоге


Слайд 7

8 Подходы к категоризации контента Дать пользователю большую свободу при категоризации можно при помощи сочетания подходов. Основные методы категоризации Таксономия Достоинства: достаточно простая поддержка такой структуры; Недостатки: ограничение свободы пользователей; ассоциация лишь с одним разделом; Фолксономия Фасеты Достоинства: свобода в выборе тега; удобная категоризация; Недостатки: проблема отслеживания сходных тегов; проблема указания нере- левантных тегов; Достоинства: дополнительные признаки категоризации, позволяю- щие сужать область поиска; Недостатки: проблема поддержки такой структуры; Объединенный подход


Слайд 8

9 Интерфейсы каталога Представление контента в понятном для человека виде – лишь один из способов представления. Интерфейсы каталога Интерфейс для человека Интерфейс для компьютера Интерфейсы: рядового пользователя; владельца сайта; администратора. Интерфейсы: Dublin core (Дублинское ядро); OpenSearch (Открытый поиск); RDF/RSS (Синдикация и агрегация контента); интерфейс интеграции с сервисами социальных закладок.


Слайд 9

10 Интерфейсы каталога (human-usable) Интерфейсы рядового пользователя


Слайд 10

11 Интерфейсы каталога (human-usable) Интерфейсы владельца сайта


Слайд 11

12 Интерфейсы каталога (human-usable) Интерфейсы администратора каталога


Слайд 12

13 Ранжирование интернет-ресурсов в каталоге Система рейтинга интернет-ресурсов определяет какие интернет-ресурсы в каталоге пользователи будут посещать наиболее часто. Взвешенный рейтинг (Weighted Rating) Рейтинг PageRank™ (PR) Содержательный рейтинг (VR) Рейтинг соответствия (CR) Расходуемый рейтинг (ER) Статический рейтинг (SR) Рейтинг штрафов (FR)


Слайд 13

14 Соответствие стандартам Каталог ресурсов интернет выполнен в соответствии со следующими стандартами: W3C XHTML 1.0 Transitional, W3C CSS 2.0, W3C RDF/XML, W3C RDF RSS/XML 1.0, DCMI DublinCore/XML (simplified), A9 OpenSearch/XML.


Слайд 14

15 Бизнес-модель каталога Затраты на каталог окупаются при помощи контекстной рекламы, размещенной на его страницах. Используется модель PPC. В качестве рекламного брокера выбрана компания «Begun». Рекламные материалы размещены на страницах каталога с 11 апреля 2007 года. Контекстное объявление


Слайд 15

16 Полученные результаты В рамках проекта: проведена оценка каталогов на основе разработанной системы критериев, сделаны выводы, определены ключевые проблемы, которые необходимо решить; сформирован проект каталога; создана программная реализация каталога (пройдены этапы альфа- и бета-тестирования); начиная с марта 2007 г. каталог работает в режиме эксплуатации; произведено продвижение каталога при помощи сети интернет.


Слайд 16

17 Полученные результаты Несколько тезисов о востребованности каталога: каталогом воспользовалось более 7000 человек, пользователями просмотрено более 35 тысяч страниц, более 800 пользователей зарегистрировались в каталоге, в каталоге зарегистрировано более 850 уникальных сайтов, ежесуточно пользователи каталога просматривают около 600 страниц, популярность каталога возрастает. (данные за период с 11.04.07 – 20.05.07)


Слайд 17

18 www.irdir.info


×

HTML:





Ссылка: