'

Решение для обнаружения заимствований в документах

Понравилась презентация – покажи это...





Слайд 0

Решение для обнаружения заимствований в документах


Слайд 1

Назначение Оценка самостоятельности квалификационных работ Поиск автоцитирования Защита интеллектуальной собственности от несанкционированного копирования Обнаружение дубликатов и схожих документов в хранилищах


Слайд 2

История 2005: старт проекта, www.antiplagiat.ru 2006: внедрение в МИЭМП, начало внедрения в ВАК РФ 2007: внедрение в ГУ ВШЭ, МФТИ, НГГУ, АБиК МФ РФ 2008: внедрение в РГБ, МПГУ, проектируется система для РФФИ, начато внедрение в МГУ


Слайд 3

Варианты использования


Слайд 4

Антиплагиат.вуз


Слайд 5

Возможности Создание структуры вуза Ведение списков преподавателей и студентов Просмотр статистики использования системы и качества студенческих работ Наличие собственного хранилища документов Настройка политики пополнения хранилища проверенными студенческими работами Интегрированный бизнес-процесс проверки преподавателями студенческих работ


Слайд 6

Схема работы Пользователь Система «Антиплагиат» Коллекция документов


Слайд 7

Область поиска Internet


Слайд 8

Характеристики


Слайд 9

Поддержка форматов Работа с форматами: DOCX DOC, RTF PDF HTML TXT RAR, ZIP Возможность поддержки других форматов по требованию заказчика


Слайд 10

Качество и быстродействие Лидерство на рынке по показателям быстродействия без ущерба для качества Около 20 тыс. проверок пользователями интернет сервиса ежедневно (по 12 млн. документов на Xeon 2 х 2.4GHz, 4GB RAM) Постоянное совершенствование алгоритмов поиска и расширение функциональности


Слайд 11

Работа с отчетами


Слайд 12

Виды отчетов Четыре базовых вида отчета о проверке документа Возможность добавления новых видов отчетов Экспорт отчетов в формате XML Экспорт отчетов в формате электронного документа «APD»


Слайд 13

Удобство работы Возможность исключения источников цитирования из списка найденных с быстрым перестроением отчета Возможность просмотра процитированного фрагмента источника не переходя к просмотру всего текста источника


Слайд 14

Работа в режиме оффлайн Экспорт отчета в файлы внутреннего формата «APD» для работы без подключения к системе Просмотр файлов «APD» через бесплатное приложение Antiplagiat Report Viewer


Слайд 15

Использование «APD» Система документооборота Учащийся Преподаватель APD Антиплагиат Коллекция документов Коллекция документов Экономичность (все тексты сжаты) Невозможность фальсификации (наличие цифровой подписи)


Слайд 16

ВАРИАНТЫ ВНЕДРЕНИЯ


Слайд 17

Подключение к Интернет-сервису


Слайд 18

Локальная версия системы


Слайд 19

ПЕРСПЕКТИВЫ


Слайд 20

Расширение функциональности Разработка механизма «сигнальных статистик» В отчетах о проверке выделение оглавлений и списков литературы Включение части коллекций в «область правомерного цитирования» Создание механизма настройки системы в режиме обучения для автоматической классификации плагиата


Слайд 21

Расширение области поиска «Консультант+», «Гарант» «Интегрум» Электронные библиотеки Хранилища вузов Увеличение охвата Интернета


Слайд 22

ВНЕДРЕНИЕ В Российскую государственную библиотеку


Слайд 23

Формирование хранилища Исходный объем PDF файлов – 2.5 Tb, общий объем ansi текстов 57 Gb Число документов – 260000, средний размер текста – 222Кб Общее время создания хранилища – 26ч Объем получившегося хранилища системы – 46Gb


Слайд 24

Характеристики Оборудование: 2 x 2 Xeon 1.6 ГГц, 4 GB Ram Реально используется только один жесткий диск емкостью 135Gb Время проверки документа по локальному хранилищу РГБ – не более 3 сек Время проверки документа по 2-хранилищам РГБ и Антиплагиат одновременно – не более 5 секунд


×

HTML:





Ссылка: