'

Multilingual Ontology Matching based on Wiktionary Data Accessible via SPARQL Endpoint

Понравилась презентация – покажи это...





Слайд 0

Multilingual Ontology Matching based on Wiktionary Data Accessible via SPARQL Endpoint RCDL 2011, 19-22 октября, Воронеж Санкт-Петербургский институт информатики и автоматизации РАН Крижановский Андрей andrew.krizhanovsky gmail.com Фейю Лин feiyu.lin jth.hj.se


Слайд 1

Содержание Ontology matching Викисловарь SPARQL Отображение онтологий на разных языках


Слайд 2

Multilingual Ontology matching RDF / XML файл 1 RDF / XML файл 2


Слайд 3

Постановка задачи Выполнить отображение онтологий на разных языках (англ., фр.) Перевести с помощью: Google Translate API Викисловарь (машинно-читаемый словарь) Сравнить качество перевода


Слайд 4

Викисловари Викисловарь – многофункциональный многоязычный словарь и тезаурус Грамматический Толковый Этимологический Переводной


Слайд 5

Развитие Викисловарей Восемь самых больших Викисловарей (2003-2010) Первым появился English Wiktionary в декабре 2002 г. Проект Русский Викисловарь запущен в мае 2004 г.


Слайд 6

10 крупнейших* (из 170) Викисловарей * По данным на октябрь 2011


Слайд 7

Английский Викисловарь: Число словарных статей по языкам (Многоязычность) Словарные статьи о словах 433 языков. Переводы английских слов – на 235 языков. Дамп словаря от 18 июня 2011 г.


Слайд 8

Машинно-читаемый словарь на основе Английского Викисловаря: Раздел переводов


Слайд 9

Словарная статья (фрагмент)


Слайд 10

11 SPARQL SPARQL Protocol and RDF Query Language RDF язык запросов: Тройка, триплет (?X Отношение ?Y) Конъюнкция (A ; B.) SELECT ?x WHERE { ?A Relation1 ?x ; ?x Relation2 ?B . } Дизъюнкция (A. B.) SELECT ?x WHERE { ?A Relation1 ?x . ?x Relation2 ?B . } Дополнительные шаблоны для уточнения поиска.


Слайд 11

12 Платформа D2RQ D2RQ представляет реляционную БД (не RDF) как виртуальный RDF граф Создать файл отображения (MySQL - RDF) Запустить MySQL и сервер-D2RQ Запустить запросы SPARQL Инструкции: D2RQ и данные Викисловаря http://code.google.com/p/wikokit/wiki/d2rqMappingSPARQL


Слайд 12

13 Wik-tion-ary MRD data-base Wiktionary MRD database


Слайд 13

SELECT ?langId ?pageId ?langPosId ?meaningId ?wikiTextIdDef ?definition WHERE {     ?lang wikpa:lang_code "en";           wikpa:lang_id ?langId.     ?page wikpa:page_page_title "dog";           wikpa:page_id ?pageId.     ?lang_pos wikpa:lang_pos_page_id ?pageId;               wikpa:lang_pos_lang_id ?langId;               wikpa:lang_pos_id ?langPosId.     ?meaning wikpa:meaning_id ?meaningId;              wikpa:meaning_lang_pos_id ?langPosId;              wikpa:meaning_wiki_text_id ?wikiTextIdDef.     ?wiki_text wikpa:wiki_text_id ?wikiTextIdDef;              wikpa:wiki_text_text ?definition. } Получить толкование из Викисловаря по слову и языку (SPARQL запрос)


Слайд 14

Ответ-SPARQL (список толкований слова “dog” из Английского Викисловаря)


Слайд 15


Слайд 16

Эксперимент Тестовые данные (OAEI) Онтология на англ. и на фр. На фр. языке: 85 классов, 97 атрибутов = 182 Идеальное отображение - 97 элементов


Слайд 17

18 Результаты SPARQL запросы к Викисловарю Список толкования по слову и языку Список синонимов Перевод слова (с английского на один из языков) http://code.google.com/p/wikokit/wiki/d2rqMappingSPARQL Пример приложения на Java создаёт SPARQL запросы и получает данные от D2RQ сервера


Слайд 18

Спасибо за внимание! Сайт проекта: http:// code.google.com/p/wikokit/


Слайд 19

Машинно-читаемый Викисловарь (MRD): Синонимы *Английский Викисловарь, дамп от 18 июня 2011 г. ** Парадигматические (семантические) отношения – синонимы, антонимы, гиперонимы…


Слайд 20

Схема отображения онтологий


×

HTML:





Ссылка: