'

Разработка средств автоматического синтаксического анализа как модуля системы понимания текста

Понравилась презентация – покажи это...





Слайд 0

Разработка средств автоматического синтаксического анализа как модуля системы понимания текста Лахути Д.Г., Баталина А.М., Епифанов М.Е., Кобзарева Т.Ю. (РГГУ) 26 марта 2009 г.


Слайд 1

Что значит для нас понять следующее предложение: Императрикс Елисавета, о! приехала в Царское Село.


Слайд 2

морфологический анализ графематический анализ синтаксиче-ский анализ семантиче-ский анализ синтаксический анализ семантический анализ


Слайд 3

Пример синтаксической неоднозначности: В этом музее были выставлены чучела динозавров, которые все погибли от бомбёжки.


Слайд 4

Объектная модель алгоритма в инструментальной среде


Слайд 5

Объектная модель анализируемого предложения лексические единицы и их свойства в формате (имя_свойства значение_свойства) граф синтаксических связей в формате (имя_синтаксического_хозяина имя_синтаксического_слуги тип_связи).


Слайд 6

Выбор средств реализации среды для экспериментов с алгоритмами ПСА реализация выполнена на языке Common Lisp с использованием встроенной в него библиотеки CLOS (Common Lisp Object System) в инструментальной среде разработки Corman Common Lisp ® версии 2.5 в Лиспе имеется возможность в процессе выполнения функций вычислять выражения, записанные в его же синтаксисе - можно строить код новых Лисп-функций во время работы программы и, при желании, вычислять их при каких-либо значениях аргументов Лисп – интерпретируемый язык, в рассматриваемой среде алгоритмы рассматриваются как данные по отношению к интерпретатору для записи алгоритмов используется своеобразный предметно ориентированный языковой «конструктор» (при составлении описания алгоритма мы или манипулируем – добавляем, переставляем, удаляем – готовыми «кирпичиками» - объектами, представляющими правила, или только меняем содержание правил), что обеспечивает легкость модификации


Слайд 7

Инструментальная среда и окружающие ее приложения


Слайд 8

Входные языки для инструментальной среды входной предметно ориентированный лиспообразный язык для описания алгоритма (для трансляции в объектную модель инструментальной среды) языки в синтаксисе xml (служат посредниками между инструментальной средой и внешними программами для просмотра результатов) графический (используется в графическом редакторе структуры объектов, ориентированном на объектную модель инструментальной среды)


Слайд 9

Схема работы в инструментальной среде


Слайд 10

Функциональность инструментальной среды для экспериментов с алгоритмами поверхностно-синтаксического анализа установка прерывания пошаговое выполнение алгоритмов просмотр на каждом шаге значений переменных, содержания узла и связанного с узлом правила, текущего состояния представления анализируемого предложения вычисление пробных вариантов правил и используемых в них форм протоколирование выполнения алгоритма механизм пакетного тестирования – возможность автоматически применять составленные ранее тесты к объекту-результату вычисления алгоритма на некотором примере поддержка т.н. проектов тестирования – файлов, в которых в соответствующем формате записана информация о соответствии тестовых примеров алгоритмам, о различных версиях алгоритма и т.п.


Слайд 11

Промоделированы и в основном отлажены/находятся в стадии отладки Блоки предсинтаксиса и предсегментации модули предсинтаксиса: стандартные универсальные подпрограммы проверки согласования, алгоритмы постморфологии, корректирующие и дополняющие результаты морфологического анализа, наиболее актуальные алгоритмы снятия омонимии частей речи, часть алгоритмов модуля предсегментации: построение атрибутивных именных групп и предложных групп, построение конструкций с именами собственными, с числами, построение сложных сказуемых, построение синтагм со слугами – обособленными приложениями.


Слайд 12

Промоделированы и в основном отлажены/находятся в стадии отладки Блок сегментации экспресс-версия сегментационного анализа (не предполагается возможности любых разрывающих вложений так называемых a-сегментов – придаточных предложений, обособленных согласованных определений, деепричастных, предложных, вводных и сравнительных оборотов – в a-сегменты). полная версия сегментационного анализа (рассчитан на сегментацию любых грамматически правильных неэллиптичных предложений литературного письменного языка, не являющихся записью или имитацией устной речи). Блок внутрисегментного анализа поиск сказуемого и подлежащего, заполнение словарно заданных валентностей, поиск хозяина предложной группы, поиск хозяев слабоуправляемых именных групп в родительном падеже и наречий.


×

HTML:





Ссылка: