'

ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ В ЗАДАЧАХ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТА

Понравилась презентация – покажи это...





Слайд 0

ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ В ЗАДАЧАХ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТА Большакова Е.И., Баева Н.В., Бордаченкова Е.А., Васильева Н.Э., Морозов С.С. МГУ им. М.В. Ломоносова Факультет ВМиК bolsh@cs.msu.su  


Слайд 1

СОДЕРЖАНИЕ ДОКЛАДА Задача формального описания лексических и морфосинтаксических особенностей текстовых единиц. Результаты сравнительного анализа средств описания (НКРЯ, Alex, RCO). Концепция лексико-синтаксического шаблона языковых конструкций. Основные возможности языка записи лексико-синтаксических шаблонов (далее LSPL).


Слайд 2

ЗАДАЧА ОПИСАНИЯ ЯЗЫКОВЫХ КОНСТРУКЦИЙ Изучение терминологических и дискурсивных особенностей НТ прозы Потребность формализовать характерные конструкции (Под T будем понимать D, Далее докажем P, Допустим, что S) Определение множества лексем, грамматических форм, синтаксических условий Фиксирование в виде декларативной структуры ? лексико-синтаксического шаблона языковой конструкции NGACC [«мы»] «будем называть»TINS


Слайд 3

СРЕДСТВА ОПИСАНИЯ ЕДИНИЦ ТЕКСТА ДЛЯ ПОИСКА ФРАГМЕНТОВ В ТЕКСТАХ НА РУССКОМ ЯЗЫКЕ Единицы текста: словоформы, последовательности слов, словосочетания Национальный корпус русского языка (НКРЯ) ограниченность корпуса; лингвистическая разметка поиск последовательности слов по их грамматическим и лексико-семантическим характеристикам Система Alex лексические шаблоны для узкоспециализированных текстов средства описания словосочетаний, без указания грамматических признаков RCO Pattern Extractor/система GATE правила и шаблоны для извлечения из текста специфических объектов формальный язык в стиле ЯП (атрибутно-объектная модель текста)


Слайд 4

СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ: ОПИСАНИЕ ЛЕКСИКО-ГРАММАТИЧЕСКИХ ОСОБЕННОСТЕЙ Лексико-графические единицы Морфо-синтаксические условия


Слайд 5

СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ: ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ Логические операции Запись конструкций


Слайд 6

Разработка формального языка для: записи специфических языковых конструкций для их представления в системе автоматической обработки НТТ; записи запросов на поиск конструкций для системы поддержки лингвистических исследований. Лексико-синтаксический шаблон – структурный образец языковой конструкции, отображающий ее лексические и поверхностно-синтаксические свойства. Принцип отбора выразительных средств: гибкая и интуитивно понятная запись основных лексических и поверхностно-синтаксических свойств конструкций. ЛЕКСИКО-СИНТАКСИЧЕСКИЙ ШАБЛОН


Слайд 7

ЯЗЫК LSPL-ШАБЛОНОВ: ОСНОВНЫЕ ВОЗМОЖНОСТИ Элемент-слово включает: часть речи (A, N, V, Pa и т.д.) – A индекс – A1 A2 N лексема (< >) – A<важный> уточнение грамматических характеристик (имя=значение) – A<важный; case=nom, gen=fem> Грамматическое согласование элементов шаблона: A<тяжелый> N <A.gen=N.gen, A.num=N.num, A.case=N.case> A<тяжелый> N <A=N> Слово тяжелый и следующее за ним существительное согласованы в роде, числе и падеже: тяжелым вечером, тяжелых камней, тяжелое тело


Слайд 8

ЯЗЫК LSPL-ШАБЛОНОВ: ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ AP = A(A) | Pa(Pa) AS= { AP } N<стол,c=nom> [“в”] <AP=N> (N) Элемент-слово Имя шаблона Экземпляр шаблона Условия согласования Альтернативы | Повторение {} Опциональное вхождение [] Параметры шаблона Элемент-слово Имя шаблона Экземпляр шаблона Условия согласования Альтернативы | Повторение {} Опциональное вхождение []


Слайд 9

ДОПОЛНИТЕЛЬНЫЕ ПРИМЕРЫ Однородные члены в виде именных групп: SNG = AN1 {“,” AN2}<1> [“и” AN3] <AN1.c=AN2.c=AN3.c> (AN1) Дама сдавала в багаж диван, чемодан, саквояж, картину, корзину, картонку и маленькую собачонку Шаблон типичной для деловой и НТ прозы конструкции: NP = AN1 {AN2<case=gen>} (AN1) Характерная конструкция определения новых терминов: DT = NP1<c=acc> ["мы"] "назовем" NP2<c=ins> <NP1.n = NP2.n> Указанную операцию назовем операцией поиска примеров


Слайд 10

ЯЗЫК LSPL-ШАБЛОНОВ: СРАВНИТЕЛЬНЫЙ ПРИМЕР Прилагательное и существительное в именительном падеже единственного числа Язык LSPL: A<c=nom, n=sign> N<c=nom, n=sign> Язык RCO Pattern Extractor: {Morph.SpeechPart=“Noun”, Morph.Case=“Nominative”, Morph.Number=“Singular”} {Morph.SpeechPart=“Adjective”, Morph.Case=“Nominative”, Morph.Number=“Singular”}


Слайд 11

ЗАКЛЮЧЕНИЕ Разработана первая версия программного модуля для поиска в тексте фрагментов, соответствующих заданному LSPL-шаблону. Изучаются возможности развития языка LSPL: усиление его выразительности: логическое комбинирование условий; грамматическое управление; введение операций над фрагментами: подсчет статистики; извлечение составных конструкций. СПАСИБО ЗА ВНИМАНИЕ!


×

HTML:





Ссылка: