'

Синтаксически аннотированный корпус чешского языка

Понравилась презентация – покажи это...





Слайд 0

4-8 июня 2008 г. Диалог 2008 1 Синтаксически аннотированный корпус чешского языка Аня Недолужко, Ян Гаич и кол.


Слайд 1

4-8 июня 2008 г. Диалог 2008 2 Синтаксически аннотированный корпус чешского языка Prague Dependency Treebank (PDT) тексты на чешском языке морфологический уровень: 2 млн. слов поверхностно-синтаксический уровень: 1.5  млн. слов глубинно-синтаксический уровень: 0.8 млн. слов


Слайд 2

4-8 июня 2008 г. Диалог 2008 3 (Он) пошёл бы влес. Byl by sel dolesa.


Слайд 3

4-8 июня 2008 г. Диалог 2008 4 Морфологический уровень атрибуты: атрибут lemma атрибут tag – 15 позиций, напр. NNIS2-----A---- и др. (Он) шёл бы влес.


Слайд 4

4-8 июня 2008 г. Диалог 2008 5 Поверхностно-синтаксический уровень атрибуты (6): id ord afun is_member is_parenthesis_root m.rf


Слайд 5

4-8 июня 2008 г. Диалог 2008 6 Глубинно- синтаксический уровень атрибуты (39) functor (ACT, PAT, ADDR, PRED, DENOM, PAR, СОNJ, LOC, DIR1, DIR2, TWHEN, TTILL и др.) t_lemma gram/sempos, gram/verbmod (Он) шёл бы влес.


Слайд 6

4-8 июня 2008 г. Диалог 2008 7 Словарь моделей управления VALLEX cz. rozumet = ru. понимать


Слайд 7

4-8 июня 2008 г. Диалог 2008 8 Актуальное членение атрибуты: tfa (t, c, f) deepord (глубинный порядок узлов, основанный на функциональной перспективе предложения) Knihy odnesl a noviny prinesl. - (Он) книги унес, а журналы принес.


Слайд 8

4-8 июня 2008 г. Диалог 2008 9 Кореференция грамматическая (coref_gram.rf) кореференция возвратных и относительных местоимений текстовая (coref_text.rf ) PersPron и PossPron 3-го лица, DemPron этот в субст.функции, эллипсис особые случаи (coref_special – exoph, segm)


Слайд 9

4-8 июня 2008 г. Диалог 2008 10 Расширенная аннотация кореференции (текстовая корефенция) 0 (повтор NP антецедента, пары Pron – NP, напр. дом – (этот) дом, он – Петя и др.) SYN (повтор – синоним антецедента, напр. предприятие - завод) ER (повтор – гипероним антецедента, напр. Петя – этот ребенок) NR (анафорическое отношение нереферентных NP)


Слайд 10

4-8 июня 2008 г. Диалог 2008 11 Расширенная аннотация кореференции (“bridging anaphora”) PART (отношение часть–целое, напр. дверь - ручка) SET (отношение множество-подмножество, элемент множества, напр. мушкетёры - Атос) FUNCT (отношение функциональной принадлежности, напр. школа - учитель) CONTRAST (отношение семантического противопоставления, напр. взрослый - ребенок) REST - другое


Слайд 11

4-8 июня 2008 г. Диалог 2008 12 Другие проекты Prague Arabic Dependency Treebank, http://www.ldc.upenn.edu Prague Czech-English Dependency Treebank, http://ufal.mff.cuni.cz/pcedt


Слайд 12

4-8 июня 2008 г. Диалог 2008 13 Планируется… аннотация разговорных текстов, детализация имеющейся аннотации, аннотация типологически отличных языков, аннотация параллельных чешских и английских текстов разработка нового уровня аннотации


Слайд 13

http://ufal.mff.cuni.cz/


×

HTML:





Ссылка: