'

Das kombinatorische Worterbuch von ETAP

Понравилась презентация – покажи это...





Слайд 0

1 Das kombinatorische Worterbuch von ETAP 11.06.2008 Syntaxanalyse des Russischen im maschinellen Ubersetzungssystem ETAP-3 Prof. Dr. F. Guenthner, R. Zangenfeind Referentin: Elena Levushkina LMU Munchen CIS


Слайд 1

2 Typen der Lexeminformation Im Gegensatz zu den allgemeinen Regeln werden die Schablonen- und Worterbuchregeln nur auf die Phrasen angewandt, deren lexikalisches Potential das verlangen konnte. Die Wortinformation wird in zwei Typen unterteilt: Klassifikatonsinformation – Information uber die Wortmerkmale, auf die Systemregeln verweisen konnen (Wortart, syntaktische und semantische Merkmale, Abhangichkeiten der Aktanten im RM) Operationsinformation – Information uber die Schablonen- oder Worterbuchregeln.


Слайд 2

3 Klassifikationsinformation im KW Ein Wortartikel beschreibt genau ein Lexem (eine Bedeutung des Wortes). Er fangt mit einer Kopfzeile an, die Artikelnummer und den Lexemnamen enthalt. Wenn das Wort lexikalisch-grammatikalische Homonyme besitzt, enthalt der Name jedes Lexems einen Index ЧТО1 (союз) vs. ЧТО2 (союзное слово) Klassifikationsinformation wird in einem Artikel in vier Bereichen wiedergegeben. Jeder Bereich wird mit einem speziellen Zeichen eingefuhrt: POR: Wortart SYNT: syntaktische Merkmale DES: semantische Merkmale Di,j: Zeilen, die das RM beschreiben (TRANS: Triviale Ubersetzung eines russischen Lexems in Englisch)


Слайд 3

4 Wortartbereich In diesem Bereich nach dem POR-Zeichen wird das Symbol eines Wortarts angegeben. S (Substantiv), A (Adjektiv), ADV (Adverb), NUM (Zahlwort), V (Verb), CONJ (Konjunktion), PR (Praposition), PART (Partikel), COM (die erste Komponente der zusammengesetzten Worter wie франко-русский) Klasse A enthalt au?er den kanonischen Adjektiven Pronominaladjektive: этот, тот Possesivpronominale Adjektive: мой, твой, ваш, наш Interrogativpronomen: какой, чей Indefinitpronominale Adjektive: другой, некоторый, любой Ordnungszahlworter: первый, второй Komplexe Pronominaladjektive: какой-то, кое-какой


Слайд 4

5 Wortartbereich Klasse S enthalt au?er den kanonischen Subatantiven Personalpronomen что2, кто Interrogativpronomen который Relativpronomen некто, нечто Reflexivpronomen себя Negativpronomen никто, ничто Demonstrativpronomen это1, то1 Komplexe Substantivpronomen кое-кто, кое-что, кто-либо, что-то Klasse ADV enthalt au?er den Adverbien Einfuhrungsworter und Wendungen естественно, вероятно, по всей видимости Pronominaladverbien где, когда2, там, туда Pradikativa жаль, можно, некогда Quantifikatoren мало, много, несколько


Слайд 5

6 Bereich der syntaktischen Merkmale Unter syntaktischen Merkmalen versteht man Abkurzungen der Wortmerkmale, die die Worteinbindung in die einen syntaktischen Konstruktionen erlauben und nicht in die anderen количест две большой важности проблемы количест *две большой важности проблемы Zusammenhang zwischen syntaktischen Merkmalen und morphologischen Charakteristiken (m, f, n, belebt): Klassifikationsrolle bei den Substantiven (syntaktische Merkmale) Flexion bei den Adjektiven und Verben (morphologische Merkmale)


Слайд 6

7 Syntaktische Merkmale der Verben ВВОД-1: Verben, die einen Nebensatz eingefuhrt mit der Praposition что, чтобы als ersten Aktanten haben und die mit der Konjunktion как in der Einfuhrungskonstruktion verwendet werden konnen ВОДИТЬСЯ, ВЫЯСНЯТЬСЯ, ОКАЗАТЬСЯ, ПОЛАГАТЬСЯ… Некоторые сотрудники, как выяснилось в ходе расследования, не соблюдали элементарных правил техники безопасности ВВОД-2: Verben, die einen Nebensatz eingefuhrt mit der Praposition что, чтобы als zweiten Aktanten haben und die mit der Konjunktion как in der Einfuhrungskonstruktion verwendet werden konnen ВИДЕТЬ, ВЫЯСНЯТЬ, ГОВОРИТЬ, ДУМАТЬ, СЧИТАТЬ… Некоторые сотрудники, как выяснила группа в ходе расследования, не соблюдали элементарных правил техники безопасности


Слайд 7

8 Syntaktische Merkmale der Verben ГРАД: Verben, die eine Steigerungssituation beschreiben und Adverbien wie очень, весьма, немного, чуть-чуть anschlie?en konnen ВЫРАСТИ, ЛЮБИТЬ, УСТАВАТЬ, ХОТЕТЬ, ОБИДЕТЬСЯ… Он немного обиделся на меня ИЗМЕН: Verben, die Veranderung des Zustandes oder der Lage im Raum bedeuten und mit der adverbialen Bestimmung wie на три дня verwendet werden konnen ВСТАВАТЬ, ПРИХОДИТЬ, УЕЗЖАТЬ, ЗАМОЛЧАТЬ… Он уехал на неделю в командировку МГНОВ: Verben der augenbliklichen Handlung, die nicht mit den adverbialen Dauerbestimmung wie долго, неделю, три дня verwendet werden konnen ВЕЛЕТЬ, ДОСТИГАТЬ, КАСАТЬСЯ, НАХОДИТЬ, ПРИХОДИТЬ *судно целый день приходило в порт


Слайд 8

9 Syntaktische Merkmale der Verben МОД: Modalverben МОЧЬ, УМЕТЬ, ХОТЕТЬ… РДОП: transitive Verben, die den Wechsel von Akkusativ des Objekts gegen Genitiv im Negierungskontext zulassen ДЕЛАТЬ, ЕСТЬ, ПИТЬ, ЧИТАТЬ, ВИДЕТЬ… Все читали эту книгу -> Никто не читал этой книги РДОПЛОТР: transitive Verben, die den Wechsel von Nominativ des Subjekts gegen Genitiv im Negierungskontext zulassen БЫТЬ, БЫВАТЬ, ИМЕТЬСЯ, СУЩЕСТВОВАТЬ, ПОСТУПАТЬ… Такие сведения в институт еще не поступали -> Таких сведений в институт еще не поступало


Слайд 9

10 Syntaktische Merkmale der Substantive ЖЕНСК; МУЖСК; СРЕДН АГЕНС: Substantive, die agentive Objekte sein konnen bei der Passivform des Verbes ЧЕЛОВЕК, АЛГОРИТМ, СОЛНЦЕ Запрос обрабатывается компьютером ВРЕМ: Substantive mit der Bedeutung eines Zeitpunkts oder -intervals ГЕОГР: Subtantive mit der Bedeutung eines geographischen Objekts, die keine Eigennamen sind ГОРА, ГОРОД, РЕКА, СТРАНА… ДЕН: Wahrungsnamen ИЗМЕР: Ma?einheiten ИСЧИСЛ: zahlbare Substantive, die in Mengen- und Sammelgruppen verwendet werden konnen ЛИЧН: Personalpronominale Nomen


Слайд 10

11 Syntaktische Merkmale der Substantive ПРОФ: Substantive in Maskulinum, die einen Beruf bezeichnen und ein Verb oder Adjektiv in Femininum zulassen ВРАЧ, ДИРЕКТОР, ПИЛОТ… В комнату вошла администратор гостиницы СОВОК: Substantive mit der Bedeutung einer Gesamtheit, die pradikative Konstruktionen bilden konnen БОЧКА, ГРУППА, ЗАВОД, ЯЩИК… Коров было огромное стадо ТВОРОБСТ: Substantive mit der zeitlichen Bedeutung, die im Instrumental als adverbiale Bestimmung auftreten konnen ВЕСНА, ВРЕМЯ, ПОРА… приехать зимой, встречаться летней порой


Слайд 11

12 Semantische Merkmale Richtigkeit der syntaktischen Konstruktionen hangt oft von den semantischen Kongruenz der Worter ab. Beiordnende (сочинительные) Konstruktionen sind ein anderer Teil des symantischen Sprachsystems, wo semantische Kongruenz gepruft werden muss. *Оборудование поступило на завод и в феврале In der beschriebenen ETAP-Version werden 18 semantische Merkmale (Deskriptoren) verwendet Es werden hauptsachlich semantische Merkmale der Substantive und Verben beschrieben.


Слайд 12

13 Semantische Merkmale Fur die Prufung der semantischen Kongruenz werden zwei Pradikate benutzt: CORDES und CODES Bedingung CORDES der deskriptiven Kongruenz zwischen dem Hauptwort X und dem regierten Wort Y ist erfullt, falls Y eins der Descriptoren besitzt, die in der entsprechenden Spalte des RMs von X aufgefuhrt sind, oder Y hat gar keinen Descriptor oder in der RM-Spalte von X sind keine Descriptoren aufgefuhrt. Bedingung CODES der deskriptiven Kongruenz zwischen den Wortern X und Y, die Bestand einer beiordnenden Konstruktion sind, ist erfullt, falls X und Y mind. einen gemeinsamen Deskriptor haben oder einer von den beiden gar keinen Deskriptor besitzt


Слайд 13

14 Deskriptoren in ETAP-3 ВЕЛИЧИНА: Ma?einheiten wie год, доллар, метр ВЕЩЕСТВО: z.B. воздух, газ, масло ВРЕМЯ: Zeitworter wie будущее, десятилетие ДЕЙСТВИЕ: Handlung, z.B. работа, анализ, измерять ИНФОРМАЦИЯ: z.B данные, опыт, уравнение, смысл КРИСТАЛЛ: Subatantive mit der Bedeutung eines Teils, einer Menge oder einer Klasse der Objekte z.B. порция, слой, часть, компонент Покрасить дверь голубой краской Покрасить дверь двумя слоями голубой краски ЛИЦО: eine Person oder Organisation – агентство, оператор МЕХАНИЗМ: Bezeichnungen der Gerate, Mechanismen wie z.B. детектор, компьютер


Слайд 14

15 Deskriptoren in ETAP-3 ОТНОШЕНИЕ: контраст, граничить ПАРАМЕТР: messbare Parameter wie температура, цена, масса ПРЕДМЕТ: unbelebtes Objekt ПРОСТРАНСТВО: ein Objekt, fur das seine physische Gro?e relevant ist, z.B. Аэропорт, область ПРОЦЕСС: Situationen mit einem passiven Subjekt, dessen Zustand sich verandert – рост, таять СВОЙСТВО: langfristige Eigenschaften von Objekten, Prozessen, Handlungen wie опасность, удобство СОСТОЯНИЕ: возможность, нужда, лежать СФЕРА: Fachgebiete wie биология, промышленность ФАКТ: Ereignisse, z.B. авария, происшествие ЭНЕРГИЯ: Substantive wie ток, ион, напряжение


Слайд 15

16 RM-Bereich Im RM-Bereich werden Rektionsmerkmale der Pradikate beschrieben, d.h. welche Anforderungen stellt das gegebene Pradikat an die Kandidate fur seine Argumente (Aktante). Ein Rektionsmodell wird als eine Zeilenmenge dargestellt. Jede Zeile wird mit dem Zeichen Di,j eingefuhrt und ethalt eine Term- oder Lexemmenge. RM fur das Wort СРАВНЕНИЕ D1.1:РОД, ?ЛИЦО? D1.2:ТВОР D2.1:РОД D3.1:С3 D4.1:ПО1


Слайд 16

17 Operationsinformation In einen Wortartikel vom KW konnen zwei Arten der Operationsinformation eingeschlossen werden: Ein Verwies auf eine Schablonenregel oder Eine ganze Regel Regeltypen: Syntaktische Analyse Normaliesierung Semantisierung


Слайд 17

18 Beispiel zum Wortartikel 03918 ДАВЛЕНИЕ POR S SYNT СРЕДН, ЕД!, ПАРАМ, ХАРАКТТВОР DES ?ДЕЙСТВИЕ?, ?ПРОЦЕСС?, ?ФАКТ? D1 1 РОД D2 1 НА1 D3 1 В1, ?ВЕЛИЧИНА? D3 2 ИМ, ?ИЗМЕР? TRAF АТРИБ 15


Слайд 18

19 Literatur Ю.Д. Апресян et al.: Лингвистический процессор для сложных информационных систем. Москва 1992 (Kapitel 6.1)


×

HTML:





Ссылка: