'

Дипломная работа Программная поддержка морфемного словаря

Понравилась презентация – покажи это...





Слайд 0

Дипломная работа Программная поддержка морфемного словаря Швейкина О.А., 525 гр. Научный руководитель: к.ф.-м.н. доцент Большакова Е.И.


Слайд 1

Терминология Морфема – наименьшая языковая единица, обладающая значением: Корень: стол, един Аффикс: при (приставка), от (суффикс) Морф – конкретная реализация морфемы в тексте; Пример: пер, пир, ставл Алломорф - совокупность морфов одной морфемы; Пример: бр, бер, бор Морфемный разбор слова – нахождение минимальных значимых единиц, из которых оно составлено Пример: положение, полагать 2/14


Слайд 2

Морфемные словари и подходы к их построению Морфемные словари (МС): Печатные: (словарь А.Н. Тихонова) Тяжело вносить дополнения Медленный поиск Электронные: («Яндекс. Словари», «Ариадна») Нет прикладного интерфейса Подходы к построению: Составление вручную (высокая точность) Автоматизированный (точность около 80%) Генетический алгоритм Построение правил разбиения на морфы Вероятностный метод 3/14


Слайд 3

Постановка задачи Цель: разработка компьютерного морфемного словаря русского языка и поддерживающих его программ Исходные данные составлены вручную (текст. файлы) Требуется разработать: схему хранения однокоренных и многокоренных слов; программы загрузки исходных данных; процедуры, выполняющие: Морфемный разбор слов, содержащихся в БД; Морфемный разбор слов, отсутствующих в БД; Поиск слов с заданной морфемой; пользовательский и прикладной интерфейсы. 4/14


Слайд 4

Принципы организации словарных данных Исходные данные – текстовые файлы со словами, разбитыми на морфы (типы морфов помечены): + бетон % о + меш – алк * а Хранимые данные: для каждого слова хранится: 1) Строковое представление 2) Связи с морфами (морфемный состав) для каждого морфа хранится: 1) Строковое представление 2) Тип (соединит. гласная является отдельным типом) 3) Связи с морфами (алломорфы) 5/14


Слайд 5

Схема базы данных словаря words word_morphs morphs allomorphs 6/14


Слайд 6

Функции словаря 1) Осуществление морфемного разбора слов, хранящихся в БД словаря Пример: запрос: одичавший результат: -О+ДИЧ-АВШ*ИЙ 2) Поиск возможного морфемного разбора слов, отсутствующих в БД словаря 3) Поиск групп слов, содержащих заданную морфему (с учетом возможных алломорфов) Пример: запрос: -бер- (корень) результат: слова с корнями -бер-, -бир-, -бр-, -бор-. 7/14


Слайд 7

Поиск вариантов морфемного разбиения (для отсутствующих в БД слов) Шаг поиска: 1) Отщепляются очередные несколько букв. Они рассматриваются как кандидаты в морфы 2) Проверяется, являются ли эти буквы нужным морфом 3) Если да – эти буквы считаются морфом слова, продолжается поиск разбиения для остатка Если нет – отщепляется еще одна буква, либо ищется след. тип Строится дерево поиска, в узлах: Разобранная и неразобранная части слова, Текущий тип морфа 8/14


Слайд 8

Дерево поиска. Пример 1)«» 2) Столик 3) Приставка 1)«» 2) Столик 3) корень Приставка = « » 1)«+Стол» 2) ик 3) суффикс Корень = «Стол» 1)«+Стол-и» 2) к 3) суффикс 1)«+Стол-ик» 2) - 3) - Суффикс = «ик» Суффикс = «и» Суффикс = « » 1)«+Стол-и-к» 2) - 3) - Суффикс = «к» 9/14 1)«-С» 2) толик 3) корень 1)«+Стол» 2) ик 3) окончание Приставка = « С»


Слайд 9

Программная реализация Язык реализации – С++ Среда разработки – Visual Studio 2005 Библиотека графического интерфейса – MFC Реляционная база данных – SQLITE Язык для работы с базой данных – SQL Прикладной интерфейс, поддерживающий: Загрузку исходных файлов; Поиск морфемного состава слов из БД, не из БД; Поиск слов с заданной морфемой 10/14


Слайд 10

Пользовательский интерфейс. Поиск морфемного состава 11/14


Слайд 11

Пользовательский интерфейс. Поиск слов с заданной морфемой 12/14


Слайд 12

Результаты работы Изучены существующие морфемные словари и способы их построения. Предложена модель хранения словарных данных. Разработаны программные средства поддержки: загрузки словарных данных из текстовых файлов; поиска морфемного разбора заданного слова из БД не из БД; поиска слов, содержащих заданную морфему. Реализован прикладной и пользовательский интерфейсы. 13/14


Слайд 13

14/14 Благодарю за внимание!


×

HTML:





Ссылка: