Студопедия — Процедура сегментации текста
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Процедура сегментации текста






Морфемный анализ имеет своими целями:

- сегментацию высказывания на кратчайшие значимые сегменты (морфы);

- идентификацию морфов как представителей морфем или алломорфем;

- инвентаризацию морфем.

В языкознании разработан ряд формальных исследовательских приемов, служащих морфемной сегментации.

А.М.Пешковский предложил следующую процедуру вычленения значимых частей.

Слова располагаются по двум рядам – вертикальному и горизонтальному. Так, членение слова стекло на две значимые части поддерживается возможностью заполнить такие ряды:

стекл-о окн –о весл-о сукн-о полотн-о и т.д.

стекл -а

стекл-янный

стекл –яшка

стекл-ышко

Вертикальный ряд иллюстрирует возможность выделения компонента стекл-, а горизонтальный – компонента -о. Каждый из этих компонентов имеет значение.

Членение текста на морфемы осуществляется так, чтобы в результате получались единицы, где отдельному означающему соответствовало бы свое означаемое, и дальнейшая сегментация с тем же результатом была бы невозможна. Например, такая единица, как груша не является минимальной. её можно расчленить на две: груш- и –а. Каждой из двух выделенных частей соответствуют свои означаемые. Означаемое морфемы – а поддается дальнейшему анализу (хотя и не линейной сегментации). В составе комплексного значения, выражаемого экспонентом – а вычленяются значения единственного числа, именительного падежа. Однако каждому из этих значений не соответствует отдельное означающее. Поэтому –а можно считать минимальным знаком.

Компонент груш- можно бы разложить еще на гру и ш, но они не имеют означаемого, т.е. им ничего не соответствует в плане содержания, поэтому здесь груш – минимальный знак.

Планом содержания морфемы может быть определенная функция, например интерфикс –о- в слове пароход является морфемой, значением которой является соединительная грамматическая функция.

Существует специальная процедура членения на морфемы с использованием так называемого «квадрата Гринберга». Суть этого метода состоит в том, что, когда возникает вопрос о членимости некоторой единицы, подбираются три другие единицы, которые вместе с данной составляют пропорцию, или «квадрат», демонстрирующий неуникальность, повторяемость каждой из двух составляющих этой единицы. Например, из существоввания пропорции («квадрата») типа:

учить: учил

читать: читал

следует членение соответствующих слов на учи-, чита-, -л, -ть.

Чтобы далее разделить чита- составляем пропорцию:

читать: читка

качать: качка

Эта пропорция доказывает отдельность чит- и соответственно -а.

Членение многоморфемных слов осуществляется многоступенчато.

В США в рамках дескриптивной лингвистики процедура сегментации была формализована в так называемом НС-анализе (анализе по непосредственно составляющим). Эту процедуру можно схематически представить в виде следующего “дерева” НС:

разговорчивый

разговорчив ый

разговор чив

раз говор

раз говор чив ый

Членение можно записать с помощью скобок (скобочная запись):

(((раз) (говор)) (чив)) (ый)







Дата добавления: 2015-08-12; просмотров: 697. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Меры безопасности при обращении с оружием и боеприпасами 64. Получение (сдача) оружия и боеприпасов для проведения стрельб осуществляется в установленном порядке[1]. 65. Безопасность при проведении стрельб обеспечивается...

Весы настольные циферблатные Весы настольные циферблатные РН-10Ц13 (рис.3.1) выпускаются с наибольшими пределами взвешивания 2...

Хронометражно-табличная методика определения суточного расхода энергии студента Цель: познакомиться с хронометражно-табличным методом опреде­ления суточного расхода энергии...

КОНСТРУКЦИЯ КОЛЕСНОЙ ПАРЫ ВАГОНА Тип колёсной пары определяется типом оси и диаметром колес. Согласно ГОСТ 4835-2006* устанавливаются типы колесных пар для грузовых вагонов с осями РУ1Ш и РВ2Ш и колесами диаметром по кругу катания 957 мм. Номинальный диаметр колеса – 950 мм...

Философские школы эпохи эллинизма (неоплатонизм, эпикуреизм, стоицизм, скептицизм). Эпоха эллинизма со времени походов Александра Македонского, в результате которых была образована гигантская империя от Индии на востоке до Греции и Македонии на западе...

Демографияда "Демографиялық жарылыс" дегеніміз не? Демография (грекше демос — халық) — халықтың құрылымын...

Studopedia.info - Студопедия - 2014-2024 год . (0.03 сек.) русская версия | украинская версия