Процедура сегментации текста
Морфемный анализ имеет своими целями: - сегментацию высказывания на кратчайшие значимые сегменты (морфы); - идентификацию морфов как представителей морфем или алломорфем; - инвентаризацию морфем. В языкознании разработан ряд формальных исследовательских приемов, служащих морфемной сегментации. А.М.Пешковский предложил следующую процедуру вычленения значимых частей. Слова располагаются по двум рядам – вертикальному и горизонтальному. Так, членение слова стекло на две значимые части поддерживается возможностью заполнить такие ряды: стекл-о окн –о весл-о сукн-о полотн-о и т.д. стекл -а стекл-янный стекл –яшка стекл-ышко Вертикальный ряд иллюстрирует возможность выделения компонента стекл-, а горизонтальный – компонента -о. Каждый из этих компонентов имеет значение. Членение текста на морфемы осуществляется так, чтобы в результате получались единицы, где отдельному означающему соответствовало бы свое означаемое, и дальнейшая сегментация с тем же результатом была бы невозможна. Например, такая единица, как груша не является минимальной. её можно расчленить на две: груш- и –а. Каждой из двух выделенных частей соответствуют свои означаемые. Означаемое морфемы – а поддается дальнейшему анализу (хотя и не линейной сегментации). В составе комплексного значения, выражаемого экспонентом – а вычленяются значения единственного числа, именительного падежа. Однако каждому из этих значений не соответствует отдельное означающее. Поэтому –а можно считать минимальным знаком. Компонент груш- можно бы разложить еще на гру и ш, но они не имеют означаемого, т.е. им ничего не соответствует в плане содержания, поэтому здесь груш – минимальный знак. Планом содержания морфемы может быть определенная функция, например интерфикс –о- в слове пароход является морфемой, значением которой является соединительная грамматическая функция. Существует специальная процедура членения на морфемы с использованием так называемого «квадрата Гринберга». Суть этого метода состоит в том, что, когда возникает вопрос о членимости некоторой единицы, подбираются три другие единицы, которые вместе с данной составляют пропорцию, или «квадрат», демонстрирующий неуникальность, повторяемость каждой из двух составляющих этой единицы. Например, из существоввания пропорции («квадрата») типа: учить: учил читать: читал следует членение соответствующих слов на учи-, чита-, -л, -ть. Чтобы далее разделить чита- составляем пропорцию: читать: читка качать: качка Эта пропорция доказывает отдельность чит- и соответственно -а. Членение многоморфемных слов осуществляется многоступенчато. В США в рамках дескриптивной лингвистики процедура сегментации была формализована в так называемом НС-анализе (анализе по непосредственно составляющим). Эту процедуру можно схематически представить в виде следующего “дерева” НС: разговорчивый разговорчив ый разговор чив раз говор раз говор чив ый Членение можно записать с помощью скобок (скобочная запись): (((раз) (говор)) (чив)) (ый)
|