Понятие и структура текста
Текст представляет собой многоуровневую систему, причем не только в семиотическом аспекте (знак-слово, знак-предложение, знак-сложное синтаксическое целое), но и с точки зрения других измерений ею синтаксической, коммуникативной, семантической, информативной структуры и др. Рассмотрение текста с точки зрения перечисленных структур позволяет нам во многих случаях решить вопрос о форме свертывания (да и самой возможности свертывания) тех или иных структурных составляющих текста, выработать наиболее адекватную стратегию свертывания. Синтаксическая структура текста. Текст с точки зрения его синтаксической структуры представляет собой сложную многоуровневую систему суперсинтаксических единиц, очищающихся друг от друга «масштабностью» своих микротем. В литературе эти суперсинтаксические единицы называются по-разному – “сложное синтаксическое целое”, “суперсинтаксическое единство”, “прозаическая строфа”, “сегмент”, “суперсегмент”, “субтекст” и др. В качестве рабочего понятия мы будем называть “сложным синтаксическим целым” синтаксическую единицу, большую, чем предложение. Сложное синтаксическое целое – это обусловленная, формально самостоятельная, синтаксически и семантически спаянная единица языка. Иногда сложное синтаксическое целое отождествляют с абзацем. Тем не менее, это разные категории: абзац – семантико-стилистическая категория, а сложное синтаксическое целое – категория синтаксиса текста. Иногда сложное синтаксическое целое может совпадать с абзацем, иногда в одном абзаце обнаруживается несколько сложных синтаксических целых, чаще несколько абзацев составляют одно сложное синтаксическое целое. Могут быть случаи, когда сложное синтаксическое целое состоит из одного предложения (формулировки, крылатые выражения). В научной литературе сложное синтаксическое целое обычно начинается с автосемантического предложения, за которым следует несколько синсемантических. Автосемантическим является то предложение, которое, будучи изъятым, из контекста, не содержит в себе никаких эксплицитно, т. е. явно, выраженных связей с другими предложениями, оно всегда самостоятельно и имеет твердое начало (начинается с существительного-подлежащего или группы подлежащего). Синсемантические предложения подчинены контексту и вне его лишаются ситуативной определенности, т. е. несамостоятельны и имеют мягкие начала (соединительный союз или глагол-сказуемое, указательные, притяжательные или личные местоимения 3-го лица, неполное предложение, т. е. слова-заместители, слова-связки). Затем последующее сложное синтаксическое целое снова может начинаться автосемантическим предложением, детерминирующим некоторую совокупность подчиненных ему синсемантических фраз (чаще всего от трех до семи). Таким образом, каждый микротекст можно рассматривать как результат некоторого развертывания автосемантического предложения с одной микротемой. При рассмотрении сложного синтаксического целого как объекта свертывания обращает на себя внимание следующее: автосемантические предложения обычно выступают в качестве метаинформативных элементов сложного синтаксического целого, синсемантические – в качестве его информативных элементов. Поэтому, если стоит задача в процессе свертывания повысить уровень метаинформативности сложного синтаксического целого, из него последовательно удаляется определенное количество синсемантических предложений. При этом важно, чтобы в оставшихся синсемантических предложениях слова – заместители (типа эти, такой, подобный, они и т.д.) были заменены на соответствующие им смысловые элементы из удаляемых вышестоящих предложений. В противном случае свернутое сложное синтаксическое целое потеряет свое смысловое единство. К числу основных текстообразующих признаков сложного синтаксического целого обычно относят цельность, тематичность и связность. Цельным называется такой текст, который воспринимается как осмысленное целесообразное единство. Цельный текст характеризуется иерархией смысловых предикатов. В этом смысле можно определить цельный текст как такой текст, который при переходе от одной последовательной ступени смысловой компрессии к другой, более “глубокой”, каждый раз сохраняет свое смысловое тождество, лишаясь маргинальных (т.е. пограничных) элементов. Тематичность текста характеризуется единством предмета высказывания. Во всяком тексте, если он относительно закончен и последователен, высказана одна основная мысль, один тезис, одно положение. Все остальное подводит к этой мысли, развивает ее, аргументирует, разрабатывает. Одним из важнейших текстообразующих факторов общепризнанно является связность, без которой текст как функционально завершенное целое вообще немыслим. Различают содержательный, логический и композиционный аспекты связности. Содержательный аспект связности проявляется через употребление лексико-грамматических средств связи самостоятельных предложений и абзацев: лексические повторы, указательные и личные (3-го лица) местоимения, наречия с причинно-следственным, пространственным и временным значениями. Логический аспект связности проявляется через выражение логических отношений между предложениями, абзацами и т.д. посредством функционально-синтаксических средств – вводные слова типа так, таким образом, следовательно, итак, кроме того, наконец и др.; наречия и наречные слова сюда, отсюда, тогда, здесь, оттого, потому, затем, теперь, сейчас, сначала, сперва, после, выше, ниже и др.; союзы и, а, но, да, а и, однако, однако же и др. Композиционный аспект связности выражается с помощью так называемых конструкций связи: рассмотрим, заметим, что; важно подчеркнуть что; можно предположить, что; следует иметь в виду, что; ж понятно, что; как будет показано ниже, согласно сказанному выи чается в следующем и др., относящихся также к функционально-синтаксическим средствам. Конструкции связи можно считать специфическими именно для научного стиля. Они почти не соотносятся с лексической предложения (чем отличаются от лексико-грамматических средств), являются частью его синтаксической структуры. С точки зрения информационного содержания сообщения, конструкции связи избыточны, однако придают емунеобходимую связность. Следует обратить внимание на факторы, имеющие для свертывания значение: возможно, создать текст, который с лексико-синтаксической точки зрения носит признаки связного текста, но таковым не является. Например: “Я пошел в кино. Кино на Остоженке. Остоженка – одна из самых старых улиц Москвы. Москва – центр всех железнодорожных путей страны”. С другой стороны можно создавать вполне связные тексты без специальных сигналов связи. Заключая рассмотрение основных аспектов текстовой связности необходимо упомянуть о двух типах структур связного текста – цепочной и рамочной. В случае цепочной структуры текста все предложения оказываются связанными между собой так, что каждое данное предложение связано ним предыдущим предложением, либо с одним предыдущим и одним последующим. При этом наблюдаются простые цепочки, когда каждое предложение связано с предыдущим с помощью лишь одного средства связи (либо повтора, либо коннектора и т. п.), и сложные, что встречаются чаще, когда предложения присоединяются друг к другу различными “скрепами”. В случае рамочной структуры текста сколь угодно много предложений текста образуют относительно законченное целое, состоящее из трех частей, которая по тем или иным причинам требует раскрытия в последующем контексте, средней (конкретизирующей) части, раскрывающей начальную (вводную) часть, и заключительной (обобщающей) части, – она подводит, итог образует своеобразную рамку. Рамочная структура бывает характерной не только для произведения в целом, но и для различных структурных составляющих – главы параграфа, абзаца. Средства внутритекстовой связности. Среди средств, обеспечивающих связность текстовых единиц различного уровня, обычно выделяют группы: 1) лексические и семантические повторы, 2) соотнесенность временных форм глаголов и 3) анафорические и логико-смысловые коннекторы. Остановимся более подробно на первой и третьей группах поскольку они представляют наибольший интерес для свертывания текста. В одном и том же тексте встречаются разные виды повторов: – основные: а) когда каждое предложение включает некоторую словоформу одного и того же имени существительного, б) когда предложения включают синонимичные имена существительные (строительство – постройка), в) когда предложения включают имена существительные, находящиеся в парадигматических отношениях тина подчинения (врач – кардиолог), г) когда последующие предложения включают прилагательные или глаголы с той же основой, что и существительные первого предложения (опора – опорный); – расширенные: а) когда предложения включают имена существительные, являющиеся синонимами в рамках данного контекста (контекстуальными синонимами), б) когда в последующих предложениях имя существительное заменено на личное, притяжательное или указательное местоимение. Если повторы относятся к семантическим, содержательным средствам внутритекстовых связей, то коннекторы причисляются к средствам синтаксической связи. О частоте употребления коннекторов в научных текстах свидетельствуют следующие данные: «...в разделе «Свойства научной информации» и «Ценность научной информации» в 275 предложениях зафиксировано 192 коннектора». Таким образом, коэффициент использования коннекторов равен примерно 0,7 (около 7 коннекторов на 10 предложений). Известно несколько разновидностей коннекторов. Таблица 3.3.1. Разновидности коннекторов
Подобным образом связываются в тексте не только предложения, но и сложные синтаксические целые и абзацы. Для нас важно и другое – многие из указанных лексических единиц являются не только средством внутритекстовой связи, но и средством функциональной идентификации предложений, средством выражения условности, гипотетичности, итоговости, дополнительности и т. д. при формализованном анализе текстов. Коммуникативная структура текста. С понятием «синтаксическая структура» тесно связано представление о коммуникативной структуре. Выражение «коммуникативная структура» первоначально было введено для предложения. В отличие от синтаксической (формально-грамматической) структуры предложения, включающей несколько членов предложения, коммуникативная структура опирается на смысловое членение высказывания. Коммуникативная структура всегда двучленна. Она состоит из субъекта – темы (Т), т.е. о чем сообщается в данном предложении (известное, данное), и предиката – ремы (Р), т.е. что сообщается в данной теме (новое). Однако принцип смыслового членения характерен не только для предложения (высказывания), но и для текста в целом и различных его частей. Текст в целом можно рассматривать как выражение суждения, субъект которого сформулирован в заглавии, а предикат – весь остальной текст. Этот принцип позволяет делить целый текст на смысловые фрагменты (единицы), которые в свою очередь представляют собой текстовое суждение более низкого уровня иерархии, включающие свои текстовые субъекты (темы) и текстовые предикаты (ремы). Следует, однако, иметь в виду, что предмет текстового субъекта не совпадает с предметом логического субъекта; не совпадают, соответственно, по содержанию текстовой и логический предикаты, поскольку логические субъекты и предикаты представляют собой понятия, а текстовые субъект и предикат – логические суждения (предложения, сегменты и т.д.). Для коммуникативной структуры научного текста характерны в основном четыре вида отношений типа Т – Р (или четыре типа коммуникативных цепочек) в рамках того или иного сложного синтаксического целого. 1-ый вид – простая линейная корреляция Т и Р (или цепная, последовательная связь). В этом случае каждая рема предыдущего предложения является темой для ремы следующего предложения. Такой вид контекста иногда называют последовательным строем: Т1 – Р1
Т2 (=Р1) – Р2
Т3 (=Р2) – 3 и т.д. Пример: Человеческая культура неотделима от традиций. Традиции, существующие десятки и сотни тысяч лет, могут превратиться в социальный институт. Институт – не помещающаяся в рамки традиции массовая привычка что-либо делать определенным образам. В случае такой организации текста ни одно звено (Т – Р ) в этой цепочке не может быть изъято без нарушения связности текста. 2-ой вид – последовательная корреляция Г и Р с постоянной темой (связь типа “нанизывание”). В этом случае при одной повторяющейся теме имеется некоторое количество рем: Т1 – Р1
Т1 – Р2
Т1 – Р3 Пример: Ценности – социально одобряемые и разделяемые большинством людей представления о том, что такое добро, справедливость, патриотизм, дружба и т.п. Ценности не подвергаются сомнению. Ценности служат эталонам, идеалам для всех людей. В случае такой организации текста в процессеего свертывания возможноисключение второго и последующего упоминания Т1. 3-ий вид – предложения объединены параллельной связью. Здесь разрабатывается (развертывается) не рема, а тема. последующие темы являются производными от тем других тем, а не рем: Т 1————— Т —————1... Т1–Р1 Т2–Р2 Т3–Р3 Пример: Толкотт Парсонс (США) рассматривает три системы. Социальная система включает совокупность институтов и структур, обеспечивающих социальные требования и организацию совместной жизни людей. Система личности состоит из способов организации мотивированного действия. Система культуры направляет взаимодействие людей, чтобы примирить личность и общество, поддержать порядок. 4-ый вид – смесь 1-го и 2-го видов (смешанный тип). Например: Т1 – Р1 или Т1 – Р1 или Т1
Т2 – Р2 Т2 – Р2 Р1 Р2 Р3 Р4
Т2 – Р3 Т3 – Р3 и т.д. Т2 – Р5
Р6 и т.д.
Примером текста, имеющего структуру, изображенную последним графом, может служить: К социально - демографической подструктуре (Т1) относятся различия по полу (Р1), возрасту (Р2), образованию (Р3), семейному положению (Р4). Семейное положение (Т2) зависит от ряда признаков (Р5), характерных для данной социальной структуры (Р6). В свою очередь, сочетание нескольких микротекстов образует комбинированную структуру, в которой сами микротексты могут располагаться последовательно либо последовательно с вклиниванием «инородною» микротекста. При этом, как правило, вершинный микротекст выполняет обобщающие функции. При решении вопросов свертывания подобных текстов микротексты, подчиненные «вершинному», могут опускаться, т.к. наиболее информативным является первое предложение, отражающее тему. Аспектная структура текста. Семантический анализ текста (документа) предполагает разбиение его на отдельные содержательные аспекты, набор которых в достаточной степени универсален для однотипных документов. Под содержательным аспектом понимают контекст, характеризующий тот или иной предмет рассмотрения в документе с определенной точки зрения: его развития, назначения, принципа действия, условий применения и т.д., либо логике изложения содержания документа (постановка проблемы, целевая установка, описание предлагаемого варианта решения и т. д.). В практике реферирования такие перечни аспектов часто называют “сетками”. Можно выделить два типа содержательных аспектов: первый отражает структуру (логику) вида документа, например статьи, другой – структуру (логику) той или иной области знания или труппы объектов. Так, в качестве примера характерной сетки первого типа можно привести следующий перечень аспектов: 1. Известный вариант решения (ИВР). 2. Недостатки и оценки известного варианта решения (ОцИВР). 3. Постановка проблемы (целевая установка) (11П, ЦУ). 4. Описание предлагаемого варианта решения (ОГ1ВР). 5. Оценка предлагаемого варианта решения (ОцПВР). 6. Особенности предлагаемого варианта решения (ОсПВР). 7. Экспериментальная проверка (ЭП). 8. Эффективность (экономическая, социальная) (Э). 9. Область применения (ОП). 10. Выводы (В). 11. Результаты (Р). 12. Рекомендации (Рек.). Подобная структура документа отражает, как правило, саму логику исследования: вначале изучается состояние вопроса – что уже сделано, достигнуто в данной области, чем достигнутое не удовлетворяет требованиям нового этапа практики, т.е. в чем суть рассогласования между существующим и требуемым. Этот этап разработки находит отражение в аспектах ИВР и ОцИВР. Затем на основе анализа существующей ситуации формулируется ведущая гипотеза о способах и средствах устранения имеющегося рассогласования. Этот этап отражается в аспектах МП, ЦУ. Далее следует сама разработка (эксперименты, расчеты и пр.) и осмысление полученных результатов с анализом их достоинств, ограничений, особенностей и возможностей дальнейшего использования. Эти этапы находят отражение, соответственно, в аспектах ОПВР, ОсПВР, В, Рек и др. Аспектная структура сеток второго типа определяется характером описываемого в документе объекта – описывается ли методика в целом, отдельный метод, материал, конструкция и т. д. Для документов – статей, посвященных, например, изложению технологического процесса, аспектная сетка будет иметь вид: 1. Сущность технологического процесса. 2. Последовательность отдельных технологических операций. 3. Объект, подвергавшийся обработке. 4. Применяемое оборудование и инструмент. 5. Результаты процесса, качество и свойства полученных изделий. 6. Область применения процесса. Сетки, отражающие логику того или иного вида документа (первого типа), имеют значение прежде всего в практике реферирования (аннотирования) и, как правило, носят универсальный характер для многих отраслей знания. Сетки второго типа также используются для описания структуры вторичного документа, однако имеют большее значение для фрагментирования документов, выделения из них содержательно самостоятельных типовых фрагментов текста. Несмотря на многообразие научных документов (множество типов и видов научной литературы, отраслей знания), различие в языке и стиле их авторов, в структуре научных документов наиболее часто встречаются следующие аспекты содержания: Семантический блок Аспекты содержания 1. Вводная часть Актуальность проблемы Известный вариант решения Недостатки известного варианта решения Целевая установка П. Основная часть Предлагаемый вариант решения или предмет рассмотрения Особенность предлагаемого варианта решения Место исследования Область применения (назначения) Методы исследования Оборудование или технические средства реализации Примеры Наглядное представление информации Математический аппарат Экспериментальная проверка Преимущества предлагаемого варианта решения Ш. Заключение Результаты Выводы Рекомендации Информативная структура текста. С точки зрения информативной структуры, в терминах теории информации текст представляет собой последовательность сигналов (знаков), отражающих содержание какого-либо объекта и несущих не только новую информацию, но и некоторое количество информации известной (в сумме – полезную информацию), а также и неизбежные помехи. Новая информация – это целенаправленно создаваемая часть текста, которая, по мнению автора (коммуниканта), способна внести изменения в структуру как общественного, так и индивидуального тезаурусов. Это содержательная часть текста. Составной частью новой информации является шум, который в то же, время относится и к сфере помех (но не входит в сферу полезной информации). Шум – это дезинформация, вольно или невольно закравшаяся в текст: ошибки в расчетах и обобщениях, предвзятые, необоснованные выводы и рекомендации, недостаточно корректно трактуемые результаты экспериментов и др. Шум – самая опасная категория помех, поскольку снижает уровень содержательности информации. Искажения выступают в виде различных стилистических ошибок, нечетких формулировок и пр. К избыточной информации относятся уже известные сведения, повторения, излишние подробности. Избыточная информация разделяется на релевантную и нерелевантную, причем граница между ними весьма подвижна и зависит от степени развитости тезауруса человека и уровня свертывания ситуации в сообщении. Наряду с избыточной нерелевантной информацией в документе не только допустима, но и обязательна избыточная релевантная информация, обеспечивающая понимание и восприятие новой информации. Известно, что ничто новое не может быть воспринято без введения его в контекст известного. Задача заключается в том, чтобы известное было изложено на уровне свертывания, соответствующем назначению документа. Таким образом, избыточная информация может относиться не к сфере помех, а к полезной информации. Полезностью обладают также и метаинформативные элементы текста, ориентирующие в структуре документа. Функционально-смысловая структура. Традиционно различают три типа речи (текста): описание, повествование, рассуждение (иногда добавляют определение). Текст-описание характеризуется перечислением признаков описываемого объекта или его частей. Здесь построение текста определяется структурой и признаками данного объекта. Для текста-повествования характерно сообщение о развивающихся действиях, событиях, состояниях. Здесь материал излагается часто в хронологической последовательности, отражая процессуальность жизни. В текстах-рассуждениях содержатся причинно-следственные (выводные) конструкции, авторские оценки, модальные слова. Здесь тексты отражают,какправило, ход процесса мышления. Подобная функционально-смысловая типология текстов применима лишь к сравнительно небольшим фрагментам текста, так как более крупные текстовые образования содержат в себе нередко все три типа речи. В рамках различных функциональных стилей (научного, официально-делового, публицистичного) типы изложения (речи) в общем универсальны и, попадая в любой из стилей, сохраняют присущие им как типам изложения лингвистические черты. Однако в пределах конкретного функционального стиля (в нашем случае – научного) доля разных способов изложения меняется в зависимости от вида науки. Так, в экспериментальных науках и в работах, описывающих эксперимент, чаще используется повествовательный тип речи. В логико-теоретических жуках (философии, например), а также в работах теоретического характера (независимо от принадлежности к той или иной науке) чаще используется такой тип речи, как рассуждение. Для наук описательных характерен, естественно, описательный тип речи. Обратим внимание на особенности свертывания текстов, относящихся к различным типам речи. Так, описательный текст легче поддается сокращению, чем текст – рассуждение, поскольку в многочленной конъюнкции высказываний не все из них, как правило, обладают равнозначной важностью и релевантностью. И эти менее важные и релевантные высказывания могут быть в ряде случаев опущены без ущерба для общего смысла текста (хотя информативность в этом случае обычно уменьшается). В случае свертывания текста – рассуждения, в котором связь между элементами текста более жестка, так как основана на отношении следования, устранение даже одного из компонентов логической конструкции может привести к искажению смысла. Поэтому при свертывании текстов подобного типа допустимы лишь такие сокращения, которые основаны на подразумеваемости устраняемых посылок или вывода, т.е. на сокращенном характере умозаключения. При этом для научного текста специфичны выводы, представляющие собой предложения с элементом, обобщающим несколько предыдущих предложений, что создает особый тип изложения, а именно «повествование-рассуждение». В данной теме рассмотрены лишь наиболее распространенные структуры текстов. Изучение различных текстовых структур имеет важное практическое значение для решения многих задач как интеллектуального, так и формализованного свертывания (в том числе для аннотирования, реферирования, фрагментирования). Здесь показаны возможности свертывания, исходя из особенностей текста. Данные структурного анализа текстов используются для создания алгоритмов свертывания первичных документов.
Вопросы и задания для самоконтроля:
1. Объясните, что такое “свертывание информации”? 2. Какие уровни информационного свертывания текста существуют? Как они между собой взаимосвязаны? 3. Какие виды информационного свертывания принято выделять? Охарактеризуйте их. 4. Какие существуют основные способы лексического свертывания? 5. Выделите важнейшие текстообразующие факторы. 6. Что такое “коннектор” и какие его разновидности используются? 7. Охарактеризуйте аспектную структуру текста.
|