Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Оживление текста





Это одно из самых молодых направлений в компьютерной лингвистике. Своим появлением оно обязано появлению ПЭВМ, которые впервые дали возможность организовать общение с пользователем не только путем обмена текстами, но и посредством зрительных образов на экране монитора.

Одной из особенностей мышления человека (едва ли не основной возможности самого мышления) является его разномодальность. Психологи пользуются этим термином, чтобы подчеркнуть, что наши представления об окружающем мире и о нас самих могут иметь различную природу (различную модальность). Можно "мыслить словами", но можно представлять себе какие-то зрительные картинки, как часто бывает в снах. Есть люди, для которых многие воспоминания состоят из запахов или вкусовых впечатлений.

Таким образом, можно мыслить словами, образами, запахами, вкусовыми ощущениями, осязаниями, т.е., все наши органы чувств дают свою модальность в мышлении. Однако для человека, пользующегося компьютером, две модальности: символьная (текстовая) и зрительная являются основными.

Между этими модальностями имеется весьма тесная связь. Обычно называние чего-то или текстовое описание некоторой ситуации вызывает зрительные представления об этих объектах и ситуациях. И наоборот, увидев нечто, мы готовы описать увиденное словами. Текст и сопутствующая ему зрительная картинка оказываются объединенными в нашем сознании и интегрированными в некоторое единство, т.е. текст "живет" в сознании в виде некоторого образного представления. Изучение того, как происходит эта интеграция и как по одной составляющей появляется вторая - одна из задач, стоящих перед специалистами в области компьютерной лингвистики и создателями интеллектуальных систем. В настоящее время найдены некоторые важные законы интеграции текстов и зрительных образов. Созданы некоторые экспериментальные модели этого процесса и первые интеллектуальные системы, способные описывать в виде текста предъявляемую им картинку (например, пейзаж), а также воссоздавать одну из возможных картин, соответствующих введенному в систему тексту.

Математическая лингвистика – математическая дисциплина, разрабатывающая формальный аппарат для описания строения естественных и искусственных языков. использует аппарат математической логики (изучает строение математических рассуждений), в основном таких её разделов, как теория алгоритмов и теория автоматов.

Математическое описание языка основано на представлении предложений языка в виде последовательности речевых единиц, которые подчиняются определённым закономерностям (так называемые "правильные тексты") и могут быть обработаны математическими методами носителей.

Разработка и изучение математического описания правильных текстов (предложений) – это задача раздела математической лингвистики как теории способов описания синтаксической структуры языка.

Согласно этой теории для описания предложения как синтаксической структуры можно использовать 2 способа:

1 способСистема составляющих - выделить в предложении составляющие, т.е. отдельные слова и группы слов, функционирующие как целые синтаксические единицы.

Пример. А.С. Пушкин - "Ямщик сидит на облучке".

в предложении "Ямщик сидит на облучке" составляющими будут

1. Всё предложение П = "ямщик сидит на облучке",

2. Группы слов А = "сидит на облучке" и В = "на облучке", а также

3. Каждое слово по отдельности – Я = "ямщик", С = "сидит", Н = "на", О = "облучке".

Из этой фразы можно составить другие правильные предложения – "Ямщик на облучке сидит", "Сидит ямщик на облучке" и др., и неправильные – "На ямщик сидит облучке", "Облучке на ямщик сидит" и др.

Структурно это можно изобразить в виде дерева вложения (рис.2.3).

Здесь система составляющих – это множество отрезков предложения, содержащее в качестве элементов всё предложение и все вхождения слов в это предложение ("однословные отрезки"). Они обладают свойством – каждые два входящих в предложение отрезка либо не пересекаются, либо один из них содержится в другом.

Дерево подчинения – это дерево, множеством узлов которого является множество вхождений слов в предложение.

Из математики: Деревом называется множество, между элементами которого (называемых узлами) установлено бинарное отношение (называется отношением подчинения) и графически изображают стрелками, идущими от подчиняющих узлов к подчинённым. При этом в дереве:

1. Есть один узел, неподчинённый другим узлам, называемый корнем,

2. Каждый из остальных узлов подчинён только одному узлу,

3. Нельзя, выйдя из какого-либо узла по стрелкам-дугам вернуться в тот же узел.

или в виде системы составляющих, т.е. - формул: П = Я + f(А) f(А) = C + f(B) f(B) = (Н +О)

2 способ - дерево синтаксического подчинения - в нём нужно указать для каждого слова те слова, которые ему непосредственно подчинены.

Корнем правильного дерева обычно является сказуемое.

Структурно дерево синтаксического подчинения имеет вид (рис. 2.4).

Пример. в предложении "Ямщик сидит на облучке" корнем является сказуемое "сидит", которому подчинены другие синтаксические единицы:

Построенное для предложения дерево подчинения или систему составляющих часто называют его синтаксической структурой.

Системы составляющих используются преимущественно в описаниях языков с фиксированным порядком слов (напр., в немецком языке сказуемое почти всегда на последнем месте, в английском почти всегда предложение имеет структуру Подлежащее – Сказуемое – Дополнение – Обстоятельство: "I am going home in the evening").

Дерево синтаксического подчинения используется в описаниях языков со свободным порядком слов, в частности, в русском: "Вечером я иду домой".







Дата добавления: 2015-09-19; просмотров: 756. Нарушение авторских прав; Мы поможем в написании вашей работы!




Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...


Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...


ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...


Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Эффективность управления. Общие понятия о сущности и критериях эффективности. Эффективность управления – это экономическая категория, отражающая вклад управленческой деятельности в конечный результат работы организации...

Мотивационная сфера личности, ее структура. Потребности и мотивы. Потребности и мотивы, их роль в организации деятельности...

Классификация ИС по признаку структурированности задач Так как основное назначение ИС – автоматизировать информационные процессы для решения определенных задач, то одна из основных классификаций – это классификация ИС по степени структурированности задач...

КОНСТРУКЦИЯ КОЛЕСНОЙ ПАРЫ ВАГОНА Тип колёсной пары определяется типом оси и диаметром колес. Согласно ГОСТ 4835-2006* устанавливаются типы колесных пар для грузовых вагонов с осями РУ1Ш и РВ2Ш и колесами диаметром по кругу катания 957 мм. Номинальный диаметр колеса – 950 мм...

Философские школы эпохи эллинизма (неоплатонизм, эпикуреизм, стоицизм, скептицизм). Эпоха эллинизма со времени походов Александра Македонского, в результате которых была образована гигантская империя от Индии на востоке до Греции и Македонии на западе...

Демографияда "Демографиялық жарылыс" дегеніміз не? Демография (грекше демос — халық) — халықтың құрылымын...

Studopedia.info - Студопедия - 2014-2025 год . (0.008 сек.) русская версия | украинская версия