Студопедия — Автоматический анализ текста
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Автоматический анализ текста






Проблема автоматического анализа текста не входит в число сугубо психолингвистических, однако она не может быть успешно решена без учёта данных психолингвистики. Не рассматривая эту проблему в целом, отметим следующее.

В конце XX в. количество электронных текстов и документов, су­ществующих только в компьютерном варианте, возросло многократно и по­требовало развития технологий, связанных с обработкой данных. Обра­ботка документов, созданных на естественном языке (NLP – «natural language processing») – это новые технологии, которые помогают человеку использовать электронные тексты и легко находить и обрабатывать документы*.

К примеру, такая процедура, как резюмирование текста позволяет уменьшать его объём и сделать возможным его показ даже на миниатюрном дисплее мо­бильного телефона. Искусственное упрощение и «обобщение» текста может помочь детям, пожилым людям, иностранцам легче понять его содержание. Для того чтобы осуществить «компрессию» (сжатие) текста, необходимо применять такие процеду­ры перефразирования, которые учитывали бы длину и стиль текста, его «читабельность», не нарушая при этом его смысла. Автоматиче­ский перифраз – это своего рода машинный перевод информации в рамках одного и того же языка. К тому же способность к перефразированию тесно связана со способностью понимать речь. Психолингвисты полагают (Леонтьев А.А., 2003; Фрумкина, 2001 и др.), что если может быть создана автоматизированная система, способная из­лагать текст иными словами, то она (пусть и на уровне формальной интерпретации) уже способна «понимать» текст, что, в свою очередь, очень важно для реше­ния проблемы искусственного интеллекта. Одним из самых известных примеров подобной автоматической системы является компьютерная программа «Элиза», общение с которой моделирует общение с психотерапевтом. Одна из модификаций этой программы, PC «Friend ECC Eliza» (21, 246), может представляться окружающим (Я компьютерный психолог), называя свое имя, начинает процедуру беседы (Расскажите, пожалуйста, о своих проблемах); можетповторять вопросы, требуя необходимых уточнений (Мне нужно больше информа­ции об этом. Не могли бы Вы сказать ещё что-нибудь по этому поводу? Что Вы имеете в виду, когда говорите...?); просит сменить тему, если она ей незнакома (Давайте сменим тему беседы.); зада­ёт ироничные вопросы (Вы говорите «нет» только для того, чтобы проявить свой негативизм?). Таким образом она копирует речевое поведение психолога. Многие психолингвистические разработки по данной тематике связаны с проблемой распознавания речи и перевода её, например, из устной в графическую, в т.ч. письменную форму. Приме­нение подобных прикладных разработок психолингвистики имеет большие перспективы для создания интерактивных систем взаимодействия человека и машины (для создания электронных секретарей, компьютерных переводчиков, компьютерных лингвистов-диагностов и т.д.).*







Дата добавления: 2014-11-10; просмотров: 639. Нарушение авторских прав; Мы поможем в написании вашей работы!



Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Весы настольные циферблатные Весы настольные циферблатные РН-10Ц13 (рис.3.1) выпускаются с наибольшими пределами взвешивания 2...

Хронометражно-табличная методика определения суточного расхода энергии студента Цель: познакомиться с хронометражно-табличным методом опреде­ления суточного расхода энергии...

ОЧАГОВЫЕ ТЕНИ В ЛЕГКОМ Очаговыми легочными инфильтратами проявляют себя различные по этиологии заболевания, в основе которых лежит бронхо-нодулярный процесс, который при рентгенологическом исследовании дает очагового характера тень, размерами не более 1 см в диаметре...

ЛЕЧЕБНО-ПРОФИЛАКТИЧЕСКОЙ ПОМОЩИ НАСЕЛЕНИЮ В УСЛОВИЯХ ОМС 001. Основными путями развития поликлинической помощи взрослому населению в новых экономических условиях являются все...

МЕТОДИКА ИЗУЧЕНИЯ МОРФЕМНОГО СОСТАВА СЛОВА В НАЧАЛЬНЫХ КЛАССАХ В практике речевого общения широко известен следующий факт: как взрослые...

СИНТАКСИЧЕСКАЯ РАБОТА В СИСТЕМЕ РАЗВИТИЯ РЕЧИ УЧАЩИХСЯ В языке различаются уровни — уровень слова (лексический), уровень словосочетания и предложения (синтаксический) и уровень Словосочетание в этом смысле может рассматриваться как переходное звено от лексического уровня к синтаксическому...

Studopedia.info - Студопедия - 2014-2024 год . (0.009 сек.) русская версия | украинская версия