- Lektsia - бесплатные рефераты, доклады, курсовые работы, контрольные и дипломы для студентов - https://lektsia.info -

К проблеме установочного уровня системы автоматического распознавания речи



 

Исходя из задач имитации автоматическим устройством про­цесса рецепции речи, предлагается обратить внимание на наличие в системе рецепции «установочного уровня».

Как известно, существуют стереотипные (ритуальные) ситуации квазиобмена информацией, в которых функционируют соответст­вующие клише. (Здравствуйте, как дела? - Здравствуйте, ничего, спасибо! и т.п.). При обмене такими клише от коммуникантов не требуется, как правило, ни формирования значимой информации «на выходе», ни ее специальной переработки «на входе». Происходит это потому, что невербальная информация (рукопожатие, улыбка или, напротив, суховатый тон) и прежний экстралингвистический опыт общения являются более значимыми, чем вербальная часть. Простой опыт замены сочетаний как дела, на как мола, здравствуй­те - на страсти-то, или трости нет, или даже на дроссели на аде­кватном невербальном фоне покажет отсутствие слухового контроля у адресата, а точнее, его существенное ослабление. Практически уз­навание, включая и ложное узнавание клише, происходит при нали­чии установки коммуникантов на ритуал приветствия с обычными его компонентами.

В состав установки входит результат оценки ситуации и ряда привычных звукокомплексов. Процесс прогнозирования в таком случае играет более существенную роль, чем собственно анализ «на входе», который может быть даже полностью вытеснен.

Но и в том случае, если анализ вербальной части сообщения производится формально точно, семантическая его интерпретация в целом или отдельных его частей может быть абсолютно ошибочной,

не соответствующей намерениям адресанта, если последний имеет установку, существенно отличную от установки адресата.

Таким образом, если автоматическое устройство распознания речи должно имитировать реальную человеческую систему распо­знания (всегда в связи с ситуацией общения), то в этом устройстве (в дальнейшем - АРР) должен быть предусмотрен «блок установки». Учитывая вероятную специфику АРР, этот блок должен иметь «память ситуации», которая накапливается в результате действия «перцептрона» (устройства, воспринимающего реальные ситуации, типизирующего их и передающего в соответствующем коде «памяти ситуаций»). Каждая из наиболее вероятных ситуаций, в которых осуществляется общение, должна быть запечатлена в «блоке установ­ки», в его собственной памяти. В свою очередь, каждый участок памяти должен быть связан с рядом вариантов наиболее вероятных вербальных сообщений, которые необходимо воспринять и дешифровать. Результа­ты дешифровки информации соотносятся с перцептроном, продол­жающим опознавать ситуацию, ее детали, возможные ее изменения. Подтверждение памяти прогноза на уровне установки и ситуации вызывает сигнал, идущий в блок с программой ответных физических действий или в блок вербальных реакций (или в оба блока).

Приведем данные некоторых экспериментов, подтверждающие необходимость наличия установочного уровня для эффективного смыслового распознавания вербальных сигналов.

В большой группе испытуемых (студенты) в 1-й части экспери­мента были проведены кратковременные занятия по анализу пред­ложений на русском и немецком языках. Среди других было и пред­ложение с фрагментом бакланы летят под облаками Эксперимента­тор привлек внимание студентов именно к этой части предложения, которую испытуемые несколько раз повторили вслух. Через некото­рое время испытуемым была предъявлена магнитофонная запись ряда предложений с инструкцией: «Воспринять на слух, повторить вслух, определить синтаксический тип». Среди нормально записан­ных предложений были и такие, которые в разной степени «зашумливались» и не соответствовали ранее знакомым.

Некоторые предложения были совсем новыми, но сохраняли интонационные характеристики ранее знакомых и были равными им по длительности звучания.

В других предложениях, ранее знакомых, некоторые слова за­менялись синонимами. В-третьих, производились весьма сущест­венные замены, искажавшие смысл. В-четвертых, часть предложе­ния сохранялась прежней, а другая часть полностью заменялась при легком зашумлении или без него.

Результаты показали, что испытуемые восприняли знакомые ранее примеры предложений, которые полностью или частично пе­решли в преддолговременную память. По запечатленным в ней при­знакам знакомых сообщений испытуемые реализовали соответст­вующую установку на опознание знакомых предложений. Под влия­нием установки избиралась соответствующая стратегия опознания и воспроизведения. Поэтому в 100% случаев запись баклажаны ле­жат под огурцами опознавалась как бакланы летят под облаками -как в знакомом, так и в новом, дистрибутивном окружении. В 45% случаев существенные (по форме и содержанию) замены игнориро­вались и воспроизводилась не реальная запись, а ранее услышанное. В 28% случаев ранее запомнившееся предложение воспроизводи­лось при аудировании записей (сильно зашумленных) совершенно других предложений, обладающих сходными (с прежними) или сов­падающими просодическими параметрами. Воспроизведение пред­полагаемого целого под действительно опознанными частями (целое реально было другим) наблюдалось также довольно часто (10-15% попыток «досрочного опознания» при 8% ложных опознаний).

Теорию установки, как нам представляется, хорошо объясняет гипотеза относительно того, что опознание речевого целого производится не поэлементно (звуки, слоги, морфемы), а крупными сег­ментами или даже целостным текстом.

Непосредственное влияние установки на ожидаемый речевой сигнал и даже на инициативное вербальное обращение в плане сформированной установки может быть продемонстрировано на результатах ряда опытов, сходных по методике и по наблюдаемым явлениям. Довольно легко показать, что на стадиях раннего онтоге­неза поведение ребенка, включая и речевое, во многом определяется тесной связью с ситуацией, связанной с соответствующей установ­кой, и вне ее часто вообще не осуществляется. Например, вербаль­ное общение при актуальном восприятии партнера, причем хорошо знакомого, проходит успешно. Если заменить партнера, то ребенок, не имеющий опыта такого рода замен, «стесняется», т.е. чувствует неловкость именно из-за того, что новая ситуация тормозит реализа­цию знакомой (сформированной) установки. Можно утверждать да­же, что ребенок плохо понимает в таких случаях обращенный к нему вопрос, так как именно знакомая ситуация является одним из средств дешифровки смысла речи. Первые опыты ребенка в комму­никации по телефону приводят, как правило, к затруднениям, а ино­гда к невозможности коммуницироваиия: речь знакомого человека при этом может быть точно опознана по голосу. Очевидно, что АРР, запрограммированная на распознание речевых сигналов в любой их тоновой, силовой и тембровой модификации, будет работать куда эффективнее ребенка, будучи зависимой только от объема вербаль­ной памяти и от ресурсов возможных ответов на опознанные стиму­лы. Но. возможно, в задачи некоторых АРР входит выдача информа­ции или реализация ответов только определенному партнеру и толь­ко в определенной ситуации. Тогда явно необходим блок установоч­ного уровня, работающий в зависимости от показаний перцептрона относительно ситуации общения.

Что касается невербальной информации другого типа, т.е. функционирующей в единстве с содержанием и формой информации вербальной, то мы отсылаем читателя для более подробного озна­комления к нашей работе [Горелов 1980].

Здесь же ограничимся беглым изложением некоторых содер­жащихся в ней положений, которые проиллюстрируем примерами.

Невербальный компонент как универсалия речевого акта

Термин «паралингвистика» в первой его части нередко исполь­зуется в том же духе, что и первая часть термина «парапсихология». Мы, однако, попытались доказать, что паралингвистика стала или должна стать неотъемлемой составной частью как общего языкозна­ния, так и любой частной лингвистики.

«Речевой акт» (РА) понимается как целенаправленная и адре­суемая коммуникативная деятельность, реализуемая во времени и в пространстве с целью обмена значимой (в «специфически-челове­ческом» смысле) информацией с помощью системы естественного языка в его, например, устной форме. Имеется в виду, что РА осу­ществляется в обычных условиях, т.е. без опосредования техниче­скими средствами, разрешает взаимонаблюдение участников РА, а также их обычные дистантные характеристики. Определения «целенаправленная» и «адресуемая» относятся к обозначению ".обмен», но не всегда к «информации»; в ряде случаев участники РА порождают и (или) воспринимают не запланированную заранее или процессе порождения информацию. Последняя могла обнаружить­ся не в связи с желанием участника (участников) РА и даже вопреки такому желанию. Поэтому РА не во всех своих формальных и со­держательных составных понимается как «вполне осознаваемый». «С помощью» означает не «исключительно с помощью», не только средствами языка как объекта традиционной лингвистики.

«Невербальный компонент» (НВК) РА понимается как несобст­венно лингвистический знак (в традиционном смысле по существу), так как он отличается от собственно лингвистического знака, во-первых, своеобразием субстанции, своеобразием структуры и осо­быми, иными, чем лингвистические знаки, возможностями обозна­чения и способностями сочетания с себе подобными и другими зна­ками. Вместе с тем НВК способен к выполнению функций лингвис­тического знака, причем всегда - при наличии намерения участника РА или без такого намерения - выступает в РА. Например:

«- Фемистоклюс, - сказал Манилов, обратившись к старшему... Чичиков поднял несколько бровь, услышав такое отчасти греческое имя, которому, неизвестно почему, Манилов дал окончание на юс, постарался тотчас привесть лицо в обыкновенное положение»; «Но Манилов так сконфузился и смешался, что только смотрел на него.— Мне кажется, вы затрудняетесь?.. - заметил Чичиков»; «- А где же Иван Антонович? - Старик тыкнул пальцем в другой угол комнаты. Чичиков и Манилов отправились к Ивану Антоновичу».

Если в 1 -м случае мимическое движение (поднял бровь) простая непроизвольная и неадресованная реакция удивления, то второе ми­мическое движение (постарался привесть лицо в обыкновенное по­ложение) и целенаправлено, и адресовано (Манилову). Информация, содержащаяся в 1-м мимическом движении, не была «считана» Ма­ниловым (Гоголь по крайней мере об этом не пишет), поэтому об­щий ход РА не нарушается. Во 2-м случае непроизвольная сигнализация Маниловым своего эмоционального состояния «считывается» Чичиковым, общий ход РА (изложение Чичиковым своего дела о покупке «мертвых душ») нарушается. В 3-м случае жест (тыкнул пальцем) полностью заменяет сообщение средствами естественного звукового языка и совершенно адекватно интерпретируется участни­ками РА, которым данный НВК адресован. Здесь мы имеем дело с условиями порождения конситуативного типа эллиптической конст­рукции, которая восполняется только при учете экстралингвистиче­ских и паралингвистических компонентов РА. Легко показать, что во всех примерах адекватный смысловой анализ ВК возможен лишь с учетом НВК. Нельзя представить себе не только «лингвистику тек­ста» (с ее исследованиям цельности, связности и семантики общего содержания текста), но и традиционное (в духе Э. Бенвениста) рас­смотрение предложения как «конечной единицы», подлежащей лин­гвистическому рассмотрению, без привлечения анализа взаимоот­ношений между ВК и НВК в РА. Если вполне можно допустить соб­ственно паралингвистические исследования (например, описание типов НВК вне связи их с ВК), то уже взаимоотношения НВК с ВК в РА в компетенции даже «чистой» лингвистики.

Актуальна задача рассмотрения и онтологического аспекта НВК, относительно которого есть пока лишь гипотетические, прав­доподобные, впрочем, суждения: «Паралингвистическая сущность определенных средств коммуникации связана с развитием ранее не­членораздельных форм общения в животном мире [Колшанский 1974: 78]. Следует указать и на имеющиеся противоречия в оценке паралингвистических и лингвистических (в ранее отмеченном раз­личении) объектов. Например, утверждая, что «язык функционирует в качестве полноценной коммуникативной системы, возникшей и развивающейся как средство, структурно не зависимое от других форм общения», Г.В. Колшанский одновременно признает, что «абстрагирующий характер языка... не устранил тех примитивных форм (биологических) общения, которые были свойственны пред­кам. Вот почему паралингвистические свойства языка человека в принципе составляют неотъемлемую часть коммуникации. Ни один логический язык не может быть подобием естественного языка не только в плане очищения от возможной многозначности употребле­ния его форм, но и в плане отрыва его от всех присущих ему антро­пологических паралингвистических форм, сопровождающих речевой акт [Там же: 77]. Как видим, констатация полноценности языковой системы и ее структурной независимости сосуществует вместе с признанием неотъемлемости паралингвистических средств от собст­венно лингвистических. Откуда же «неотъемлемость?». Какие осно­вания считать паралингвистические средства РА факультативными и лишь «сопровождающими» ВК? Наши данные [Горелов 1977в: 197-199] свидетельствуют о том, что: а) НВК являются не факультатив­ной, а обязательной частью РА; б) НВК, опережающих реализацию ВК, - около 60%; в) НВК, реализующихся одновременно с ВК, -37%; г) НВК, отстающих от ВК, - 3%.

Предварительные эксперименты с применением киносъемок дают основание считать, что в принципе НВК, отстающих от ВК, нет вообще, а НВК «сопровождения» реально манифестируются в своей начальной форме прежде, чем развертывается ВК. Поэтому мы и решились сформулировать следующее положение: «Невербальная внутренняя программа различных модальностей эксплицируется так, что вербальные средства выражения мысли замещают всякие иные средства коммуникации только в том случае, если последние оказы­ваются недостаточными, малоэффективными, менее экономными или просто непригодными для выражения, для достижения комму­никативных целей» [Там же: 177].

Таким образом, предлагается по-новому (сравнительно с тради­ционным подходом) рассматривать проблему экономии языковых средств в РА, иначе, чем это было раньше, решать вопрос о причи­нах возникновения эллипсов и всякого рода иных деформаций в ВК.

Хотя выше мы уже показали НВК в составе РА, чтобы ответить на принципиальный вопрос о причастности объектов паралингвис­тики к целям лингвистических исследований, логично начинать рас­смотрение НВК с того момента, когда начинается процесс порожде­ния высказывания.

В ряде уже указанных выше наших работ мы достаточно под­робно освещали проблему внутреннего программирования будущего высказывания. Назовем еще одну нашу работу, специально посвя­щенную обзору исследований по вопросу «глубинных структур» [Горелов 1977а], чтобы в дальнейшем не повторять уже высказан­ное.

Напомним в самых общих чертах положение советской психо­лингвистики, восходящее к тезису Л.С. Выготского о том, что выра­жение мысли есть процесс перехода «от мысли к слову», т. е. текст высказывания есть результат вербализации некоторого содержания, сформированного в коде, отличном от языкового (звукового и на­ционально-языкового), либо еще до начала высказывания, либо - в некоторых частях - по ходу вербализации. Эта проблема хорошо известна по работам Н.И. Жинкина (он экспериментально показал, что содержание будущего высказывания конструируется в УПК - в универсально-предметном коде), А.А. Леонтьева, Т.В. Ахутиной, И.А. Зимней и многих других советских и зарубежных исследовате­лей внутренней речи.

Невозможно свести УПК, т.е. код, в котором осуществляется наше мышление, к нейроследам в памяти представлений, своеобраз­ным эквивалентам отраженных в сознании и подсознании элементов объективной реальности, которые были представлены в ощущениях и восприятиях. В знаке языка, который в своем большинстве являет­ся сугубо условным (хотя можно допустить, что в доисторическом языке господствовали звукоподражания и жестово-звуковые имита­ции), «отражено» также и межзнаковое отношение, и понятийные уровни разной степени абстракции. Такого рода знаки не могут иметь аналогов в предметном эквиваленте нейрофизиологического кода. Очевидно, эквиваленты представлений, соответствующие ре­ферентам класса вещей, качеству и наглядно представляемым дейст­виям, являются фундаментальными и одновременно элементарными единицами УПК. На более высоком уровне этого кода, организован­ного иерархически, располагаются «следы-схемы», объединяющие элементарные эквиваленты представлений в родовые (а еще раньше - в видовые) образования, которым соответствуют языковые и видо­вые обозначения. Бесчисленные и разнообразные связи между кодо­выми единицами и уровнями образуют системы семантических по­лей, парадигматических и синтагматических группировок.

Отсутствие надежных (не только в деталях, но и в ряде принци­пиальных, сущностных характеристик) нейрофизиологических дан­ных не позволяет пока уверенно судить о механизмах «кодовых пе­реходов», о которых писал Н.И. Жинкин [1964] и которые необхо­димо иметь в виду, когда предпринимается попытка описать вер­бальное и невербальное на стадии, предшествующей РА, т.е. на ста­дии формирования «глубинных структур».

То обстоятельство, что одно и то же содержание может быть выражено разными синтаксическими структурами «на поверхности», причем структурами любого языка, свидетельствует о том, что смысл будущего высказывания на уровне «глубинных структур» имеет свои собственные и единицы, и правила синтаксирования.

В одном из опытов мы показывали, как носители разных (неродственных языков) ставились экспериментатором в условия необходимости передачи одной и той же информации средствами «жестового языка», так как не знали, будучи разделенными на спе­циальные пары партнеров по коммуникации, языка друг друга ни в малейшей мере [Горелов 1977г: 297].

Опыт показал некоторые универсальные характеристики невер­бального, «глубинного» синтаксиса, среди которых: 1) отсутствие обозначения тематического подлежащего (субъекта); 2) постпозиция определения к любому существительному; 3) контактное располо­жение обозначения действия, прямого дополнения или обстоятельства - вне зависимости (как и в п.1 и 2) от норм, регулирующих «поверхностную» синтагматику.

Возможно, что в «глубинном синтаксисе» предложные сочета­ния могут быть представлены в последовательности типа послелога в тюркских языках: многие испытуемые прибегали к такого рода обозначениям.

Всевозможные нарушения норм «поверхностного» синтаксиро­вания объясняются нами рядом причин: а) конфликтом между этими нормами и «глубинным синтаксисом»; б) хезитациями говорящего участника РА в связи с затруднениями в выборе конструкции или слова; в) нарушениями соответствующих связей между готовым за­мыслом и еще формируемым высказыванием: по ходу высказывания на первое место выходят единицы, соответствующие готовым уже частям содержания, а дальнейшая последовательность языковых знаков зависит от того, готовы ли соответствующие «блоки содер­жания» и адекватные части вербального; г) «парадигматическая и синтагматическая организация речевого процесса обеспечивается различными мозговыми системами» [Лурия 1975: 15].

Результаты взаимодействия вербального и невербального в РА яснее всего выявляются, конечно, в тексте устного сообщения или в его литературно-художественной модели. Рассмотрим конкретные возможности НВК выступать в роли различных частей предложений.

A. НВКв качестве сказуемого: « - Мне тайга не самый страх... Ну не скажи-и... Тайга - она ууу».

«— Ну что, не цепляетесь? - спросил он мастера. Тот покачал головой: мол нет». Б. НВКв качестве прямого дополнения:

«- Во дворе Николай поднялся к лабазам, кивнул на пудовый шмок:

- Отопри!»

B. НВКв качестве косвенного дополнения:

«- Для кого это ты? Яков подмигнул и посмотрел на сестру». [Ежов и др. 1976].

Г. НВКв качестве обстоятельства образа действия:

«- Хорошо поет? - спросил Алексей Соломина.

Тот кивнул».

Д. НВКв качестве обстоятельства места:

«Поп посмотрел на Ерофея и, подмигнув, склонил голову напра­во, как бы спрашивая - там?

Ерофей, тоже молча, утвердительно склонил голову» [Абрамов 1974].

Е. НВКв качестве обстоятельства времени:

«- Когда же дед?... Дед... посмотрел в окно, как бы говоря: утром».

Ж. НВКв качестве обстоятельства причины и следствия:

«- Из-за нее, что ли? - Гена кивнул в ее сторону».

3. НВКв качестве подлежащего:

«— Это ты меня нашла? - Она улыбнулась и отрицательно по­качала головой» [Козлов 1962).

И. НВКв качестве подлежащего и сказуемого.

Примеров для данного случая слишком много, чтобы приводить еще один. По этому поводу Ю.М. Скребнев пишет: «Отсутствие обоих главных членов предложения представляет собой широко распространенную синтаксическую черту разговорного подъязыка, использующего в законченных коммуникативных сегментах потен­циальные второстепенные члены предложения» [1971: 3]. Определе­ние «потенциальные» здесь весьма примечательно: так как в пред­ложении как в таковом, т. е. в вербальной части высказывания, нет вербально выраженных главных членов, Ю.М. Скребнев логично определяет оставшиеся «коммуникативные сегменты» как «потенци­ально второстепенные».

Невербальные компоненты, таким образом, представляют в на­шем рассмотрении информативные образования различной природы и функций.

Ввиду того, что любой речевой акт осуществляется в данной схеме (не претендующей, впрочем, на полноту), невербальный ком­понент предлагается квалифицировать в качестве коммуникативной универсалии. В любом коммуникативном (с использованием естест­венного языка) акте невербальное и вербальное соотносятся друг с другом в соответствии с принципом дополнительности.