- Lektsia - бесплатные рефераты, доклады, курсовые работы, контрольные и дипломы для студентов - https://lektsia.info -

Количественная и качественная оценка корпуса русских агнонимов



Полученный лексический массив нуждается в опреде­ленной количественной и качественной оценке.

А. Количественная оценка

На первый взгляд вопрос о количественной оценке ка­жется лишним. Действительно, если нам известно, что из­влеченная из MAC совокупность слов включает в себя 8813 единицы, разве эта цифра не является исчерпывающей ко­личественной характеристикой массива русских агнонимов? Оказывается, нет. Дело в том, что последовательное рас­смотрение массива именно в антропоцентрическом ракурсе заставляет, с одной стороны, учитывать указанные выше следствия из щербовского положения о двух режимах использования человеком языка, а с дру­гой, не упускать из виду и то обстоятельство, что полу­ченный массив рассматривается как бы глазами среднего носителя русского языка. Последний же, как убедительно и остроумно доказал Л.В.Щерба своим примером с бокром и бокренком, обладает огромными по объему практически­ми знаниями о родном языке, в том числе и о тех его фрагментах (например, агнонимах), которые он не в со­стоянии использовать в речевой деятельности. В состав этого знания входит, в частности, информация практически о всех правилах грамматики и словообразования, о значе­ниях всех морфологических и словообразовательных средств и т.д. Отмеченное обстоятельство заставляет рас­сматривать полученный массив всего лишь как основу для получения приближенных к реальности сведений о дейст­вительном объеме знаемого и незнаемого в пределах того, что в МАС называется общеупотребительной лексикой современного русского литературного языка. При этом в количественном отношении обсуждаемый массив можно охарактеризовать как одновременно и избыточный, и не­достаточный. Его избыточность с указанной точки зрения прямо вытекает из отмеченного факта практического владения всей грамматической и всей словообразовательной сис­темой родного языка. Если так, то объем незнаемого в ас­пекте рецептивного владения языком определяется количе­ством незнакомых непроизводных основ (корней), которое заведомо меньше полученного количества слов. Недоста­точность же рассматриваемого массива определяется тем, что MAC далеко не всегда приводит все лексические еди­ницы, входящие в представленные в нем словообразова­тельные гнезда: часть гнезд отражается в словаре только частично Между тем, поскольку среди русских словообра­зовательных средств имеет место, как известно, не только одноосновная (ср., уснуть и заснуть), но и разноосновная (ср., антициклон, но противоток) синонимия, при произ­водстве речи носитель языка нуждается во всех без исклю­чения словах с тем или иным агнонимическим корнем. Та­ким образом, поскольку сам по себе извлеченный из MAC агнонимический массив не содержит в явном виде всех сведений об искомых количественных характеристиках, для их получения необходимо предложить какие-то особые процедуры. Таких процедур две.

Первая — ее можно назвать словообразовательной конденсацией — состоит в сведении всех имеющихся в исходном списке однокоренных слов в словообразователь­ные гнезда. Ведь, если для понимания слова достаточно, обычно, знания его корня, то, по изложенным выше причи­нам, рецептивное овладение всем обсуждаемым массивом предполагает, по сути дела, усвоение хотя бы одного из членов каждого гнезда. Иначе говоря, количественная оцен­ка агнонимического массива с точки зрения обеспечения рецептивной речевой деятельности должна сводиться к установлению числа словообразовательных гнезд, по кото­рым распределяются извлеченные из MAC слова. В качест­ве регулирующего источника здесь может использоваться известный «Словообразовательный словарь русского языка» А.Н.Тихонова. Выбор этого словаря объясняется тем, что он представляет собой единственное лексикогра­фическое произведение данного жанра, словник которого полностью включает в себя словник Малого академического словаря. В результате применения процедуры словообразо­вательной конденсации искомое число, характеризующее мощность агнонимического массива в рассматриваемом аспекте, оказалось равным 6080 единицам (коэффициент сжатия — 0,69).

Вторая процедура — мы называем ее словообразова­тельным развертыванием — заключается в дополнении исходного списка теми словами, которые входят в получен­ные на нем словообразовательные гнезда, но по тем или иным причинам не включены в MAC. Источником здесь в дополнение к уже упомянутому «Словообразовательному словарю» А.Н.Тихонова служил «Толковый отоварь рус­ского языка» С.И.Ожегова, в котором помимо 42500 заголовочных слов рассматривается еще около 30000 про­изводных лексических единиц в гнездах, завершающих сло­варные статьи. Процедура словообразовательного разверты­вания позволила установить число, характеризующее мощ­ность агнонимического массива с точки зрения обеспечения продуктивных видов речевой деятельности. Это число — 11986 лексических единиц (коэффициент расширения 1,36).

Все сказанное о процедурах количественной оценки полученного перечня агнонимов можно проиллюстрировать следующей таблицей, демонстрирующей содержание и ре­зультаты словообразовательной конденсации и словообра­зовательного развертывания на материале агнонимов, начи­нающихся на букву <<Б». (Необходимые пояснения: в пер­вой графе дается номер словообразовательного гнезда; во второй графе приводятся слова, составляющие соответст­вующее гнездо; в третьей графе содержатся сведения о мощности гнезда, т.е. о количестве слов, составляющих гнездо в русском языке; в четвертой графе указывается, сколько слов гнезда представлено в MAC; подчеркнуты слова, имеющиеся в MAC, а без подчеркивания приводятся слова, отсутствующие в MAC; арабская цифра после сло­ва — это номер значения соответствующего слова в MAC; обозначение 0// это указание на то, что речь идет об оттенке однозначного слова).

 

№п/п   Агнонимическое гнездо   Мощ­ность гнез­да   Представленность в MAC  
       
1. 2.     3. 4.   бабашка баббит баббитный баббитовый бабка 3 бабка 4                

Б. Качественная оценка

Качественную оценку полученного массива агнонимов можно осуществлять с опорой на разные основания. Среди последних важнейшими, как нам представляется, являются два, а именно, степень агнонимичности включенных в мас­сив лексических единиц и распределение этих единиц в понятийном пространстве, покрываемом лексикой русского языка.

Агнонимичность как качество языковой единицы, опре­деляющая меру ее незнания носителем языка, примени­тельно к каждому конкретному слову выражается в разной степени. Это вытекает уже из того, что агнонимы отбира­лись на основе не одного, а ряда критериев, причем таких, которые обладают разной разрешающей силой. Например, кажется очевидным, что слово ендова в значении 'старинная русская посуда для вина' и это же слово в значении 'пространство между двумя скатами крыши' характеризуют­ся разной степенью агнонимичности: в первом случае мы имеем дело с частичным незнанием (слово включено в мас­сив на основе пятого критерия), а во втором — с практиче­ски полным незнанием (слово включено в массив на основе первого критерия). Возникает вопрос, как можно охаракте­ризовать состав рассматриваемого лексического массива, учитывая меру знания (незнания) входящих в него слов? Это можно сделать разными способами, среди которых вполне представимы и весьма тонкие, позволяющие уста­навливать в МЛК носителя языка наличие или отсутствие информем, соотносящихся с любой наперед заданной семой из состава лексического значения агнонима. Такого рода способы ввиду громоздкости их процедурной составляющей могут применяться в работах, посвященных установлению степени агнонимичности небольших групп слов. В нашем же случае представляется достаточным использовать для получения искомых данных те же критерии, с учетом которых производилось формирование базового списка. При этом мы исходим из того, что, устранив неопределенность относительно количества совершенно незнакомых слов и слов незнакомых в той или мере, мы тем самым получим хорошее представление о степени агнонимичности массива в целом и каждого его элемента в отдельности. Проведенное обследование исходного перечня агнонимов под указанным углом зрения позволило получить следующую картину. В обсуждаемом лексическом массиве слов, оцениваемых как совершенно незнакомые (высшая степень агнонимичности) — 4795 единиц; слов, знание которых ограничено отнесением именуемого факта к определенной широкой сфере действительности — 1234 единиц; слов, называющих предметы, относительно которых известно только то, что они входят в определенные классы предметов, — 1287 единиц; слов, обозначающих известный в общих чертах предмет, относительно функциональных свойств которого, однако, сохраняется неясность – 532 единиц; слов, обозначающих известный в общих чертах предмет, относительно внешнего вида которого сохраняется неясность, — 661 единиц; известных исследователю в связи с особенностями его жизненного опыта и специальности слов, которые, как он предполагает, незнакомы лицам с другим жизненным опытом и другой специальностью, - 304 единиц. Все сказанное здесь можно проиллюстрировать на материале слов, начинающихся с буквы Ч(числовой индекс напротив каждого агнонима указывает, в соответствии с каким из обозначенных выше критериев данная лексическая единица была отнесена к агнонимам).

 

Агнонимы   Краткое толкование № критерия
чапельник чеботарить чепан червоводня червь2 черноризец сковородник сапожничать старинная крестьянская верхняя одежда помещение для выкармливания гусениц шелкопряда устарелое название буквы «ч» монах

 

Другой аспект качественной опенки полученного агнонимического массива состоит в установлении его содержа­тельного разнообразия.

Даже беглого взгляда на обсуждаемый массив доста­точно, чтобы убедиться, с одной стороны, в его исключи­тельной смысловой пестроте, а с другой, в очевидной неравномерности распределения интересующих нас лексико-семантических единиц по разным лексико-семантическим и тематическим группам. В связи с этим весьма интересным представляется вопрос о локализации агнонимов в понятийном пространстве, покрываемом лексикой русского языка, и установлении, таким образом, зон повы­шенной агнонимической активности. Обнаружение и ана­лиз таких зон позволит, как нам представляется, сделать выводы о закономерностях и аномалиях движения лексики в пределах лексикона русской языковой личности, о факто­рах (естественно-языковых, социальных, идеологических и т.п.), определяющих это движение. Один из возможных путей, ведущих к решению поставленной задачи, состоит в идеографической классификации отобранного массива агнонимов <..>.

Основная проблема, с которой сталкивается создатель идеографического словаря тезаурусного типа, состоит в построении генеральной синоптической схемы, отражающей содержание и структуру понятийного пространства, покры­ваемого соответствующим лексическим массивом. Было предложено два основных пути, ведущих к решению этой проблемы. Первый путь предполагает построение синопсиса исключительно на индуктивной основе. Предложенная Ю.Н.Карауловым версия индуктивного подхода предусматривает поэтапную работу с языковым материалом (декомпозиционный, агрегационный и ассоциативно-компонентный этапы), в результате ко­торой, по предположению автора, можно прийти к орга­ничному членению всего словаря в соответствии с его сис­темными свойствами и получить искомую синоптическую схему идеографической классификации. Практическое идеографирование, осуществленное на основе этой методи­ки, позволило Ю.Н.Караулову прийти к выводу о невоз­можности «перехода от языковой модели мира» на более высокий уровень обобщения — к «концептуальной модели мира» на основе чисто лингвистических приемов. Иными словами, указанный метод, будучи вполне прием­лемым для смысловой группировки слов, не приводит, од­нако, к построению целостной, логически связанной карти­ны мира.

Второй подход к построению идеографического слова­ря — индуктивно-дедуктивный. В содержательном отношении этот подход предполагает последовательное осуществление двух взаимодополняющих операций дедуктивного разбиения понятийного континуума, покрываемого лексикой языка, и индуктивного «восхождения» от отдельных слов к выде­ленным дедуктивным методом рубрикам Кроме того, рассматриваемая методика предусматривает специальную про­цедуру стыковки, притирки результатов упомянутых опера­ций, в результате чего раскрывающие содержание каждой понятийной области младшие понятия выделяются как на логико-философской, так и на вполне эмпирической основе. Сильную сторону индуктивно-дедуктивною подхода мы усматриваем в том, что он позволяет не только произвести идеографирование всех без исключения лексико-семантических единиц любого наперед заданного массива слов, но и создать хорошо структурированный и психологически приемлемый синопсис понятий, которые отражаются клас­сифицируемыми языковыми единицами.

Подобный синопсис может рассматриваться как поня­тийная схема, образующая своеобразную несущую конст­рукцию той концептуально-языковой картины мира, кото­рая закодирована в русской лексике. Хорошее представле­ние о подобного рода несущей понятийной конструкции дает синопсис первого на русском языковом материале идеографического словаря тезаурусного типа, включенного в качестве самостоятельной части в комплексный учебный словарь «Лексическая основа русского языка» (далее ЛОРЯ).

Сказанное дает нам основание избрать в качестве ори­ентира при исследовании семантического разнообразия русских агнонимов именно Синопсис идеографической классификации, на основе которого организована Идеогра­фическая часть «Лексической основы». Он представляет собой упорядоченный перечень понятийных рубрик, отражающих (с разной степенью детализации) смысловое разнообразие русской лексики. В нем выделяют­ся 29 именованных понятийных классов, 254 именованных понятийных разряда и 649 нумерованных групп

Как проводилась классификация? На базе предлагаемо­го в MAC толкования агнонимической лексико-семантической единицы устанавливалась ее семная структура с выделением опорной и квалифицирующих сем. Наиболь­шей информативностью характеризуются описательные толкования, особенно построенные по родо-видовому прин­ципу, т.е. такие, в которых указывается ближайшее родовое понятие и видовые отличия денотата. Вполне понятно, что подобные толкования существенно облегчают задачу клас­сификации слов. Иначе обстоит дело с толкованиями, в которых в качестве семантизирующего средства использу­ются синонимы толкуемой единицы, например, перелеска — 'то, же, что печеночница'. Для того, чтобы оценить и классифицировать такую единицу, необходимо привести ее толкование к виду, удобному для классификации, т.е. за­менить синонимическое толкование описательным, напри­мер, перелеска — 'рано цветущее вечнозеленое растение семейства лютиковых с кожистыми листьями и крупными зимующими синевато-фиолетовыми или белыми цветками'. Такого рода преобразования составляют весьма важный и ответственный этап подготовки языкового материала к смысловой классификации.

В полном виде процедура смысловой классификации агнонимов включала в себя: а)оценку толкования лексико-семантической единицы с целью установления его пригод­ности для использования в качестве основы классифика­ции; б) приведение нестандартных толкований к виду, удобному для классификации; в) выделение на основе тол­кования опорной и квалифицирующих сем; г) отнесение лексико-семантической единицы к определенной рубрике Синопсиса идеографической классификации ЛОРЯ.

Общее представление о распределении агнонимов по основным понятийным классам дает следующая таблица.

        Наименование классов   Коли­чество агно­нимов
1.0.   Абстрактные отношения и формы существования материи­  
1.1.   Существование, бытие    
1.2.   Пространство    
1.3.   Форма    
1.4.   Время    
1.5.   Изменение    
1.6.   Движение    
1.7.   Количество    
1.8.   Качество    
1.9.   Отношение    
1.10.   Порядок    
1.11.   Причинность    
2.0.   Материальный мир    
2.1.   Неорганический мир    
2.2.   Органический мир    
2.2.1.   Органический мир: общие понятия    
2.2.2.   Растительный мир    
2.2.3.   Животный мир (без человека)    
2.3.   Человек    
2.3.1.   Человек как живое существо    
2.3.2.   Человек как разумное существо    
2.3.2.1.   Ощущения и восприятие    
2.3.2.2.   Чувства и эмоции    
2.3.2.3.   Воля    
2.3.2.4.   Интеллектуальные действия и состояния    
2.3.2.5.   Душевный склад человека    
2.3.2.6.   Деятельность человека    
2.3.2.7.   Поведение человека    
2.3.3.   Человеческое общество    
2.3.3.1.   Человек как общественное существо    
2.3.3.2.   Коммуникация мыслей и чувств    
2.3.3.3.   Отношения в обществе    
2.3.3.4.   Трудовая деятельность человека    
2.3.3.5.   Социальная организация общества    

Наиболее наполненными оказались следующие имено­ванные группы.

<…> Прежде всего это касается первой из упомянутых групп, а именно «Религиозные чув­ства». Её чрезвычайная наполненность объясняется особен­ностями конструирования синопсиса ЛОРЯ. Как указыва­ется в вводной статье к словарю ЛОРЯ, «Процедура полу­чения идеографического списка состояла в последователь­ном анализе словника алфавитной части с точки зрения принадлежности каждого ЛСВ к той или иной лексико-семантической группе и получении таким образом связан­ных по смыслу лексических групп. После того, как все лек-сико-семантические единицы исходного списка были рас­пределены по лексико-семантическим группам, последние упорядочивались, нумеровались и каждая из них дополня­лась ассоциируемыми с нею словами, которые отбирались по соображениям учебно-методической целесообразности» [82: 19|. Дело, однако, в том, что упомянутый словник ал­фавитной части, анализ единиц которого позволил авторам создать каркас синопсиса, представлял собой список 2500 самых частых русских слов, полученный особым совмеще­нием и преобразованием данных восьми частотных слова­рей русского языка. В этом списке оказалось только три слова, относящихся к сфере религии: вера, верить и Бог. Такая ситуация объясняется тем, что период отечествен­ной истории, к которому относятся все имеющиеся на сего­дняшний день частотные словари, был, как известно, далеко не самым благоприятным для Русской Православной Церк­ви и ее народа. <…>

Нa втором и третьем местах по наполненности нахо­дятся группы, отражающие степень нашего незнания жи­вотного и растительного мира. Главное объяснение этого факта состоит в том, что словарь, из которого мы извлека­ли агнонимы, охватывает в той или иной мере фауну и флору всей планеты, тогда как лексикон языковой лично­сти всегда ориентирован прежде всего на те их фрагменты, которые соответствуют зоне ее проживания. Кроме того, нельзя не учитывать и неблагоприятного в интересующем нас отношении влияния на человека цивилизации как тако­вой. В ее силовом поле иерархия ценностей существенно меняется: мы все выше ставим знание артефактов и все меньше обращаем внимание на явления и предметы приро­ды.

То, что в отобранном массиве агнонимов будет широко представлена функционально связанная лексика (различные терминологии) можно было, по понятным причинам, пред­видеть, а вот то, что на пятом месте обнаружится группа слов передвижения по воде, оказалось определенной не­ожиданностью. Впрочем, если мы вспомним, что люди от века не могли смириться с наличием разделяющих их про­странств, среди которых особые хлопоты доставляли им водные просторы, и от века они изобретали и строили средства передвижения, позволяющие освоить эти враждеб­ные им просторы, то полученный результат не так уж и удивителен. Недаром ведь одним из первых известных нам средств передвижения был знаменитый Ноев ковчег.

Исчерпывающие данные о характере и результатах идеографирования слов, входящих в рассматриваемый мас­сив, содержатся в классификационной графе перечня агно­нимов, приводимого в качестве Приложения. Числовой показатель в этой графе указывает, к какой рубрике синоп­сиса ЛОРЯ относится соответствующая лексико-семантическая единица. Если такой показатель сопровождается каким-л. надстрочным знаком, это значит, что слово отне­сено к вновь выделенной рубрике.

Печатается по кн. Морковкин В.В., Морковкина А.В. Русские агнонимы: Слова, которые мы не знаем. М., 1997.

 

 

А.Г. Лыков