Языковая систематика
Языкова́я система́тика — вспомогательная дисциплина, помогающая упорядочивать изучаемые лингвистикой объекты — языки, диалекты и группы языков. Результат такого упорядочивания также называется систематикой языков.
В основе систематики языков лежит генетическая классификация языков: эволюционно-генетическая группировка является естественной, а не искусственной, она достаточно объективна и устойчива (в отличие от зачастую быстро меняющейся ареальной принадлежности). Целью языковой систематики является создание единой стройной системы языков мира на основе выделения системы лингвистических таксономических уровней и соответствующих названий, выстроенных по определённым правилам (лингвистическая номенклатура). Термины «систематика» и «таксономия» часто используют как синонимы.
Принципы устройства
Для языковой систематики характерны следующие принципы:
- Единая иерархически организованная система.
- Единая система таксономических уровней (рангов).
- Единая система номинации.
Единство всей системы и сравнимость единиц одного уровня должны обеспечиваться общими критериями для отнесения объектов к тому или иному уровню. Это касается как верхних уровней (семьи и группы), так и нижних (языки и диалекты). В единой систематике критерии для отнесения объектов к одному уровню должны отвечать следующим требованиям: применимость к любому объекту и непротиворечивость (или однозначность) отнесения объекта к определённому классу.
Единая система таксономических уровней (рангов). Стройной системе таксонов и рангов в биологии лингвисты могут только позавидовать. Хотя и в лингвистике существует немало терминов для разных таксономических уровней (семья, группа, ветвь, иногда фила, филум, сток), но их использование очень сильно варьирует от автора, языка описания и конкретной ситуации. В рамках систематики эти таксономические уровни упорядочиваются и употребляются согласно определённым правилам.
Единая система номинации. В отличие от биологии, где существует стройная система номинации на латинском языке с использованием бинарного названия для базовой единицы, в лингвистике ничего подобного нет и едва ли может возникнуть. Поэтому, главное, что может сделать систематика — это, во-первых, упорядочить названия языков в языке описания, выбрав для каждого идиома и группы идиомов основное название; во-вторых, в качестве дополнительного средства для однозначного обозначения языков независимо от языка описания — указывать для каждого его самоназвание.
Использование данных лексикостатистики. Для определения уровня таксонов в существующей классификации (или для построения классификации, там где её ещё нет) и отнесения объекта к определённому уровню используется критерий сохранения базовой лексики; причём не только для построения верхних уровней классификации (что тривиально), но и для разграничения отдельных идиомов. Процент совпадений считается от стандартного 100-словного списка Сводеша. Акцент намеренно делается на проценте совпадений (хотя время распада может приводиться для справки), поскольку в этом вопросе среди компаративистов не наблюдается единодушия, а для построения систематики языков вполне достаточно относительного процента совпадений, а не абсолютного времени распада.
Верхние уровни систематики
Основными верхними таксономическими уровнями систематики являются: семья, ветвь, группа. При необходимости число уровней может увеличиваться за счёт прибавления приставок над- и под-; например: подсемья, надгруппа. Окказионально может также использоваться термин зона, часто для обозначения не генетических, а скорее ареальных или парафилетических группировок, см. например, классификацию языков банту или австронезийских языков.
Семья — базовый уровень, на котором основывается вся систематика. Семья — это группа определённо, но достаточно далеко родственных языков, которые имеют не меньше 15 процентов совпадений в базовом списке (стословный вариант списка Сводеша). В качестве примеров см. список семей Евразии или обзор семей Африки.
Для каждой семьи список ветвей, групп и т. д. определяется с учётом традиционно выделяемых группировок, степенью близости их между собой и временем распада на составляющие. При этом ветви и группы разных семей не обязаны быть одного уровня глубины, важен лишь их относительный порядок внутри одной семьи.
Например, для индоевропейской семьи можно выделить следующий набор ветвей: анатолийская, тохарская, кельтская, балто-славянская, индоиранская, германская, италийско-романская, греко-македонская, армянская, албанская и ряд древних языков, условно объединяемых в палеобалканскую зону.
В таблице приведены примеры построения систематики со строгим использованием таксономических уровней. Если для индоевропейских языков некоторые уровни можно пропустить, то для известных своей разветвлённостью австронезийских их даже не хватает.
Уровень | Язык 1 | Язык 2 |
---|---|---|
макросемья, фила | — | — |
семья | индоевропейская | австронезийская |
подсемья | «европейская» | малайско-полинезийская |
надветвь | Центрально-восточно-малайско-полинезийская | |
зона | восточно-малайско-полинезийская | |
подзона | океанийская | |
ветвь | балто-славянская | центрально-восточно-океанийская |
подветвь | центрально-тихоокеанская (фиджи-полинезийская) | |
группа | славянская | восточно-фиджийско-полинезийская группа |
подгруппа | восточнославянская | полинезийская |
подподгруппа | ядерно-полинезийская | |
микрогруппа | самоанская | |
язык | русский | токелау |
Язык / диалект
Этот раздел нуждается в переработке. |
Критерии выделения. При формализации таксономических уровней нижних уровней (то есть язык и диалект) добавляются проблемы иного рода, помимо чисто классификационных. Уже само использование критерия структурной близости для выделения отдельных языков и диалектов может встретить немало возражений. Многие лингвисты уже привыкли к тому, что понятия «язык» и «диалект» слишком расплывчаты и их разграничение относится скорее к ведению социолингвистики. Однако для нужд систематики требуется однозначное и универсальное определение языка и диалекта. Для этого критерии для отнесения идиомов к одному или разным языкам должны отвечать тем же требованиям: применимость к любому объекту (универсальность) и непротиворечивость (или однозначность) отнесения объекта к определённому классу. Очевидно, что с помощью социолингвистических критериев однозначно систематизировать все языки не получится (см. подробнее в статье Язык или диалект).
Поэтому, в языковой систематике используется шкала с четырьмя уровнями близости: язык — наречие — диалект — говор, разработанная на эмпирической основе[2].
Согласно этой шкале, если у двух идиомов процент совпадений в 100-словном базовом списке < 89 (что соответствует времени распада, по формуле Сводеша-Старостина, > 1100 лет назад), то идиомы являются разными языками. Если процент совпадений > 97 (время распада < 560 лет), то идиомы являются диалектами одного языка. Для оставшегося же интервала (89-97) предложен промежуточный уровень очень близких языков / отдаленных диалектов, в качестве названия для которого используется термин «наречие» в тех случаях, когда соответствующий идиом традиционно рассматривается как компонент другого языка. Когда же такой идиом принято считать отдельным языком, за ним сохраняется таксономический уровень «язык», а объединение, куда он входит и соответствующее по степени близости единому языку, называется «кластером».
Наглядно употребление уровней нижних уровней проиллюстрировано в таблице. При этом часто бывает так, что один или несколько идиомов в одном кластере принято считать языками, а другие — нет, хотя они находятся на одинаковом уровне взаимопонятности / структурной близости. В качестве примера можно привести вайнахский кластер, включающий чеченский, ингушский языки и аккинско-орстхойское наречие.
уровни |
примеры | |
a) |
б) | |
1 уровень [89-95 % совпадений между составляющими] обычно соответствует либо а) самостоятельному языку (плохо взаимопонятному с другими языками), либо б) группе (кластеру) близкородственных языков. |
||
2 уровень [95-99] соответствует а) наречиям (группам диалектов) или б) отдельным близкородственным языкам (частично взаимопонятным). |
пикардское, валлонское, «литературный французский язык» |
белорусский язык, южнорусское наречие, среднерусские говоры, севернорусское наречие; |
3 уровень [99-100] соответствует отдельным диалектам (с хорошим взаимопониманием). |
||
4 уровень соответствует отдельным говорам (с очень небольшими структурными различиями). |
московский городской, |
Прим.: Подчеркнутые названия раскрываются в следующих строках таблицы.
Указанные уровни в то же время соотносятся со степенью взаимопонятности, что особенно полезно, когда процент совпадений между языками неизвестен.
- Между двумя языками взаимопонятность сильно затруднена и нормальное общение невозможно без специального обучения.
- Внутри языка между двумя наречиями существует взаимопонятность, но не полная; коммуникация возможна, но могут возникнуть недопонимания или ошибки.
- Между диалектами внутри наречия существует практически полная взаимопонятность, хотя носители отмечают особенности каждого диалекта, обычно в произношении (акцент) и употреблении некоторых слов.
Выделение языков и диалектов может не совпадать с традиционным подходом. Например:
- Китайская ветвь включает в себя до 18 языков, традиционно считаемых диалектами китайского языка
- Французский язык (или язык ойль) включает в себя франсийское (на основе диалекта которого сложился французский литературный язык), пикардское, нормандское и другие наречия.
- Сербохорватский кластер включает в себя чакавское, кайкавское и штокавское наречия, а последнее также сербский, хорватский и боснийский литературные языки (= диалекты).
- Западно-огузский кластер состоит из турецкого, гагаузского, южно-крымскотатарского языков.
- Ногайский кластер состоит из ногайского, казахского и каракалпакского языков.
- Иберо-романский кластер включает в себя португальский, галисийский, астуро-леонский, испанский, (верхне-)арагонский языки.
Макроуровни
Несмотря на то, что верхним базовым уровнем в систематике является семья, в ней также учитывается информация и о более глубинном родстве. Но термины для более верхних уровней не поддаются такой строгой формализации, как более нижних.
- Надсемья — объединение близких семей (процент совпадений = 11—14), которые традиционно считаются одной семьёй, но в соответствии с определением семьи в языковой систематике, должно быть вынесено на более верхний уровень. Надсемьёй, видимо, являются кушитские и австронезийские языки.
- Макросемья (= фила) — объединение семей с хоть как-то установленными соответствиями и примерно посчитанными процентами совпадений. Таковы, видимо, афразийская, койсанская макросемья.
- Гиперсемья — объединение макросемей, крайне гипотетичное; например, борейская гиперсемья.
- Гипотеза — предположительное объединение семей, без установления соответствий и подсчёта процента совпадений между отдельными составляющими. Как правило, делается навскидку. Например, нило-сахарская, широко-койсанская гипотеза.
В работах преимущественно западных лингвистов (см., например, [Kaufman 1994: 32; Wurm 1994: 93; Voegelin 1977: 2—3]) употребляются и другие термины:
- Сток (stock) — это объединение семей (families), которые в этом случае понимаются более узко, нежели определено выше. Примерами стоков являются индоевропейский (с германской, романской и другими семьями), уральский, сино-тибетский, австронезийский; таким образом, сток, как правило, соответствует приведённому выше определению семье.
- Филум / фила (phylum, pl. phyla) — это объединение стоков (называемое также надсток — superstock) или семей (если термин сток не используется), причём, как правило, скорее предполагаемое, нежели доказанное. В целом соответствует макросемье.
См. также
- Языки мира
- Генетическая классификация языков
- Таксон
- Язык или диалект
- Различия речи в Москве и Санкт-Петербурге
Примечания
- ↑ Литвинов Н. Н. Стратегический менеджмент на примере Азиатско-Тихоокеанского региона: Монография. — М., 2010. — 200 [10] с. — (Strategic Management in the Asian-Pacific) — ISBN 978-5-91252-029-7.
- ↑ Систематика языков; [Коряков 2006]
Литература
- Коряков Ю. Б., Майсак Т. А. Систематика языков мира и базы данных в интернете // Труды Международного семинара «Диалог '2001» по компьютерной лингвистике и её приложениям. Том 2. М., Аксаково, 2001.
- Систематика языков
Примеры справочников, построенных на основе систематики или аналогично:
- Коряков Ю. Б. Атлас кавказских языков. М., 2006
- Реестр языков мира (в разработке)
- Dalby D. Linguasphere Register of the World’s Languages and Speech Communities. Vol. 1-2. Hebron, 2000
- Gordon R. G., Jr. (ed). Ethnologue.com Ethnologue: Languages of the World. 15th Edition. SIL, 2005
- Kaufmann T. The native languages of Latin America: general remarks // Atlas of the World’s Languages (edited by C. Moseley and R.E.Asher). 1994
- Meso-American Indian languages in Languages of the World // Britannica CD. Version 97. Encyclopaedia Britannica, Inc., 1997.
- Voegelin C.F. & F.M. Classification and Index of the World’s languages. NY., 1977
- Wurm S. Australasia and the Pacific // Atlas of the World’s Languages (edited by C. Moseley and R.E.Asher). 1994