Язык Дика

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Языком Дика (англ. Dyck language) над 2n буквами называется контекстно-свободный язык, который состоит из сбалансированных наборов скобок n разных видов. Формально это язык над алфавитом {a1,b1,a2,b2,…an,bn}, порождаемый грамматикой S → ε, S → a1Sb1S, . . . , S → anSbnS.

При любом положительном целом n грамматика является однозначной. Словами этого языка являются последовательности правильно вложенных скобок n типов.

Язык назван в честь немецкого алгебраиста Вальтера фон Дика.

Ограниченный язык Дика

Ограниченный язык Дика над алфавитом B=U[math]\displaystyle{ \cup }[/math]U` есть множество тех слов (цепочек) в алфавите B, которые переводятся в ε последовательным вычеркиванием пар аа`,bb`,… Но не пар a`a, b`b.

Пример порождения языка Дика может быть представлен следующей грамматикой:

S→SS

S→aSa`,bSb`,…

S→aa`,bb`,…

Вывод для цепочки abbaa`b`cc`bb`b`a`


Простые цепочки по Дику

так же возможны и другие выводы данной цепочки

Простые цепочки по Дику

(Д-простые цепочки)

Цепочка d[math]\displaystyle{ \in }[/math]D* называется Простой цепочкой по Дику если никакое непустое начало цепочки d отличное от самой d, не принадлежит D*. Заменяя слово «начало» на слово «конец», получаем эквивалентное определение.

g=xf1…fm[math]\displaystyle{ \overline {x} }[/math],

где fi[math]\displaystyle{ \in }[/math]Dxi, xi[math]\displaystyle{ \ne }[/math][math]\displaystyle{ \overline {x} }[/math], i=1,…,m.

Пример

Д-простая цепочка: a`baa`bb`b`a

Рассмотрим данную цепочку с первого элемента цепочки — a`. Парой для него будет последний элемент цепочки — a. Критерием для пары является отсутствие идентичности элементов между собой. Эти элементы являются спаренными и обозначается: a[math]\displaystyle{ \ne }[/math][math]\displaystyle{ \overline {a} }[/math]`

Dx это множество всех Д-простых цепочек, которые начинаются элементом x и оканчиваются элементом [math]\displaystyle{ \overline {x} }[/math].

Построение однозначной КС-грамматики, порождающей язык Дика

Заданный алфавит

{a, a`,b, b`}

Нетерминальные символы

{Da, Da`, Db, Db`, A} [math]\displaystyle{ \in }[/math] некоторому языку, который состоит из конкатенаций любых цепочек [math]\displaystyle{ \in }[/math] Da[math]\displaystyle{ \cup }[/math]Da`[math]\displaystyle{ \cup }[/math]Db[math]\displaystyle{ \cup }[/math] Db`

E — пустая цепочка.

Da содержит, помимо цепочки aa`, все цепочки, имеющие вид

af1…fma`

где fi[math]\displaystyle{ \in }[/math]Dxi, xi[math]\displaystyle{ \ne }[/math][math]\displaystyle{ \overline {a} }[/math]

(1) Da,=aAa`=aa`

(2) A=(Da`+Db+ Db`)(A+E)

Языку Дика D соответствует уравнение:

(3) D*=(Da+Da`+Db+ Db`)

Уравнения типов (1) и (2) вместе с уравнением (3) задают некоторую однозначную грамматику.

Примечание:

Эта грамматика однозначна, так как она порождает слева направо Д-простые сомножители цепочки [math]\displaystyle{ \in }[/math] D*.

Однозначная грамматика, порождающая ограниченный язык Дика

Для построения данной грамматики мы исключаем множества Da`, Db` и т. д.

Цепочки начинающиеся штрихованными элементами, не рассматриваются.

Da=aUa`+aa`

Db=bUb`+bb`

U=(Da+Db)(U+E)

D*r=(Da+Db)D*r+E

Литература

  • Пентус А. Е., Пентус М. Р. Теория формальных языков: Учебное пособие. — М.: Изд-во ЦПИ при механико-математическом ф-те МГУ, 2004. — 80 с.
  • Гросс М., Лантен А. Теория формальных грамматик. — М.: Мир, 1971. — С. 232-239. — 294 с.