Лемма о разрастании

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Лемма о накачке (лемма о разрастании, лемма-насос; англ. pumping lemma) — важное утверждение теории автоматов, позволяющее во многих случаях проверить, является ли данный язык автоматным. Поскольку все конечные языки являются автоматными, эту проверку имеет смысл делать только для бесконечных языков. Термин «накачка» в названии леммы отражает возможность многократного повторения некоторой подстроки в любой строке подходящей длины любого бесконечного автоматного языка.

Существует также лемма о разрастании для контекстно-свободных языков, ещё более общее утверждение — лемма о разрастании индексных языков.

Формулировка

Для бесконечного автоматного языка [math]\displaystyle{ L }[/math] над алфавитом [math]\displaystyle{ V }[/math] существует такое натуральное число [math]\displaystyle{ n }[/math], что для любого слова [math]\displaystyle{ \alpha \in L }[/math] длины не меньше [math]\displaystyle{ n }[/math] найдутся слова [math]\displaystyle{ u, v, w \in V^* }[/math] такие, что [math]\displaystyle{ \alpha = uvw }[/math], [math]\displaystyle{ |uv|\leqslant n }[/math], [math]\displaystyle{ |v| \geqslant 1 }[/math] и для всякого неотрицательного целого [math]\displaystyle{ i }[/math] цепочка [math]\displaystyle{ uv^iw }[/math] является словом языка [math]\displaystyle{ L }[/math].

Запись в кванторах:

[math]\displaystyle{ (\exists n\in \mathbb{N})(\forall \alpha \in L:|\alpha| \geqslant n)(\exists u,v,w\in V^*):\, [\alpha=uvw \land |uv|\leqslant n \land |v|\geqslant 1 \land (\forall i\in\mathbb{N}\cup\{0\}, uv^iw\in L)] }[/math].

Доказательство

Пусть автоматный язык [math]\displaystyle{ L }[/math] содержит бесконечное число цепочек и предположим, что [math]\displaystyle{ L }[/math] распознаётся детерминированным конечным автоматом [math]\displaystyle{ A }[/math] с [math]\displaystyle{ n }[/math] состояниями. Для проверки заключения леммы выберем произвольную цепочку [math]\displaystyle{ \alpha }[/math] этого языка, которая имеет длину [math]\displaystyle{ n }[/math].

Если конечный автомат [math]\displaystyle{ A }[/math] распознаёт [math]\displaystyle{ L }[/math], то цепочка [math]\displaystyle{ \alpha }[/math] допускается этим автоматом, то есть в автомате [math]\displaystyle{ A }[/math] существует путь длины [math]\displaystyle{ n }[/math] из начального в одно из заключительных состояний, помеченный символами цепочки [math]\displaystyle{ \alpha }[/math]. Путь этот не может быть простым, он должен проходить ровно через [math]\displaystyle{ n+1 }[/math] состояние, в то время как автомат [math]\displaystyle{ A }[/math] имеет [math]\displaystyle{ n }[/math] состояний. Это значит, что этот путь проходит по меньшей мере два раза через одно и то же состояние автомата [math]\displaystyle{ A }[/math], то есть на этом пути есть цикл с повторяющимся состоянием. Пусть это повторяющееся состояние [math]\displaystyle{ q_k }[/math].

Разделим цепочку [math]\displaystyle{ \alpha }[/math] на три части, так что [math]\displaystyle{ \alpha=uvw }[/math], где [math]\displaystyle{ v }[/math] — подцепочка, переводящая [math]\displaystyle{ A }[/math] из состояния [math]\displaystyle{ q_k }[/math] опять в состояние [math]\displaystyle{ q_k }[/math], и [math]\displaystyle{ w }[/math] — подцепочка, переводящая [math]\displaystyle{ A }[/math] из состояния [math]\displaystyle{ q_k }[/math] в заключительное состояние. Заметим, что как [math]\displaystyle{ u }[/math], так и [math]\displaystyle{ w }[/math] могут быть пустыми, но подцепочка [math]\displaystyle{ v }[/math] не может быть пустой. Но тогда очевидно, что автомат [math]\displaystyle{ A }[/math] должен допускать также и цепочку [math]\displaystyle{ uvvw }[/math], поскольку повторяющаяся подцепочка [math]\displaystyle{ v }[/math] снова проходит по циклическому пути из [math]\displaystyle{ q_k }[/math] в [math]\displaystyle{ q_k }[/math], а также и цепочку [math]\displaystyle{ uvvvw }[/math], и любую вида [math]\displaystyle{ uvv...vw }[/math].

Это рассуждение и составляет доказательство леммы о накачке.

Обратная формулировка

Другая форма этой леммы, которую иногда удобнее применять, чтобы доказать неавтоматность некоторого языка, для языка [math]\displaystyle{ L }[/math] над алфавитом [math]\displaystyle{ V }[/math] состоит в следующем — если имеет место:

[math]\displaystyle{ (\forall n\in\mathbb{N})(\exists \alpha\in L \colon |\alpha|\geqslant n) (\forall u,v,w\in V^* \colon \alpha=uvw \land |v|\geqslant 1 \ \land |uv| \leqslant n) (\exists i\in\mathbb{N}\cup\{0\}) uv^iw\not\in L }[/math]

то язык [math]\displaystyle{ L }[/math] — неавтоматный.

Для доказательства неавтоматности языка можно также пользоваться тем фактом, что пересечение регулярных языков регулярно. Так, непосредственно применить лемму о накачке к языку правильных скобочных структур в алфавите [math]\displaystyle{ \{ (, ) \} }[/math] проблематично, но пересечение его с языком [math]\displaystyle{ (^*)^* }[/math] даёт язык [math]\displaystyle{ (^n)^n }[/math], неавтоматность которого тривиально следует из леммы о накачке.

Литература

Ссылки