Дифференциальное исчисление

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Дифференциальное исчисление — раздел математического анализа, в котором изучаются понятия производной и дифференциала и способы их применения к исследованию функций. Формирование дифференциального исчисления связано с именами Исаака Ньютона и Готфрида Лейбница. Именно они чётко сформировали основные положения и указали на взаимообратный характер дифференцирования и интегрирования. Создание дифференциального исчисления (вместе с интегральным) открыло новую эпоху в развитии математики. С этим связаны такие дисциплины как теория рядов, теория дифференциальных уравнений и многие другие. Методы математического анализа нашли применение во всех разделах математики. Очень распространилась область применения математики в естественных науках и технике.

Дифференциальное исчисление базируется на таких важнейших понятиях математики, определение и исследование которых и составляют предмет введения в математического анализа: действительные числа (числовая прямая), функция, граница, непрерывность. Все эти понятия получили современную трактовку в ходе развития и обоснования дифференциального и интегрального исчислений.

Основная идея дифференциального исчисления состоит в изучении функции в малом. Точнее дифференциальное исчисление дает аппарат для исследования функций, поведение которых в достаточно малой окрестности каждой точки близка к поведению линейной функции или многочлена. Таким аппаратом служат центральные понятия дифференциального исчисления: производная и дифференциал.

Дифференциальное исчисление функций одной переменной

Производная

Дифференцирование. Производная первого порядка

График произвольной функции [math]\displaystyle{ y=f(x) }[/math] (синего цвета). Оранжевая линия - это касательная в точке [math]\displaystyle{ x=a }[/math], показывающая наклон в этой точке.

Производная функции [math]\displaystyle{ f(x) }[/math] в точке [math]\displaystyle{ x=a }[/math] это наклон касательной к [math]\displaystyle{ (a,f(a)) }[/math]. Линию касательной можно представить как график функции, описываемый равенством [math]\displaystyle{ y=mx+b }[/math]. Наклон касательной это скорость изменения функции. Скорость изменения функции может быть определена посредством выбора двух точек на графике функции, после чего изменение в значении [math]\displaystyle{ y }[/math] делится на изменение в значении [math]\displaystyle{ x }[/math]. То есть,

[math]\displaystyle{ \text{скорость изменение функции } =\frac{\text{ изменение }y}{\text{изменение }x} }[/math], или

[math]\displaystyle{ \text{скорость изменение функции } =\frac{\text{ приращение аргумента }y}{\text{приращение аргумента }x} }[/math]

Для функции [math]\displaystyle{ y=2x-1 }[/math] скорость изменения функции от [math]\displaystyle{ x=-1 }[/math] до [math]\displaystyle{ x=1 }[/math] равна [math]\displaystyle{ 2 }[/math] (см. на графике Рис.2):

[math]\displaystyle{ \frac{\text{изменение }y}{\text{изменение }x}=\frac{(2*1-1)-(2*(-1)-1)}{1-(-1)}=\frac{1-(-3)}{1-(-1)}=\frac{4}{2}=2 }[/math]

Выражение [math]\displaystyle{ \frac{\text{ изменение }y}{\text{изменение }x} }[/math] имеет краткую запись [math]\displaystyle{ \frac{\Delta y}{\Delta x} }[/math], где [math]\displaystyle{ \Delta }[/math] (дельта) это греческая буква, обозначающая 'приращение аргумента'.

Наклон графика линейной функции является постоянным. Это означает, что скорость изменения функция одинаковая на всем ее протяжении. Однако у многих функций наклон изменяется и соответственно скорость изменения функции также не постоянна. Например у функции [math]\displaystyle{ y=x^2 }[/math] скорость изменения функция изменяется.

График функции [math]\displaystyle{ y=x^2 }[/math] - парабола. Наклон функции непостоянный на ее протяжении. Учитывайте, что масштаб по осям [math]\displaystyle{ x }[/math] и [math]\displaystyle{ y }[/math] неодинаковый.

Для таких функций, их наклон, и следовательно скорость изменения функции, нельзя измерить тем способом который применялся для линейных функций, посредством выбора двух произвольных точек на графике функции.

Наклон кривой графика функции в каждой определенной точке равен наклону касательной к кривой в этой точке. Например, кривая графика [math]\displaystyle{ y=x^2 }[/math] имеет наклон [math]\displaystyle{ 4 }[/math] в точке [math]\displaystyle{ x=2 }[/math] потому что наклон касательной в этой точке равен [math]\displaystyle{ 4 }[/math].

График [math]\displaystyle{ y=x^2 }[/math], с касательной в точке [math]\displaystyle{ (2,4) }[/math]

Функция [math]\displaystyle{ y=x^2 }[/math] имеет разную скорость изменения, поэтому наклон касательной в разных точках графика разный. Так, если в точке [math]\displaystyle{ A (2,4) }[/math], наклон касательной равен [math]\displaystyle{ k=4 }[/math] (См. рисунок), то в точке [math]\displaystyle{ В (1,1) }[/math] наклон касательной равен [math]\displaystyle{ k_2=2 }[/math]. Таким образом в точке [math]\displaystyle{ A (2,4) }[/math] функция изменяется с большей скоростью, чем в точке [math]\displaystyle{ В (1,1) }[/math].

График [math]\displaystyle{ y=x^2 }[/math], с двумя касательными: в точке [math]\displaystyle{ A (2,4) }[/math], со значением наклона [math]\displaystyle{ k=4 }[/math], и в точке [math]\displaystyle{ В (1,1) }[/math] со значением наклона [math]\displaystyle{ k_2=2 }[/math]. У одного и того же графика функции, наклон касательной в разных точках различается.

Производная функции это наклон касательной прямой. Касательную прямую можно представить как секущую прямую, проходящую через две точки графика функции, но при этом, эти две точки бесконечно близки друг другу. Чем ближе точки графика, через которые проходит секущая, друг к другу тем больше эта секущая становится похожей на касательную, и, соотвественно, значение величины наклона секущей стремится к значению величины наклона касательной.

График [math]\displaystyle{ y=x^2 }[/math], с касательной в точке [math]\displaystyle{ A (2,4) }[/math] (черного цвета), и двумя секущими, обозначенными пунктирными линиями. Желтая секущая проходит через точку [math]\displaystyle{ A }[/math] и точку [math]\displaystyle{ C }[/math], зеленая секущая проходит через точку [math]\displaystyle{ A }[/math] и точку [math]\displaystyle{ B }[/math]. Точка [math]\displaystyle{ C }[/math] ближе на графике функции к точке [math]\displaystyle{ А }[/math], чем точка [math]\displaystyle{ B }[/math], поэтому желтая секущая, проходящая через нее, по своему углу наклона ближе к углу наклона касательной. По мере приближения точки, через которую проходит секущая к точке через которую проходит касательная расхождение между этими двумя прямыми становится все меньше.

Рассмотрение секущей линии при анализе касательной необходимо по той причине, что наклон секущей линии можно вычислить непосредственно. Рассмотрим две точки на графике, точку [math]\displaystyle{ (x,f(x)) }[/math], и точку [math]\displaystyle{ (x+\Delta x,f(x+\Delta x)) }[/math], где [math]\displaystyle{ \Delta x }[/math] малая величина. Как писалось выше, наклон линии проходящей через эти две точки может быть вычислен по формуле [math]\displaystyle{ \text{slope } = \frac{\Delta y}{\Delta x} }[/math]. Это дает нам следующее равенство

[math]\displaystyle{ \text{slope} = \frac{f(x+\Delta x)-f(x)}{\Delta x} }[/math]

Так как мы вторую точку, через которую проходит секущая брали максимально близкой к первой точке через которую проходит касательная, для того чтобы наклон секущей был максимально близким к наклону касательной, приращение аргумента - [math]\displaystyle{ \Delta x }[/math] стремится к [math]\displaystyle{ 0 }[/math]. В равенстве это условие записывается следующим образом

[math]\displaystyle{ \lim_{\Delta x \to 0}\frac{f(x+\Delta x)-f(x)}{\Delta x} }[/math]

Это равенство означает, что наклон секущей стремится к определенному значению при стремлении [math]\displaystyle{ \Delta x }[/math] к 0. Значение к которому стремится равенство это производная функции [math]\displaystyle{ f(x) }[/math]; производная имеет запись вида [math]\displaystyle{ f'(x) }[/math]. Если [math]\displaystyle{ y=f(x) }[/math], производная также может быть записана как [math]\displaystyle{ \frac{dy}{dx} }[/math], где [math]\displaystyle{ d }[/math] обозначает бесконечно малое изменение. Например, [math]\displaystyle{ dx }[/math] означает бесконечно малое изменение [math]\displaystyle{ x }[/math].[a] Таким образом, если [math]\displaystyle{ y=f(x) }[/math], то производная [math]\displaystyle{ f(x) }[/math] это

[math]\displaystyle{ \frac{dy}{dx}=f'(x)=\lim_{\Delta x \to 0}\frac{f(x+\Delta x)-f(x)}{\Delta x} }[/math]

при условии что такой предел вообще существует.[b]

Описанное выше дифференцирование - это нахождение производной первого порядка.

Нахождение производной первого порядка для функции [math]\displaystyle{ y=x^2 }[/math], результатом которого будет [math]\displaystyle{ 2x }[/math]:

[math]\displaystyle{ \begin{align} \frac{dy}{dx}&=\lim_{\Delta x \to 0}\frac{f(x+\Delta x)-f(x)}{\Delta x} \\ &= \lim_{\Delta x \to 0}\frac{(x+\Delta x)^2-x^2}{\Delta x} \\ &= \lim_{\Delta x \to 0}\frac{x^2+2x\Delta x+(\Delta x)^2-x^2}{\Delta x} \\ &= \lim_{\Delta x \to 0}\frac{2x\Delta x+(\Delta x)^2}{\Delta x} \\ &= \lim_{\Delta x \to 0}2x+\Delta x \\ \end{align} }[/math]

В этом равенстве, если [math]\displaystyle{ \Delta x }[/math] стремится к [math]\displaystyle{ 0 }[/math], то [math]\displaystyle{ 2x+\Delta x }[/math] стремится к [math]\displaystyle{ 2x }[/math]. Следовательно, [math]\displaystyle{ \frac{dy}{dx}=2x }[/math]. Вывод который был осуществлен в этом равенстве может быть обобщен таким образом: [math]\displaystyle{ \frac{d(ax^n)}{dx}=anx^{n-1} }[/math], где [math]\displaystyle{ a }[/math] и [math]\displaystyle{ n }[/math] - это постоянные, а [math]\displaystyle{ d }[/math] обозначает бесконечно малое изменение. Например согалсно этому правилу, [math]\displaystyle{ \frac{d}{dx}(5x^4)=5(4)x^3=20x^3 }[/math].

Однако, следует понимать, что не все функции могут дифференцироваться также просто как многочлены. Чтобы дифференцировать некторые функции нужно применять другие приемы: дифференцирование сложной функции, правило произведения. Некоторые функции вообще не являются дифференцируемыми (См. Дифференцируемая функция).

Понятие производной

Пусть функция [math]\displaystyle{ g(h) }[/math] определена в окрестности [math]\displaystyle{ h=0 }[/math] и для любого [math]\displaystyle{ \epsilon }[/math] > 0 найдётся такое [math]\displaystyle{ \delta }[/math], что

[math]\displaystyle{ |g(h)/h^n|\lt \epsilon }[/math], лишь только [math]\displaystyle{ |h|\lt \delta, }[/math]

тогда говорят, что [math]\displaystyle{ g(h) }[/math] — бесконечно малое порядка [math]\displaystyle{ o(h^n) }[/math].

Пусть [math]\displaystyle{ f(x) }[/math] — вещественнозначная функция, заданная на отрезке [math]\displaystyle{ (a,b) }[/math]. Эту функцию называют бесконечно дифференцируемой на интервале [math]\displaystyle{ (a,b) }[/math], если

[math]\displaystyle{ f(x+h)=f(x)+f'(x)h+\frac{1}{2!}f''(x)h^2+ \dots \frac{1}{n!}f^{(n)}(x)h^n + o(h^n) }[/math]

для любого [math]\displaystyle{ x\in(a,b) }[/math] и любого [math]\displaystyle{ n }[/math]. Таким образом, локально, в окрестности любой точки отрезка, функция сколь угодно хорошо приближается многочленом. Гладкие на отрезке [math]\displaystyle{ (a,b) }[/math] функции образуют кольцо гладких функций [math]\displaystyle{ C^\infty(a,b) }[/math].

Коэффициенты [math]\displaystyle{ f^{(n)}(x) }[/math]

[math]\displaystyle{ f^{(m)}(x+h)=f^{(m)}(x)+f^{(m+1)}(x)h+ \dots \frac{1}{n!}f^{(m+n)}(x)h^n + o(h^n) }[/math]

Эти функции называют производными функции [math]\displaystyle{ f(x) }[/math]. Первая производная может быть вычислена как предел

[math]\displaystyle{ f'(x)=\lim\limits_{h \to 0}\frac{f(x+h)-f(x)}{h} }[/math].

Оператор, сопоставляющий функции [math]\displaystyle{ f(x) }[/math] её производную [math]\displaystyle{ f'(x) }[/math] обозначают как

[math]\displaystyle{ D= \frac{d}{dx} }[/math]

При этом для двух гладких функций f и g верно

[math]\displaystyle{ D (f+g)= Df + Dg }[/math] и [math]\displaystyle{ D(fg)=fDg+ gDf }[/math]

Оператор, обладающий указанными свойствами, называют дифференцированием кольца гладких функций.

Всякая аналитическая функция, голоморфная на отрезке [math]\displaystyle{ (a,b) }[/math], является гладкой функцией, но обратное неверно. Главное различие аналитических и гладких функций состоит в том, что первые полностью определяются своим поведением в окрестности одной точки, вторые — нет. Напр., гладкая функция может быть равна постоянной в окрестности одной точки, но не быть постоянной всюду. Элементарные функции в своей (открытой) области определения являются аналитическими, а, следовательно, и гладкими функциями. Однако, в отличие от аналитических функций, гладкие функции могут быть заданы на разных интервалах разными элементарными выражениями.

Касательная прямая

График функции (чёрная кривая) и касательная прямая (красная прямая)

Прямая

[math]\displaystyle{ y=f(c)+f'(c)(x-c) }[/math]

пересекает кривую

[math]\displaystyle{ y=f(x) }[/math]

в точке [math]\displaystyle{ (c,f(c)) }[/math] таким образом, что знак выражения

[math]\displaystyle{ f(x)-f(c)-f'(c)(x-c)=\frac{1}{2}f''(c)(x-c)^2+o((x-c)^2) }[/math]

при условии [math]\displaystyle{ f''(c)\not =0 }[/math] всё время остаётся одним и тем же, поэтому кривая

[math]\displaystyle{ y=f(x) }[/math]

лежит по одну сторону от прямой

[math]\displaystyle{ y=f(c)+f'(c)(x-c) }[/math]

Прямую, обладающую указанным свойством, называют касательной к кривой в точке [math]\displaystyle{ x=c }[/math] (по Б. Кавальери). Точку [math]\displaystyle{ x=c }[/math], в которой кривая

[math]\displaystyle{ y=f(x) }[/math]

не лежит по одну сторону от прямой

[math]\displaystyle{ y=f(c)+f'(c)(x-c) }[/math]

называют точкой перегиба, при этом прямую все равно именуют касательной. Для единообразия часто само понятие касательной вводят иначе с тем, чтобы оба случая подпадали под него.

Точки экстремума

Точка [math]\displaystyle{ x=c }[/math] называется точкой локального максимума (минимума), если

[math]\displaystyle{ f(c)-f(c+h)\gt 0 \quad (f(c)-f(c+h)\lt 0 ) }[/math]

для всех достаточно малых по модулю [math]\displaystyle{ h }[/math]. Из соотношения

[math]\displaystyle{ f'(c)h+\frac{1}{2}f''(c)h^2+ o(h^2)\lt 0 }[/math]

сразу видно, что [math]\displaystyle{ f'(c)=0 }[/math] — необходимое условие максимума, а [math]\displaystyle{ f''(c)\lt 0 }[/math] — достаточное условие максимума. Условие [math]\displaystyle{ f''(c)=0 }[/math] выделяет точки максимума, минимума и перегиба.

Непрерывные функции

Пусть [math]\displaystyle{ f }[/math] определена и на концах интервала [math]\displaystyle{ [a,b] }[/math]; говорят, что она непрерывна на [math]\displaystyle{ [a,b] }[/math], если для любого [math]\displaystyle{ \epsilon }[/math] найдётся такое [math]\displaystyle{ \delta }[/math], что

[math]\displaystyle{ |f(x)-f(x+h)|\lt \epsilon }[/math], лишь только [math]\displaystyle{ |h|\lt \delta, }[/math]

и точки [math]\displaystyle{ x,\, x+h }[/math] не выходят за границы интервала [math]\displaystyle{ [a,b] }[/math]. Теорема Вейерштрасса утверждает, что гладкая на отрезке функция достигает на отрезке своего минимального и максимального значений. Понятие непрерывности функции обычно увязывается с понятием предела функции. Непрерывные на интервале [math]\displaystyle{ [a,b] }[/math] функции образуют кольцо непрерывных функций [math]\displaystyle{ C[a,b] }[/math].

История

В XII веке математик Шарафуддин ат-Туси тюрко-монгольского государства Хулагу был первым, кто нашел производную от кубической функции, важный результат в дифференциальном исчислении. Был написан "Трактат об уравнениях", в котором были разработаны концепции, связанные с дифференциальным исчислением, такие, как производная функции и максимумы и минимумы кривых, для решения кубических уравнений, которая не может иметь положительного решения.

Основные теоремы дифференциального исчисления

Кольцо непрерывных на [math]\displaystyle{ [a,b] }[/math] и гладких на [math]\displaystyle{ (a,b) }[/math] функций обладает рядом важных свойств:

  • Теорема Ролля: если [math]\displaystyle{ f(a)=f(b) }[/math], то имеется точка [math]\displaystyle{ c\in (a,b) }[/math] максимума или минимума, в которой [math]\displaystyle{ f' }[/math] обращается в нуль.
  • Теорема Лагранжа: существует такая точка [math]\displaystyle{ c\in (a,b) }[/math], что
[math]\displaystyle{ \frac{f(b)-f(a)}{b-a}=f'(c) }[/math]
  • Теорема Коши: если [math]\displaystyle{ g'\not =0 }[/math] на [math]\displaystyle{ (a,b) }[/math], то существует такая точка [math]\displaystyle{ c\in (a,b) }[/math], что
[math]\displaystyle{ \frac{f(b)-f(a)}{g(b)-g(a)}=\frac{f'(c)}{g'(c)} }[/math]

Из теоремы Лагранжа выводят формулу Тейлора с остаточным членом в форме Лагранжа: на любом отрезке [math]\displaystyle{ (a',b')\subset (a,b) }[/math] найдутся такие точки [math]\displaystyle{ c_n }[/math], что

[math]\displaystyle{ f(b')=f(a')+f'(a')(b'-a')+\frac{1}{2!}f''(a')(b'-a')^2+ \dots \frac{1}{n!}f^{(n)}(a')(b'-a')^n + R_n }[/math]

где

[math]\displaystyle{ R_n=\frac{1}{(n+1)!}f^{(n+1)}(c_n)(b'-a')^{n+1} }[/math]

При помощи этой формулы можно приближённо вычислять значения функции в точке [math]\displaystyle{ b' }[/math] по известным значениям функции и её производных в точке [math]\displaystyle{ a' }[/math].

Из теоремы Коши выводят правило Лопиталя: если [math]\displaystyle{ f(b)=g(b)=0 }[/math] или [math]\displaystyle{ f(b)=g(b)=\infty }[/math], и [math]\displaystyle{ g'\not =0 }[/math] на [math]\displaystyle{ (a,b) }[/math], то

[math]\displaystyle{ \lim\limits_{x\rightarrow b-0}\frac{f(x)}{g(x)}=\lim\limits_{x\rightarrow b-0}\frac{f'(x)}{g'(x)}, }[/math]

причём существование второго предела влечёт существование первого.

См. также

Литература

Замечания

  1. В данном случае термин "бесконечно малая величина" не означает, что существует "бесконечно малое число" - положительное вещественное число, которое меньше любого другого числа. Понятие бесконечно малого это обозначение не числа, а бесконечного процесса уменьшения, предела. Поэтому, равенство [math]\displaystyle{ \frac{dy}{dx} }[/math] это не деление одного числа на другое, но предел деления.
  2. Не всякая функция может быть дифференцирована. Только если существует предел функция может считаться дифференцируемой.