УказательРазделыОбозначенияАвторО проектеEnglish version


§

Для понимания материалов этого раздела неплохо было бы просмотреть разделы ПОЛИНОМ ОДНОЙ ПЕРЕМЕННОЙ и ОПРЕДЕЛИТЕЛЬ.


Дискриминант

Будем обозначать через \mathbb A_{} какое-либо из множеств \mathbb Z_{}, \mathbb Q, \mathbb R или \mathbb C_{}.

Дискриминант1) полинома f(x)=a_{0}x^n+a_1x^{n-1}+\dots+a_n, (n>1, a_0\ne 0) фактически совпадает с результантом этого полинома и его производной:

{\mathcal D}(f)=\frac{(-1)^{n(n-1)/2}}{a_0}{\mathcal R}(f(x),f^{\prime}(x)) \ .
Т

Теорема. Если \{ \lambda_{1},\dots,\lambda_n \} набор корней полинома f_{}(x) с учетом их кратностей , то

{\mathcal D}(f) =(-1)^{n(n-1)/2} a_0^{n-2}\prod_{j=1}^n f^{\prime}(\lambda_j)= a_0^{2n-2} \prod_{1\le j < k \le n} (\lambda_k - \lambda_j)^2 \ .

=>

{\mathcal D}(f_{}) = 0 тогда и только тогда, когда f_{}(x) имеет кратный корень.

П

Пример. Для квадратного трехчлена

{\mathcal D}(a_0x^2+a_1x+a_2)=\frac{1}{a_0}\left|\begin{array}{ccc} a_0&a_1&a_2\\ 0&2a_0&a_1\\ 2a_0&a_1&0 \end{array}\right|=a_1^2-4\,a_0a_2 \ .

?

Показать, что

a) \displaystyle {\mathcal D}(x^{3}+p\,x+q)=-108\left(\frac{q^2}{4}+\frac{p^3}{27}\right);

б) {\mathcal D}(a_{0}x^3+a_1x^2+a_2x+a_3)= a_1^2a_2^2-4a_1^3a_3-4\,a_0a_2^3+18\,a_0a_1a_2a_3-27\,a_0^2a_3^2;

в) \displaystyle {\mathcal D}(x^{4}+px+q)=6912\left(\frac{q^3}{27}-\frac{p^4}{256}\right).

П

Пример.

{\mathcal D} (a_0x^4+a_1x^3+a_2x^2+a_3x+a_4)=4I_2^3-27I_3^2 \ .

Здесь

I_2=4a_0a_4-a_1a_3 +\frac{1}{3}a_2^2 \ ,
I_3=-a_0a_3^2-a_1^2a_4+\frac{8}{3}a_0a_2a_4+ \frac{1}{3}a_1a_2a_3-\frac{2}{27}a_2^3 \ .

§

Смысл выражений I_{2} и I_{3} ЗДЕСЬ.

Свойства

1.

{\mathcal D}(A\cdot f(x)) = A^{2n-2} {\mathcal D}(f) ;

здесь A_{} — константа и \deg f = n_{}>1.

2.

{\mathcal D}(f(x)\cdot g(x))={\mathcal D}(f){\mathcal D}(g)\left[{\mathcal R}(f, g) \right]^2 \ ;

здесь {\mathcal R}(f, g_{}) — результант полиномов f(x)_{} и g_{}(x); степени которых предполагаются большими 1_{}.

3.

{\mathcal D}(f(x)(x-a))={\mathcal D}(f)\left[f(a) \right]^2 \ .

4. При условии a_{0}\ne 0, a_n \ne 0:

{\mathcal D}(a_0x^n+a_1x^{n-1}+\dots+a_n)={\mathcal D}(a_0+a_1x+\dots+a_{n-1}x^{n-1}+a_nx^n)

5.

{\mathcal D}(f(g(x))=\left[{\mathcal D}(f) \right]^m \prod_{j=1}^n {\mathcal D}(g(x)-\lambda_j) \ ;

здесь n=\deg f, m=\deg g , \{ \lambda_{1},\dots,\lambda_n \} — набор корней полинома f_{}(x), и старшие коэффициенты f_{}(x) и g_{}(x) считаются равными 1_{}.

?

Выразить a) {\mathcal D}(f_{}(A\,x+B)); б) {\mathcal D}(f(x^{m})); в) {\mathcal D}( {\tilde f}_{}(x)) через {\mathcal D}(f)_{}. Здесь

{\tilde f}(x)\equiv (C\,x+D)^n f\left(\frac{A\,x+B}{C\,x+D} \right) \ .

Детерминантные представления

В соответствии с определением, дискриминант можно представить в виде определителя порядка 2n-1_{}:

{\mathcal D}(f)=\frac{1}{a_0} \left|\begin{array}{cccccccccc} a_0&a_1&a_2&\ldots&\ldots&a_n&0&\dots &0 &0\\ 0&a_0&a_1&\ldots&\ldots&a_{n-1}&a_n&\dots&0 &0\\ \vdots&&\ddots&&&&&&\ddots\\ 0&0&\ldots&a_0&a_1&\ldots & & \ldots &a_{n-1} &a_n\\ 0&0&\ldots&&na_0&(n-1)a_1&\ldots& \ldots &2a_{n-2}&a_{n-1}\\ 0&0&\ldots&na_0&(n-1)a_1&\ldots &&\ldots &a_{n-1}&0\\ \vdots&&&\ldots&&&& &&\vdots\\ 0&na_0&\ldots&\ldots&&a_{n-1}&\ldots&&\ldots&0\\ na_0&\ldots&\ldots&&a_{n-1}&0&\ldots&&&0 \end{array}\right| \begin{array}{l} \left.\begin{array}{l} \\ \\ \\ \\ \end{array}\right\} n-1 \\ \left. \begin{array}{l} \\ \\ \\ \\ \\ \end{array}\right\} n \end{array}

В результате элементарных преобразований строк этого определителя, дискриминант можно представить в виде определителя порядка 2n-2_{}:

{\mathcal D}(f)=\frac{1}{n^{n-2}} \left|\begin{array}{cccccccc} a_1&2a_2&3a_3&\ldots&na_n&0&\ldots&0\\ 0& a_1&2a_2&3a_3&\ldots&na_n&\ldots&0\\ & & &\ldots&\ldots& & & \\ 0&\ldots&0&a_1&2a_2&3a_3&\ldots&na_n\\ 0&\ldots&0&na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}\\ 0&\ldots&na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}&0\\ & & &\ldots&\ldots& & & \\ na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}&0 &\ldots&0 \end{array}\right|

Последний определитель может быть получен и из альтернативного определения дискриминанта. Рассмотрим однородный полином (форму) от двух переменных x_{} и y_{}:

F(x,y)= a_0x^n + a_1x^{n-1}y +a_2x^{n-2}y^2+\dots+a_{n-1}xy^{n-1}+a_ny^n .

Вычислим его частные производные

\phi(x,y)=\partial F / \partial x ,\ \psi(x,y)=\partial F / \partial y \ .

Тогда дискриминантом формы F(x,y)_{} называется результант полиномов \psi(x,1)_{} и \phi(x,1)_{}.

Дискриминант как полиномиальная функция коэффициентов

По построению, дискриминант является однородным полиномом относительно коэффициентов a_{0},\dots,a_n, причем полиномом с целыми коэффициентами:

{\mathcal D}(a_0x^n+\dots+a_n)\equiv D(a_0,\dots,a_n) \in {\mathbb Z}[a_0,\dots,a_n] \ ;

степень этого полинома равна 2n-2_{}, и в своем разложении по степеням a_{0},\dots,a_n он будет содержать одночлен (-1)^{n(n-1)/2}n^n a_{0}^{n-1}a_n^{n-1}.

Т

Теорема. Если полином f(x)_{} имеет единственный кратный корень \lambda_{} второй кратности,то

1 : \lambda : \lambda^2 : \dots = \frac{\partial D}{\partial a_n} : \frac{\partial D}{\partial a_{n-1}} : \frac{\partial D}{\partial a_{n-2}} : \dots

П

Пример. Вывести общую формулу вычисления кратного корня полинома f(x)=a_{0}x^4+a_1x^3+a_2x^2+a_3x+a_4 при условии единственности этого корня.

Решение. C использованием формулы для дискриминанта полинома четвертой степени ( см. ВЫШЕ ), имеем:

\lambda = -\frac{2\,a_1I_2^2+9\,(-2\,a_0a_3+1/3\, a_1a_2)I_3}{8\,a_0I_2^2-9\,I_3(-a_1^2+8/3\,a_0a_2)} \ .

Для полинома f(x)= x^{4}-5x^3+4x^2+3x+9 будет I_{2}=169/3, I_3=-4394/27, {\mathcal D}(f)=0_{} и, по формуле имеем \lambda_{} = 3.

§

Дискриминант является инвариантом полинома f(x)_{} (строго говоря, инвариантом однородного полинома (формы) y^{n}f(x/y)).

Субдискриминанты

Определитель, получающийся из определителя

\left|\begin{array}{cccccccc} a_1&2a_2&3a_3&\ldots&na_n&0&\ldots&0\\ 0& a_1&2a_2&3a_3&\ldots&na_n&\ldots&0\\ & & &\ldots&\ldots& & & \\ 0&\ldots&0&a_1&2a_2&3a_3&\ldots&na_n\\ 0&\ldots&0&na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}\\ 0&\ldots&na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}&0\\ & & &\ldots&\ldots& & & \\ na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}&0 &\ldots&0 \end{array}\right|

вычеркиванием первых k_{} и последних k_{} строк, и первых k_{} и последних k_{} столбцов будем называть k_{}-ым субдискриминантом дискриминанта \mathcal D (f_{}) и обозначать {\mathcal D}_{k}. Для удобства формулировки некоторых последующих результатов дополнительно положим, что нулевой субдискриминант равен величине самого определителя, т.е.

{\mathcal D}_0=n^{n-2}{\mathcal D} (f) \quad u \quad {\mathcal D}_{n-1} = 1 \ .
§

В классической и современной литературе я не встречал устоявшегося названия объекта из последнего определения. В книге [2] сходный определитель назван апериодическим или биградиентным.

Т

Теорема. Полином f_{}(x) имеет ровно d_{} общих корней со своей производной (более строго: \deg( \operatorname{HOD} (f,f^{\prime}))=d_{}) тогда и только тогда, когда

\underbrace{{\mathcal D}_0=0, {\mathcal D}_1=0,\dots, {\mathcal D}_{d-1}=0}_d,{\mathcal D}_d\ne 0 \ .

=>

Если полином f_{}(x) имеет единственный кратный корень второй кратности, то этот корень рационально выражается через коэффициенты полинома:

\lambda=-\frac{\tilde {\mathcal D}_1}{{\mathcal D}_1} \ ,

где \tilde {\mathcal D}_{1} – определитель, получающийся из {\mathcal D}_{0} вычеркиванием из него первой и последней строки, а также первого и предпоследнего столбца (таким образом \tilde {\mathcal D}_{1} отличается от {\mathcal D}_{1} только последним столбцом).

П

Пример. Установить все значения параметра \alpha_{}, при которых полином f(x)=2\,x^5+3\,x^4+4\,x^3+x^{2}-\alpha обладает единственным кратным корнем и вычислить этот корень.

Решение. Составляем определитель для {\mathcal D}_{0}:

{\mathcal D}_0=\left|\begin{array}{rrrrrrrr} 3 & 8 & 3 & 0 & -5 \alpha & 0 & 0 & 0 \\ 0 & 3 & 8 & 3 & 0 & -5 \alpha & 0 & 0 \\ 0 & 0 & 3 & 8 & 3 & 0 & -5 \alpha & 0 \\ 0 & 0 & 0 & 3 & 8 & 3 & 0 & -5 \alpha \\ 0 & 0 & 0 & 10 & 12 & 12 & 2 & 0 \\ 0 & 0 & 10 & 12 & 12 & 2 & 0 & 0 \\ 0 & 10 & 12 & 12 & 2 & 0 & 0 & 0 \\ 10 & 12 & 12 & 2 & 0 & 0 & 0 & 0 \end{array} \right| =50000\,\alpha^4-100608\,\alpha^3+51216\,\alpha^2-608\,\alpha \ .

Этот полином по \alpha_{} обращается в нуль только при \alpha_{} \in \{0,1, 38/3125 \}. Вычеркивая из {\mathcal D}_{0} крайние столбцы и строки, составляем

{\mathcal D}_1=\left|\begin{array}{rrrrrr} 3 & 8 & 3 & 0 & -5 \alpha & 0 \\ 0 & 3 & 8 & 3 & 0 & -5 \alpha \\ 0 & 0 & 3 & 8 & 3 & 0 \\ 0 & 0 & 10 & 12 & 12 & 2 \\ 0 & 10 & 12 & 12 & 2 & 0 \\ 10 & 12 & 12 & 2 & 0 & 0 \end{array} \right| = 110000\,\alpha^2-102400\,\alpha-7600 \ .

При подстановке сюда найденных значений параметра \alpha_{}, получим:

{\mathcal D}_1 \ne 0 \ npu \ \alpha \in \{0, 38/3125 \}; \ {\mathcal D}_1 = 0 \ npu \ \alpha =1 \ .

Таким образом, полином f_{}(x) обладает единственным кратным корнем второй кратности при \alpha_{} \in \{0, 38/3125 \}, а при \alpha_{} =1 имеет либо несколько кратных корней, либо один кратности выше второй. Для установления величины кратного корня, составим определитель \tilde {\mathcal D}_{1}:

\tilde {\mathcal D}_1=\left|\begin{array}{rrrrrr} 3 & 8 & 3 & 0 & -5 \alpha & 0 \\ 0 & 3 & 8 & 3 & 0 & 0 \\ 0 & 0 & 3 & 8 & 3 & -5 \alpha \\ 0 & 0 & 10 & 12 & 12 & 0 \\ 0 & 10 & 12 & 12 & 2 & 0 \\ 10 & 12 & 12 & 2 & 0 & 0 \end{array} \right| = 147000\alpha^2-147000\alpha \ ,

и подставим в формулу

\lambda=- \tilde {\mathcal D}_1 / {\mathcal D}_1

найденные значения \alpha_{}:

\lambda = 0 \ \ npu \ \alpha =0 ; \ \lambda = -1/5 \ \ npu \ \alpha = 38/3125 \ .

Представление дискриминанта посредством ганкелевой матрицы

Для полинома f_{}(x) его k_{}суммой Ньютона называется сумма k_{}-х степеней его корней

s_k=\sum_{j=1}^n\lambda_j^k \ .

Суммы Ньютона выражаются рационально через коэффициенты полинома f_{}(x) посредством следующих рекуррентных формул Ньютона:

s_0=n,\ s_1=-a_1/a_0,
s_k=\left\{\begin{array}{lr} -(a_1s_{k-1}+a_2s_{k-2}+\dots+a_{k-1}s_1+a_kk)/a_0, &npu \ k\le n ;\\ -(a_1s_{k-1}+a_2s_{k-2}+\dots+a_ns_{k-n})/a_0, &npu \ k > n \end{array} \right.

Явное выражение сумм Ньютона через a_{0}, \dots, a_n дается формулой Варинга.

Вычислим суммы Ньютона s_{0},s_1,\dots,s_{2n-2} полинома f_{}(x) и составим из них ганкелеву матрицу

S=\left[s_{j+k} \right]_{j,k=0}^{n-1} = \left[\begin{array}{llllll} s_0 &s_1&s_2&\dots&s_{n-2}& s_{n-1}\\ s_1 &s_2&s_3&\dots&s_{n-1}& s_{n}\\ s_2 &s_3&s_4&\dots&s_{n}& s_{n+1}\\ \dots& & &&& \dots\\ s_{n-1} &s_n&s_{n+1}&\dots &s_{2n-3}&s_{2n-2} \end{array}\right]_{n\times n} \ .

Обозначим S_{1},\dots, S_n ее главные миноры.

Т

Теорема. Имеет место формула

{\mathcal D}_{k}=n^{n-k-2}a_0^{2(n-k-1)}S_{n-k} \ ,

связывающая миноры матрицы S_{} с субдискриминантами. В частности,

{\mathcal D}(f)=a_0^{2n-2}\det S \ .

Доказательство следует из представления результанта \mathcal R(f,f^{\prime}) в форме Кронекера.

Влияние на корни полинома

Оценка близости корней

!

Дискриминант фактически отвечает за близость корней полинома f_{}(x): чем ближе корни, тем он меньше и наоборот. Величина дискриминанта может быть использована и для оценки расстояния между корнями.

Т

Теорема. Имеет место оценка

\frac{\sqrt{\left|{\mathcal D}(f) \right|}}{(2\rho)^{n(n-1)/2-1}|a_0|^{n-1}} \le \min_{j,k\in \{1,\dots,n \} \atop j\ne k} \left|\lambda_j - \lambda_k \right| \le \frac{\left|{\mathcal D}(f)\right|^{1/[n(n-1)]}}{|a_0|^{2/n}} \quad npu \quad \rho = \max_{j \in \{1,\dots,n \}} |a_j| \ .

Решение уравнений в радикалах

Из школьного курса алгебры известна формула, выражающая корни квадратного уравнения f(x)=a_{0}x^2+a_1x+a_2=0 в виде функций коэффициентов:

\lambda_{1,2}=\frac{-a_1\pm\sqrt{{\mathcal D}(f)}}{2a_0} \ .

Здесь {\mathcal D}(f)=a_{1}^2-4a_0a_2 – дискриминант квадратного трехчлена. В этой формуле предполагалось, что {\mathcal D}(f) \ge 0_{}, a все коэффициенты, разумеется, считались вещественными. Тем не менее, формула остается справедливой и в том случае, когда коэффициенты полинома являются мнимыми (см. ЗДЕСЬ ).

Для кубического уравнения f(x)=a_{0}x^3+a_1x^2+a_2x+a_3=0 также существует явная формула, выражающая корни через коэффициенты — формула Кардано. В частном случае полинома f(x)=x^{3}+px+q она имеет вид

\lambda = \sqrt[3]{-\frac{q}{2}+\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}}+ \sqrt[3]{-\frac{q}{2}-\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}}

По определенному правилу (см. ЗДЕСЬ ) комбинируются значения корней кубических из (вообще говоря) мнимых чисел (даже для случая вещественных p_{} и q_{}). Под знаком квадратного корня снова стоит диcкриминант:

\frac{q^2}{4}+\frac{p^3}{27} = -108 {\mathcal D}(x^3+px+q) \ .

Вещественность корней

Полином f(x)=a_0x^{n}+a_1x^{n-1}+\dots+a_{n} с вещественными коэффициентами a_{0}\ne 0, a_1,\dots a_n может иметь как вещественные, так и мнимые корни \lambda_{1},\dots,\lambda_n (см. ЗДЕСЬ ). Хотя сами эти корни, как правило, не выражаются в «хороших» функциях от коэффициентов (см. РЕШЕНИЕ УРАВНЕНИЙ В РАДИКАЛАХ ), но условия наличия среди них заданного количества вещественных могут быть выражены в виде полиномиальных неравенств, наложенных на a_{0}, a_1,\dots a_n. Самым существенным из этих условий является условие на знак дискриминанта {\mathcal D}(f_{}).

П

Пример. Необходимым и достаточным условием вещественности корней полинома

a) f(x)=a_{0}x^2+a_1x+a_{2} является {\mathcal D}(f)=a_1^2-4a_0a_{2} \ge 0;

б) f(x)=x^{3}+p\,x+q_{} является {\mathcal D}(f) = -4\,p^3-27\,q^{2} \ge 0 \ \iff \ \frac{q^2}{4}+\frac{p^3} {27} \le 0.

При степени полинома n \ge 4_{} условие положительности дискриминанта уже не будет необходимым и достаточным для вещественности всех его корней.

Т

Теорема. Для того, чтобы все корни полинома f(x)_{} были вещественны необходимо, чтобы {\mathcal D}(f) \ge 0_{}.

Доказательство очевидно следует из представления \mathcal D (f)_{} через корни f(x)_{}.

Более общий результат связывает количество различных вещественных корней f(x)_{} со знаками субдискриминантов.

Т

Теорема. Пусть {\mathcal D}(f) \ne 0_{}. Если в последовательности субдискриминантов

{\mathcal D}_0,{\mathcal D}_{1},\dots,{\mathcal D}_{n-1}=1

нет двух последовательных нулей, то все корни полинома f(x)_{} различны и число вещественных равно

{\mathcal P}(1,{\mathcal D}_{n-1},\dots,{\mathcal D}_0) - {\mathcal V}(1,{\mathcal D}_{n-1},\dots,{\mathcal D}_0) \ ,

где {\mathcal P} и {\mathcal V}числа знакопостоянств и знакоперемен в последовательности.

Предыдущая теорема является переформулировкой следующей, основанной на представлении дискриминанта посредством ганкелевой матрицы S_{}.

Т

Теорема [Якоби]. Число различных корней полинома f(x)_{} равно рангу, а число различных вещественных корней f(x)_{} — сигнатуре матрицы S_{}.

Конструктивное вычисление ранга и сигнатуры симметричной матрицы S_{} возможно посредством определения знаков ее главных миноров S_{1},\dots,S_n.

=>

Пусть

S_n=0,\dots,S_{{\mathfrak r}+1}=0,S_{\mathfrak r}\ne 0, \dots, S_1 \ne 0 \ .

Тогда \operatorname{rank} (S)={\mathfrak r}_{} и число различных вещественных корней f(x)_{} равно

{\mathcal P}(1,S_1,\dots,S_{\mathfrak r}) -{\mathcal V}(1,S_1,\dots,S_{\mathfrak r}) \ .

=>

Для того, чтобы все корни полинома f(x) \in \mathbb R[x]_{} были вещественны и различны необходимо и достаточно, чтобы все главные миноры матрицы S_{} были положительны:

S_1>0,\dots,S_n > 0 \ .

П

Пример. Определить число вещественных корней полинома x^{5}-3\,x^3-x-1.

Решение. Суммы Ньютона:

\{s_j \}_{j=0}^8=\{5,\, 0,\, 6,\, 0,\, 22,\, 5,\, 72,\, 21,\,238 \} \ .

Составляем из них ганкелеву матрицу

S= \left[ \begin{array}{rrrrr} 5 & 0 & 6 & 0 & 22 \\ 0 & 6 & 0 & 22 & 5 \\ 6 & 0 & 22 & 5 & 72 \\ 0 & 22 & 5 & 72 & 21 \\ 22 & 5 & 72 & 21 & 238 \end{array} \right]

и вычисляем ее главные миноры:

S_1=5,\, S_2=30,\, S_3=444,\, S_4=-4598,\, S_5=-56\,123 \ .

Поскольку S_{5}\ne 0, все корни f(x)_{} различны.

{\mathcal P}(1,\,5,\,30,\,444,\,-4598,\,-56\,123)=4,\ {\mathcal V}(1,\,5,\,30,\,444,\,-4598,\,-56\,123)=1 \ .

Ответ. Три вещественных корня.

П

Пример. Установить количество вещественных корней полинома 2\,x^{5}+3\,x^4+4\,x^3+x^{2}- {\color{RubineRed} \alpha } в зависимости от значений параметра {\color{RubineRed} \alpha } \in \mathbb R.

Решение. Дискриминант полинома и его первый субдискриминант уже был вычислены выше:

{\mathcal D}_0= 16\alpha(3125\,\alpha-38)(\alpha-1)^2,\ {\mathcal D}_1=400\,(275\,\alpha+19)(\alpha-1) \ .
{\mathcal D}_2=\left|\begin{array}{rrrr} 3 & 8 & 3 & 0 \\ 0 & 3 & 8 & 3 \\ 0 & 10 & 12 & 12 \\ 10 & 12 & 12 & 2 \end{array} \right| = -2940 \ , {\mathcal D}_3=\left|\begin{array}{rr} 3 & 8 \\ 10 & 12 \end{array} \right|=-44 \ .

Анализируем знаки {\mathcal D}_{0} и {\mathcal D}_{1} в зависимости от значений параметра \alpha_{}; здесь критическими оказываются те значения, что обращают хоть один из субдискриминантов в нуль:

\begin{array}{c|c|c|c} & {\mathcal D}_0 & {\mathcal D}_1 & \begin{array}{l} {\mathcal P}(1,1,{\mathcal D}_3,{\mathcal D}_2, {\mathcal D}_1,{\mathcal D}_0) - \\ {\mathcal V}(1,1,{\mathcal D}_3,{\mathcal D}_2, {\mathcal D}_1,{\mathcal D}_0) \end{array} \\ \hline \alpha>1 & >0 & <0 & 3-2 \\ \hline \frac{38}{3125}<\alpha<1 & >0 & <0 & 3-2 \\ \hline 0<\alpha<\frac{38}{3125} & <0 & <0 & 4-1 \\ \hline -\frac{19}{275} < \alpha < 0 & >0 & <0 & 3-2 \\ \hline \alpha < -\frac{19}{275} & >0 & >0 & 3-2 \end{array}

Ответ. Полином имеет один вещественный корень при \alpha<0_{} и при \alpha_{} > 38/3125; полином имеет три вещественных корня при \alpha_{} \in [0,38/3125].

§

Обратим внимание, что установленные в предыдущем примере условия имеют следующую структуру: границами интервалов значений параметра \alpha_{}, обеспечивающих заданное количество вещественных корней у полинома f(x,\alpha), оказались корни его дискриминанта \mathcal D_{x} (f(x,\alpha)). Это обстоятельство оказывается проявлением общего принципа: из всех неравенств на знаки субдискриминантов самым критичным оказывается условие на знак самого дискриминанта.

Т

Теорема. В n_{}-мерном пространстве коэффициентов (a_{1},\dots, a_n) области, соответствующие полиномам f(x)=x^n+a_1x^{n-1}+\dots+a_{n} с одинаковым числом вещественных корней, отделяются друг от друга дискриминантной поверхностью, т.е. поверхностью

D(1,a_1,\dots,a_n) = \mathcal D_x(x^n+a_1x^{n-1}+\dots + a_n)=0 \ .

§

Это свойство дискриминанта оправдывает его название2).

П

Пример. Для полинома x^{3}+px+q дискриминантная поверхность становится плоской кривой: 4\,p^3+27\,q^2 =0; она отделяет (см. анализ ЗДЕСЬ ) область значений параметров (p,q_{}), соответствующих полиномам с тремя вещественными корнями (обозначена желтым цветом) от области полиномов, имеющих лишь один вещественный корень (обозначена голубым).

§

Авторство приведенной выше теоремы до конца не выяснил. В [3] на с. 252 идут ссылки на работу Brill от 1877 г., а также на работы Кронекера по теории характеристик. В отечественной литературе выражение «дискриминантная поверхность» — в указанном смысле — не встречал; только в классической немецкой под названием Diskriminantenfläche. В теории огибающих это выражение используется в ином смысле.

Приложения

Экстремальные значения полинома

Задача. Для полинома f(x)=a_0x^{n}+a_1x^{n-1}+\dots+a_n с вещественными коэффициентами a_0\ne 0, a_{1},\dots a_n найти его экстремальные значения. В частности, при n_{} – четном и a_{0}<0 найти его абсолютный максимум

\max_{x\in {\mathbb R}}f(x) \ .
Т

Теорема. Экстремальные значения полинома f_{}(x) являются вещественными корнями полинома

{\mathcal F}(z)={\mathcal D}_x(f(x)-z) \ .

Здесь дискриминант рассматривается от полинома по переменной x_{}, а z_{} считается числовым параметром.

=>

При n_{} – четном и a_{0}<0 максимальное значение полинома f_{}(x) совпадает с максимальным корнем полинома {\mathcal F}(z_{}), при условии, что этот корень не является кратным.

П

Пример. Для f(x)=x^{4}+p\,x+q имеем

{\mathcal F}(z)=256\ z^3-768q\ z^2+768q^2\ z+(27 p^4-256 q^3) \ .

П

Пример. Найти максимум полинома f(x)=-x^{6}+12\,x^2+12\,x+2.

Решение. Имеем

\mathcal F(z)= 46656(-z^5+10\,z^4+472\,z^3+16208\,z^2-16272\,z-32800)\ ,

и максимальный вещественный корень последнего полинома \approx 35.6321_{}, что совпадает со значением полинома f_{}(x) на одном из корней его производной: \mu_{} \approx 1.51851.

Выводы. Вместо того, чтобы искать все вещественные корни производной f{'}(x), подставлять их потом в f_{}(x) и сравнивать получившиеся значения, мы ищем только один — максимальный корень нового полинома \mathcal F_{}(z). Последнюю задачу — поиска какого-то одного корня алгебраического уравнения с заранее определенными свойствами — иногда решать проще. Так, к примеру, можно наудачу попробовать искать максимальный корень полинома \mathcal F_{}(z) по методу Бернулли — и если алгоритм сойдется к положительному значению, то оно3) и будет величиной глобального максимума f_{}(x).

?

Построить полином {\mathcal F}_{}(z) для

а) f(x)=-x^{4}-4x^3+2x^2+12x,

б) f(x)=-x^{4}+4x^3-4x^2,

в) f(x)=-x^{6}-10x^3+12 x

и установить, что \max f_{}(x) достигается в двух стационарных точках.

Существенность условия простоты максимального корня {\mathcal F}(z) поясняет следующий

П

Пример [4]. Для f(x)=-x^{6}-135x^2-324x получим:

{\mathcal F}(z)= 46656(z^3+1080\,z^2+1603800\,z-354294000)(z-540)^2

имеет максимальный корень равным z_{}=540; однако последний соответствует комплексно-сопряженным корням \mu_{1,2}=(-3\pm \mathbf i\sqrt {15})/2_{} производной f{'}(x)=-6(x^{5}+45\,x+54). Максимум f_{}(x) достигается на корне \mu_{3}=1-\sqrt[3]{10} и равен 90(-4+5 \sqrt[3]{10}-\sqrt[3]{100}_{}) \approx 191.7526154.

Экстремальные значения неявной функции

Обобщением задачи из предыдущего пункта является следующая:

Задача. Найти экстремумы функции y=f_{}(x), заданной алгебраическим уравнением \Phi_{}(x,y)=0. Здесь \Phi_{}(x,y)полином по x_{} и y_{} с вещественными коэффициентами.

Т

Теорема. Экстремальные значения неявной функции являются вещественными корнями полинома

{\mathcal F}(y)={\mathcal D}_x(\Phi(x,y)) \ .

Здесь дискриминант рассматривается от полинома по переменной x_{}, а y_{} считается числовым параметром.

Доказательство. Необходимое условие экстремума функции y=f_{}(x) в точке x=x_{0} заключается в обращении в нуль производной f^{\prime}(x_{}). Дифференцируя тождество \Phi(x,f(x)) \equiv 0 по x_{}

\frac{\partial \Phi}{\partial x} + \frac{\partial \Phi}{\partial y} f^{\prime}(x) \equiv 0

получаем, что в точке x=x_0, y_0=f(x_0) должны быть выполнены условия

\Phi(x,y)=0,\ \partial \Phi / \partial x = 0 \ .

П

Пример. Найти минимум неявной функции, заданной уравнением

-x^4-1/2 y^4+4\,x^2+3\,xy+4\,y=0 \ npu \ y < 0, x\in ]-2,2[ \ .

Решение. Вопрос о существовании и способах представления этой функции решается ЗДЕСЬ; но в настоящем решении мы просто формально применяем теорему:

{\mathcal F}(y)={\mathcal D}_x(-x^4+4\,x^2+3\,xy-1/2 y^4+4\,y) =
=32\,y^{12}-768\,y^9-512\,y^8+3552\,y^6+8192\,y^5-139\,y^4+4352\,y^3-30464\,y^2-16384\,y \ .

Вещественные корни последнего полинома:

y_1 \approx -1.795011, \ y_2 \approx -0.490598, \ y_3= 0,\ y_4 \approx 2.741399 \ .

Минимальным корнем является первый, по его значению можно восстановить и значение x_{1}: как кратного корня полинома \Phi (x,y_1). Его значение x_1 \approx -1.674506 принадлежит рассматриваемому интервалу ]-2,2[ и можно проверить, что при x = \pm 2 вещественные корни полинома \Phi(x_{},y) все больше y_{1}.

Ответ. \min \approx -1.795011.

Вычисление расстояния

Т

Теорема. Квадрат расстояния от точки X_{0} \in {\mathbb R}^n до квадрики в {\mathbb R}^{n}, заданной уравнением

X^{\top}AX+2B^{\top}X-1=0 \ , (A=A^{\top})

равен минимальному положительному корню полинома

{\mathcal F}(z)={\mathcal D}_{\mu} \left(\det \left( \left[ \begin{array}{cc} A & B \\ B^{\top} & -1 \end{array} \right] + \mu \left[ \begin{array}{cc} -E & X_0 \\ X_0^{\top} & z-X_0^{\top}X_0 \end{array} \right] \right) \right) \ ,

при условиях, что X_{0}^{\top}AX_0+2 B^{\top}X_0-1\ne 0 и указанный корень не является кратным. Здесь дискриминант рассматривается от полинома по переменной \mu_{}, z_{} считается числовым параметром, а E_{} означает единичную матрицу порядка n_{}.

=>

Квадрат расстояния от начала координат {\mathbb O} \in {\mathbb R}^{n} до поверхности, заданной уравнением

X^{\top}AX+2B^{\top}X-1=0 \ ,

равен минимальному положительному корню полинома

{\mathcal F}(z)={\mathcal D}_{\mu} \left( f(\mu)(\mu z-1)-B^{\top}q(A,\mu)B \right)\ ,

при условии, что этот корень не является кратным. Здесь f(\mu)=\det (A-\mu E)_{} характеристический полином матрицы A_{}, а q(A,\mu) — матрица взаимная матрице A-\mu E_{}.

В частном случае B={\mathbb O}_{} (поверхность центрирована к началу координат), имеем (на основании свойства 2 ЗДЕСЬ ):

{\mathcal F}(z)=\left[z^nf(1/z) \right]^2{\mathcal D}_{\mu}(f(\mu)) \ ,

и расстояние до квадратичной поверхности оказывается равным 1/\sqrt{\lambda_{\max}^{}}, где \lambda_{\max}^{} — максимальное собственное число матрицы A_{}.

§

Другие приложения дискриминанта в задачах, связанных с вычислением расстояния ЗДЕСЬ

Эквидистанта

Рассмотрим гладкую кривую \mathbf K_{} на плоскости, в каждой ее точке A_{} проведем перпендикуляр и возьмем на этом перпендикуляре точки, находящиеся на некотором фиксированном расстоянии h_{} от точки A_{}. Полученные точки формируют две кривые, каждую из которых назовем эквидистантой кривой \mathbf K_{} и будем обозначать {\mathbf K}_{+h}^{} и {\mathbf K}_{-h}^{}.

Т

Теорема. Эквидистанты кривой y=f_{}(x), где f_{}(x)полином с вещественными коэффициентами, задаются уравнением

\Phi(x,y)=0 \ npu \ \Phi(x,y)= {\mathcal D}_{X}\left(\left[X-x \right]^2 + \left[f(X)-y \right]^2-h^2 \right) \ .

Здесь дискриминант берется по переменной X_{}, в то время как остальные переменные считаются параметрами.

П

Пример. Найти уравнение эквидистант параболы y=x^{2}.

Решение. После вычисления дискриминанта, отбросим общий множитель его коэффициентов и сгруппируем полученный полином по степеням h_{}:

\begin{array}{rcl} \Phi(x,y)&=&{\mathcal D}_{X}\left(X^4+(1-2y)X^2-2\ xX+x^2+y^2-h^2\right)= \\ &=&(16 y^2+16 x^2-8 y+1)(y-x^2)^2 + \\ &+&\left[8(-4y^2-8yx^2-y+1-8 x^4)(y-x^2)- (4 x^2+1)^3 \right]h^2+ \\ &+&8(2y^2+4 y+6 x^2-1)h^4-16 h^6 \ . \end{array}

Уравнение \Phi(x,y)=0 и дает искомые эквидистанты {\mathbf K}_{+h}^{} и {\mathbf K}_{-h}^{} для параболы y=x^{2}.На рисунке показаны эквидистанты параболы для h=1_{}

§

Подробнее об эквидистанте ЗДЕСЬ.

Огибающая

Рассмотрим теперь семейство плоских кривых \left\{ \mathbf K(\lambda) \right\}_{}, зависящих от параметра \lambda_{}, принимающего значения из интервала [a,b] \in \mathbb R_{}. Если существует некоторая кривая \mathbf L_{}, которая в каждой своей точке касается некоторой кривой рассматриваемого семейства, но при этом не совпадает ни с одной из них на протяжении какого-либо своего участка, то эта кривая \mathbf L_{} называется огибающей семейства кривых \left\{ \mathbf K(\lambda) \right\}_{}.

Пусть кривые семейства \left\{ \mathbf K(\lambda) \right\}_{} заданы уравнением

\Psi(x,y,\lambda)=0 \ ,

где \Psi(x,y,\lambda)_{} — функция, непрерывно дифференцируемая по своим аргументам. Геометрическое место точек плоскости, удовлетворяющих условиям

\Psi(x,y,\lambda)=0,\ \frac{\partial \Psi(x,y,\lambda)}{\partial \lambda} = 0

называется дискриминантной кривой семейства \left\{ \mathbf K(\lambda) \right\}_{}.

Т

Теорема. Дискриминантная кривая семейства включает в себя огибающую этого семейства, а также, возможно, множество особых точек — таких точек, для которых выполняются условия

\frac{\partial \Psi(x,y,\lambda)}{\partial x} = 0,\ \frac{\partial \Psi(x,y,\lambda)}{\partial y} = 0 \ .

П

Пример. Найти огибающую семейства эллипсов

\frac{x^2}{a^2}+ \frac{y^2}{(1-a)^2}=1 \ npu \ a \in ]0,1[ \ .

Решение. Здесь уравнение дискриминантной кривой получается

исключением параметра a_{} из системы

\frac{x^2}{a^2}+ \frac{y^2}{(1-a)^2}=1,\ \frac{x^2}{a^3}-\frac{y^2}{(1-a)^3} = 0 \ .

Выражаем из второго уравнения a_{}:

a=\frac{x^{2/3}}{x^{2/3}+y^{2/3}} \ ,

(здесь существенно ограничение 0< a_{} < 1 из условия) подставляем в первое:

x^{2/3}+y^{2/3}=1 \ .

Получившаяся кривая называется астроидой.

§

Удивительно, что ни в одном современном учебнике по геометрии я не нашел связи понятия дискриминантной кривой с понятием дискриминанта — хотя эта связь очевидна:

Т

Теорема. Если функция \Psi(x,y,\lambda)_ является полиномом относительно \lambda_{}, то дискриминантная кривая задается уравнением

{\mathcal D}_{\lambda} (\Psi(x,y,\lambda)) = 0 \ .

Здесь {\mathcal D}_{} — дискриминант полинома, рассматриваемого по переменной \lambda_{}, в то время как остальные переменные считаются параметрами.

П

Пример. Если переписать уравнение семейства эллипсов из предыдущего примера в виде

(1-a)^2x^2+a^2y^2-a^2(1-a)^2=0 \quad \iff \quad -a^4+2\,a^3+(x^2+y^2-1)a^2-2\,x^2a+x^2 =0 \ ,

то применение теоремы даст представление дискриминантной кривой:

-16\,x^2y^2((x^2+y^2-1)^3+27\,x^2y^2)=0 \ .

Случаи x_{}=0 или y_{}=0 соответствуют значениям параметра a_{}, лежащим на границах рассматриваемого интервала. Тот факт, что оставшийся множитель определяет именно астроиду устанавливается с помощью замены переменных u_{}=x^{2/3}, v_{}=y^{2/3}.

П

Пример. Легко проверить, что рассмотренные в предыдущем пункте эквидистанты кривой \mathbf K_{} являются огибающими семейства окружностей радиуса h_{} с центрами, расположенными на этой кривой. Для параболы Y=X^{2} имеем

\Psi(x,y,X)\equiv (x-X)^2+(y-X^2)^2 - h^2

и роль параметра семейства выполняет X_{}:

§

Подробнее об огибающей ЗДЕСЬ.

Дискриминант полинома от нескольких переменных

Дискриминант квадратичной формы

Для квадратичной формы

\begin{array}{rllll} F_2(x_1,\dots,x_n)=&a_{11}x_1^2&+2a_{12}x_1x_2&+ \dots & +2a_{1n}x_1x_n+ \\ & &+a_{22}x_2^2 &+ \dots & +2a_{2n}x_2x_n+ \\ & &+\dots &+2a_{jk}x_jx_k & +\dots + \\ & & & &+a_{nn}x_n^2 \end{array}
=(x_1,\dots,x_n) \left( \begin{array}{ccccc} a_{11} & a_{12} & a_{13} & \dots & a_{1n} \\ a_{12} & a_{22} & a_{23} & \dots & a_{2n}\\ a_{13} & a_{23} & a_{33} & \dots & a_{3n} \\ \dots & & & & \dots \\ a_{1n} & a_{2n} & a_{3n} & \dots & a_{nn} \end{array} \right) \left( \begin{array}{c} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \end{array} \right)

ее дискриминант получается из условия существования нетривиального решения у системы линейных уравнений

\partial F_2/ \partial x_1=0,\dots,\partial F_2/ \partial x_n=0 \ .

Иными словами, он совпадает с определителем ее (симметричной) матрицы

{\mathcal D}(F_2)= \left| \begin{array}{ccccc} a_{11} & a_{12} & a_{13} & \dots & a_{1n} \\ a_{12} & a_{22} & a_{23} & \dots & a_{2n}\\ a_{13} & a_{23} & a_{33} & \dots & a_{3n} \\ \dots & & & & \dots \\ a_{1n} & a_{2n} & a_{3n} & \dots & a_{nn} \end{array} \right| \ .

Задачи

Источники

[1]. Калинина Е.А., Утешев А.Ю. Теория исключения: Учеб. пособие. СПб.: НИИ Химии СПбГУ, 2002. 72 с.

[2]. Джури Э. Инноры и устойчивость динамических систем. М.Наука, 1979

[3]. Encyklopädie der Mathematischen Wissenschaften mit Einschluss ihrer Anwendungen. Bd. I. Arithmetik und Algebra. Редактор — Meyer W.F. 1898-1904. Leipzig, Teubner

[4]. Uteshev A.Yu., Cherkasov T.M. The search for the maximum of a polynomial. J. Symbolic Computation. 1998. Vol. 25, № 5. P. 587-618.

[5]. Weber H. Lehrbuch der Algebra. F.Vieweg & Sohn Verlag, Braunschweig, Bd.I.1898

1) , 2) Discriminant (лат.) — различающий, разделяющий; слово дискриминация происходит от discriminatio — различение.
3) c вероятностью 1_{}

2017/03/06 22:10 редактировал au