본문 바로가기

Notice
Recent Posts
Recent Comments
Link
«   2024/10   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
Archives
Total
Today
Yesterday
관리 메뉴

체비셰프 다항식과 단위원판 위에서 최댓값이 가장 작은 다항식 본문

수학/해석학

체비셰프 다항식과 단위원판 위에서 최댓값이 가장 작은 다항식

JSCh89 2020. 10. 14. 01:58

체비셰프 다항식을 정의하는 방식에는 여러가지가 있지만 가장 자주 사용되는 정의는 \(-1\leq x\leq 1\)에서 

$$ T_n(x) = \cos(n \cos^{-1} x) $$

을 만족하는 \(n\)차 다항식 \(T_n(x)\)으로 정의하는 것이다. 예를 들어, 

$$ \cos 3x = 4\cos^3 x - 3\cos x $$

이므로 \(T_3(x) = 4x^3-3x\)이 되는 식이다. 이렇게 정의를 했을 때 \(T_n(x)\)가 실제로 다항식이 되며 최고차항의 계수가 \(2^{n-1}\)이 된다는 것 등은 잘 알려져 있는 사실이다. 이는 \(T_0(x) = 1\), \(T_1(x) = x\)라는 사실과 함께 체비셰프 다항식들 사이에 성립하는 점화식

$$ T_{n+1}(x) = 2xT_n(x) - T_{n-1}(x)$$

으로부터 쉽게 유도된다. 위 점화식이 성립하는 것은 삼각함수의 합차공식을 이용하여 보일 수 있다. 



체비셰프 다항식은 특히 수치해석학에서 중요하게 다뤄지는데, 체비셰프 다항식들이 가지는 여러 성질들이 어떤 주어진 함수를 다항식으로 근사할 때 유용하게 사용될 수 있기 때문이다. 아예 Chebyshev Polynomials, Mason & Handscomb이나 Approximation Theory and Approximation Practice, Trefethen 등과 같이 체비셰프 다항식과 관련된 이론만 다루는 책들이 있을 정도이다. 체비셰프 다항식들이 가지는 대표적인 성질 중 하나는 다음과 같이, 주어진 차수와 최고차항의 계수를 가지는 다항식들 중 절댓값의 최댓값이 가장 작은 다항식이 된다는 것이다. 편의상 이제부터 \(n\)은 자연수라고, 즉 \(0\)이 아니라고 하자.


정리 1.   최고차항의 계수가 \(1\)인 \(n\)차인 다항식들 중에서, 구간 \([-1,1]\)에서 절댓값의 최댓값이 가장 작아지는 다항식을 \(f_n(x)\)이라 하면 

$$f_n(x) = \frac{1}{2^{n-1}} T_{n}(x)$$

이 된다. 따라서 그 최댓값은 \(\frac{1}{2^{n-1}}\)이다. 


증명. \(T_n\)이 최고차항의 계수가 \(2^{n-1}\)인 \(n\)차 다항식이므로 \(f_n\)이 위와 같이 주어지면 \(f_n\)는 최고차항의 계수가 \(1\)인 \(n\)차 다항식이 이다. 또한 코사인 함수의 절댓값의 최댓값이 \(1\)이므로, 구간 \([-1,1]\)에서 \(f_n(x)\)의 절댓값의 최댓값은 \(\frac{1}{2^{n-1}}\)이 된다. 


이제 어떤 최고차항의 계수가 \(1\)인 \(n\)차 다항식 \(p_n(x)\)이 존재하여 구간 \([-1,1]\)에서 그 절댓값의 최댓값이 \(\frac{1}{2^{n-1}}\)보다 작거나 같다고 가정하자. 이 때 \(w_n(x) = f_n(x) - p_n(x)\)이라 하면 \(f_n(x)\)과 \(p_n(x)\)이 둘 다 최고차항의 계수가 \(1\)인 서로 다른 두 \(n\)차 다항식이기 때문에 \(w_n(x)\)는 차수가 \(n\)차 미만인 다항식이 된다. 이제 각 \(k=0,1,\cdots,n\)에 대하여 \(x_k = \cos\frac{k\pi}{n}\)이라 하면

$$\begin{aligned} f_n(x_k) = f_n\left( \cos\frac{k\pi}{n} \right) &= \frac{1}{2^{n-1}} T_n \left( \cos\frac{k\pi}{n} \right) \\ &= \frac{1}{2^{n-1}} \cos k\pi  \\ &= \frac{(-1)^k}{2^{n-1}} \end{aligned}$$

이 성립하므로 

$$ w_n(x_k) = f_n(x_k) - p_n(x_k) = \frac{(-1)^k}{2^{n-1}} - p_n(x_k) $$

이 되는데, 가정에 의해 \(p_n(x_k)\)는 그 절댓값이 \(\frac{1}{2^{n-1}}\)보다 작거나 같기 때문에 \(k\)가 짝수이면 \(w_n(x_k) \geq 0\)이고 \(k\)가 홀수이면 \(w_n(x_k) \leq 0\)이 된다. 그런데 \(x_0>x_1>\cdots>x_{n}\)이므로 중간값정리에 의해 \(x_0\)과 \(x_1\) 사이에 어떤 \(y_1\)이, \(x_1\)과 \(x_2\) 사이에 어떤 \(y_2\)가, …, \(x_{n-1}\)과 \(x_{n}\) 사이에 어떤 \(y_{n}\)이 존재하여 \(w_n(y_1) = w_n(y_2) = \cdots = w_n(y_{n}) = 0\)을 만족한다. 이 때 만약 어떤 \(j\)에 대해 \(y_j = y_{j+1}\)이라면 \(y_j=x_j\)일 수밖에 없는데, 이는 즉

$$ p_n(x_j) = f_n(x_j) + w_n(x_j) =f_n(x_j) = \frac{(-1)^j}{2^{n-1}}$$

임을 뜻한다. 가정에 의해 \(|p_n(x)| \leq \frac{1}{2^{n-1}}\)이므로 \(x_j\)는 \(p_n(x)\)의 극점이 되어야 하며, 따라서 \(p_n'(x_j) = 0\)이다. 그런데  \(x_j\)는 \(f_n(x)\)의 극점이기도 하므로 \(f_n'(x_j) = 0\) 또한 성립해야 하며, 이로부터 \(w_n'(x_j)=0\)인 것도 알 수 있다. 따라서 \(x_j\)는 방정식 \(w_n(x) = 0\)의 중근이 된다.  그렇기 때문에, 중근을 따로 센다면 \(w_n(x)\)는 언제나 적어도 \(n\)개의 근 \(y_1, y_2, \cdots, y_{n}\)을 가진다는 결론을 내릴 수 있다. 하지만 \(w_n(x)\)는 차수가 \(n\)차 미만인 다항식이기 때문에, 적어도 \(n\)개의 근을 가진다는 것은 \(w_n(x) = 0\)을 의미한다. 따라서 \(p_n(x) = f_n(x)\)일 수밖에 없다.  



이제 구간 \([-1,1]\)이 원점 \(0\)으로부터 거리가 \(1\) 이하인 점들의 집합이라는 것에 주목하여, 정의역을 복소수로 확대했을 때 복소평면상의 단위원판 

$$D = \{z:|z|\leq 1\}$$

위에서는 어떤 일이 벌어지는 지 알아보고자 한다. 다시 말해, 최고차항의 계수가 \(1\)인 \(n\)차 다항식들 중 단위원판 \(D\)에서 절댓값의 최댓값이 가장 작은 다항식은 어떤 것인지 생각해보자. 가장 먼저 후보로 떠오르는 다항식은 수직선상에서의 경험으로 미루어 볼 때 \(\frac{1}{2^{n-1}}T_{n}(z)\)일 것이다. 과연 그런지 \(n=3\)일 때를 생각해보자. 앞서 보았듯이 \(\frac{1}{2^{3-1}}T_3(z) = z^3-\frac{3}{4}z\)인데, \(z=i\)일 때를 생각하면 

$$ \frac{1}{2^{3-1}}T_3(i) = i^3-\frac{3}{4}i = -\frac{7}{4} i$$

이 되므로 단위원판 \(D\)에서 \(\frac{1}{2^{3-1}}T_3(z)\)의 절댓값의 최댓값은 적어도 \(\frac{7}{4}\)이 된다. 그런데 반면에 \(z^3\)을 생각하면 임의의 \(z \in D\)에 대하여 

$$ \left|z^3\right| = |z|^3 \leq 1 $$

이므로 \(D\)에서 \(z^3\)의 절댓값의 최댓값은 \(1\)이 된다. 따라서 \(\frac{1}{2^{3-1}}T_3(z)\)이 우리가 찾는 삼차식이 아닌 것은 알 수 있다. 


놀랍게도 우리가 찾는 다항식들은 우리가 이미 잘 알고 있는 다항식들이라는 것을, 또 수직선상에서와는 다르게 복잡한 다항식도 아니라는 것을 다음 정리가 알려준다. 


정리.   최고차항의 계수가 \(1\)인 \(n\)차인 다항식들 중에서 단위원판 \(D\)에서 절댓값의 최댓값이 가장 작아지는 다항식을 \(g_n(z)\)이라 하면

$$g_n(x) = z^n$$

이 된다. 따라서 그 최댓값은 \(1\)이다. 


증명 1. 임의로 최고차항의 계수가 \(1\)이고 \(n\)차인 다항식 

$$ p(z) = a_0 + a_1 z + \cdots + a_{n-1} z^{n-1} + z^n$$

이 주어졌을 때, 단위원판 \(D\) 위에서 \(p(z)\)의 절댓값의 최댓값을 \(M\)이라 하자. 그러면 최대절댓값원리에 의해 

$$ M = \max_{|z|=1} |p(z)| $$

이 된다. 이제 다항식 

$$ q(z) = z^n p\left(\frac{1}{z}\right) = 1 + a_{n-1} z + \cdots + a_1 z^{n-1} + a_0 z^n$$

을 생각하자. 그러면 \(q(z)\)에 최대절댓값원리를 적용하여 

$$\max_{z\in D} |q(z)| = \max_{|z|=1} |q(z)| = \max_{|z|=1} \left|z^n p\left(\frac{1}{z}\right)\right| $$

가 되는 것을 알 수 있다. 이 때, 우변에서 최댓값을 취할 때 \(|z|=1\)을 만족하는 복소수 \(z\)의 집합 위에서는 항상 \(\left|z^n\right| =1\)이라는 것에 주목하면 

$$ \max_{z\in D} |q(z)| = \max_{|z|=1} \left|p\left(\frac{1}{z}\right)\right| $$

임을 알 수 있다. 그런데 \(|z|=1\)을 만족하는 복소수 \(z\)의 집합과 \(\left|\frac{1}{z}\right|=1\)을 만족하는 복소수 \(z\)의 집합은 같은 집합이므로 \(w=1/z\)이라 놓으면 

$$\begin{aligned} \max_{z\in D} |q(z)| &= \max_{|z|=1} \left|p\left(\frac{1}{z}\right)\right| \\ &= \max_{\left|1/z\right|=1} \left|p\left(\frac{1}{z}\right)\right| = \max_{\left|w\right|=1} \left|p(w)\right| = M \end{aligned}$$

이라는 결론을 얻는다. 당연하게도 \(0\in D\)이므로 

$$ 1 = |q(0)| \leq \max_{z\in D} |q(z)| = M $$

이다. 즉, 어떠한 최고차항의 계수가 \(1\)인 \(n\)차 다항식을 고르더라도 그 다항식의 단위원판 \(D\) 위에서 절댓값의 최댓값 \(M\)은 \(1\)보다 크거나 같다. 


한편 \(z^n\)의 단위원판 \(D\) 위에서 절댓값의 최댓값이 \(1\)인 것은 당연하다. 그렇기 때문에 이제 최고차항의 계수가 \(1\)인 \(n\)차 다항식 \(g_n(z)\)의 \(D\) 위에서의 절댓값의 최댓값 \(M\)이 \(1\)이라면 \(g_n(z) = z^n\)일 수밖에 없음을 보이기만 하면 된다. 


만약 \(M = 1\)이면 

$$  q(0) = 1 = \max_{z\in D} |q(z)| $$

이므로 최대절댓값원리에 의해 \(q(z)\)는 상수함수 \(1\)이어야 한다. 이는 즉 

$$ a_0 = a_1 = \cdots = a_{n-1} = 0 $$

임을 의미하므로, \(g_n(z) = z^n\)이라는 결론을 얻는다.


증명 2. 최대절댓값정리를 사용하지 않고도 증명할 수 있다. 일단 \(D\)에서 \(g_n(z)\)의 절댓값의 최댓값은 적어도 \(D\)에서 \(z^n\)의 절댓값의 최댓값인 \(1\)보다는 작거나 같을 것이다. 그렇기 때문에 \(D\)에서 \(g_n(z)\)의 절댓값의 최댓값이 \(1\)이면 \(g_n(z) = z^n\)일 수밖에 없다는 것을 보이면 된다. 먼저 다음 보조정리를 살펴보아야 한다. 


보조정리. 자연수 \(n\geq 2\)이 주어졌다고 하자. 그러면 각 \(k=1, 2, \cdots, n-1\)에 대하여 다음 식이 성립한다. 

$$ 1 + e^{2\pi ik/n} + e^{4\pi ik/n} + \cdots + e^{2(n-1)\pi ik/n} = 0 $$

보조정리의 증명. 편의상 \(h(z) = 1+z+z^2+\cdots+z^{n-1}\)이라 두면 주어진 식의 좌변은 \(h(e^{2\pi ik/n})\)이 된다. 관계식 \(1-z^n = (1-z) h(z)\)이 성립한다는 것에 주목하자. 방정식 \(1-z^n = 0\)은 서로 다른 \(n\)개의 근 \(1, e^{2\pi i/n}, e^{4\pi i/n}, \cdots, e^{2\pi i(n-1)/n}\)을 가진다. 따라서 방정식 \(h(z) = 0\)의 근들은 방정식 \(1-z^n = 0\)의 근들 중 \(1\)이 아닌 \((n-1)\)개의 근 \(e^{2\pi i/n}, e^{4\pi i/n}, \cdots, e^{2\pi i(n-1)/n}\)이 될 것이므로, 임의의 \(k=1,2,\cdots, n-1\)에 대하여 

$$ h(  e^{2\pi ik/n} ) = 0 $$

이 성립한다는 것을, 다시 말해 주어진 식이 성립한다는 것을 알 수 있다. 


우리는 \(|z| =1\)일 때 \(|g_n(z)| \leq 1\)을 만족하는 최고차항의 계수가 \(1\)인 \(n\)차 다항식은 \(z^n\) 뿐이라는 것을 보일 것이다. 이것을 보이면 충분한 이유는, \(|z| \leq 1\)일 때 \(|g_n(z)| \leq 1\)이려면 적어도 \(|z| =1\)일 때 또한 \(|g_n(z)| \leq 1\)이어야 하고, 만약  \(|z| =1\)일 때 \(|g_n(z)| \leq 1\)인 \(g_n(z)\)가 \(g_n(z) =z^n\) 뿐이라면, \(|z|\leq 1\)일 때 \(|z^n|\leq 1\)인 것은 당연하므로 \(\max_{|z|\leq 1} |g_n(z)| = 1\)인 경우는 \(g_n(z) = z^n\)일 때밖에 없다는 결론을 얻기 때문이다. 


이를 위해 \(g_n(z)\)의 차수 \(n\)에 대한 귀납법을 이용하자. 편의를 위해 \(M = \max_{|z|=1} |g_n(z)|\)라고 하면, 우리의 가정은 \(M \leq 1\)이 된다. 먼저 \(n=1\)인 경우를 살펴보면, \(g_1(z)\)은 \(1\)차식이므로 어떤 상수 \(c \in \mathbb{C}\)에 대해 \(g_1(z) = c + z\)가 된다. 그런데 만약 \(c \neq 0\)이라면 \(|g_1(1)| = |c+1|\)이나 \(|g_1(-1)| = |c-1|\) 둘 중 하나는 \(1\)보다 크게 되므로 \(M \leq 1\)에 모순이다. 따라서 \(g_1(z) = z\)이다.  


따라서 \(n\geq 2\)인 경우만 살펴보면 된다. 편의상 \(\zeta = e^{2\pi i/n}\)이라고 놓자. 복소평면상에서 \(\zeta z\)는 \(z\)를 원점을 중심으로 반시계방향으로 \(2\pi / n\)만큼 회전시켰을 때의 점이 된다는 것을 떠올려보면, 임의의 자연수 \(k\)에 대하여 

$$\{ z : |z| = 1\} = \{ \zeta^k z : |z| = 1 \}$$

이 되는 것을 알 수 있으며, 따라서 

$$ \max_{|z| = 1} |g_n(z)| = \max_{|z| = 1} \left|g_n(\zeta^k z)\right| $$

이 성립한다는 것도 알 수 있다. 이제 다시 

$$ g_n(z) = a_0 + a_1 z + \cdots + a_{n-1} z^{n-1} + z^n$$

이라고 놓으면 \(\zeta^n=1\)이므로 

$$ \begin{aligned} g_n(z) &= a_0 + a_1 z + \cdots + a_{n-1} z^{n-1} + z^n \\ g_n(\zeta z) &= a_0 + a_1 \zeta z + \cdots + a_{n-1} \zeta^{n-1} z^{n-1} + z^n \\ g_n(\zeta^2 z) &=  a_0 + a_1 \zeta^2 z + \cdots + a_{n-1} \zeta^{2(n-1)} z^{n-1} + z^n \\ &\vdots \\ g_n(\zeta^{n-1} z) &=  a_0 + a_1 \zeta^{n-1} z + \cdots + a_{n-1} \zeta^{(n-1)(n-1)} z^{n-1} + z^n  \end{aligned} $$

이 되며, 각 줄의 다항식은 각각 단위원판 \(D\)에서 절댓값의 최댓값이 \(1\)인 다항식들이다. 위 다항식들을 변끼리 더해서 \(n\)으로 나누면 보조정리에 의해 

$$ \frac{1}{n} \Big( g_n(z) + g_n(\zeta z) + \cdots + g_n(\zeta^{n-1} z) \Big) = a_0 + z^n $$

임을 알 수 있다. 즉 임의의 \(z \in D\)에 대하여 

$$ \begin{aligned} |a_0 + z^n| &= \left| \frac{1}{n} \Big( g_n(z) + g_n(\zeta z) + \cdots + g_n(\zeta^{n-1} z) \Big) \right| \\ &\leq \frac{1}{n} \Big( \left|g_n(z)\right| + \left|g_n(\zeta z)\right| + \cdots + \left|g_n(\zeta^{n-1} z)\right| \Big) \\ &\leq 1 \end{aligned} $$

이 성립해야 한다. 그런데 만약 \(a_0 \neq 0\)이라면 \( |a_0 + 1^n| = |a_0+1|\)이나 \( |a_0 + (e^{i\pi/n})^n| = |a_0 - 1| \) 둘 중 하나는 \(1\)보다 크게 될 것이므로, \(a_0 = 0\)일 수밖에 없다는 것을 알 수 있다. 따라서 

$$ \begin{aligned} 1 \geq \max_{|z| = 1} |g_n(z)| &= \max_{|z|=1} \left| z( a_1 + a_2 z + \cdots + a_{n-1} z^{n-2} + z^{n-1} )  \right|  \\ &= \max_{|z|=1} \left| a_1 + a_2 z + \cdots + a_{n-1} z^{n-2} + z^{n-1} \right|  \end{aligned} $$

을 얻는데, \(a_1 + a_2 z + \cdots + a_{n-1} z^{n-2} + z^{n-1} \)는 최고차항의 계수가 \(1\)인 \((n-1)\)차식이므로 귀납 가정에 의해 

$$ a_1 = a_2 = \cdots = a_{n-1} = 0 $$

임을 알 수 있다. 따라서 \(g_n(z) = z^n\)이다. 



정리 12를 대비하여 살펴보면 변수가 실변수인 것과 복소변수인 것의 차이가 상당히 크다는 것을 다시금 느낄 수 있다. 어떤 주어진 연속함수 \(f:[-1,1]\to\mathbb{R}\)를 다항식으로 근사할 때 체비셰프 다항식들이 유용하게 사용될 수 있는 이유는 대략, 앞서 사용한 표기법대로 \(f_n(x) = \frac{1}{2^{n-1}} T_n(x)\)이라 하고 다음 근사식 

$$ f(x) \approx c_0 + c_1 f_1(x) + \cdots + c_n f_n(x)$$

이 괜찮은 근사식이 될 수 있도록 계수들의 수열 \(\{c_n\}_{n=0}^\infty\)을 골랐을 때, \(f_n(x)\)의 절댓값이 구간 \([-1,1]\)에서 커봐야 \(\frac{1}{2^{n-1}}\)이므로 수열 \(\{c_n\}_{n=0}^\infty\)가 너무 빠르게 증가하지만 않는다면 \(n\)이 커짐에 따라서 \(c_0 + c_1 f_1(x) + \cdots + c_n f_n(x) \)는 \(f(x)\)로 고르게 수렴하는 다항함수열이 되기 때문이다. 반면 테일러 다항식이 \(f\)를 근사하는 데에 부적합한 이유 중 하나는, 테일러 다항식은 전개의 중심이 되는 점 주변에서 \(f\)가 띠는 국소적인 성질에만 집중하는 다항식이기 때문에 구간 \([-1,1]\) 전체를 놓고 보았을 때에는 썩 좋지 못한 근사가 되기 때문이다. 



반면에 복소 변수의 다항함수는 해석함수이고, 해석함수의 고른 극한인 함수는 해석함수여야 하므로, 복소함수 \(g:D\to\mathbb{C}\)가 어떤 고르게 수렴하는 다항함수열로 근사가 가능하려면 \(g\)는 단순히 연속함수인 것을 넘어 애초에 해석함수여야 한다. 그런데 \(g\)가 해석함수라면 \(g\)의 테일러 다항식들로 이루어진 함수열이 \(g\)로 고르게 수렴한다는 사실은 해석함수가 가지는 중요한 성질 중 하나이다. 따라서 정리 2와 같이 생각해보면, \(g\)에 고르게 수렴하는 다항함수열이 존재한다는 보장 하에 그러한 다항함수열로서 \(g\)의 테일러 다항식들로 이루어진 함수열을 사용하는 것은 실변수함수 \(f\)를 테일러 다항식들로 근사하는 것에 비해 나쁜 선택이 아니다. 


'수학 > 해석학' 카테고리의 다른 글

해석개론(김김계, 제2개정판) 풀이집  (17) 2020.03.15
\( \sum _ {n = 1} ^ {\infty} (\sin n) z^n \)  (0) 2019.02.13
Comments