Лекция 3

Реликтово лъчене. Числено решаване на нелинейни уравнения.

 

Цел на лекцията:

  1. Да запознае студентите с проблемите, които възникват и начините на решаване на нелинейни уравнения; разглежданията са ограничени до намиране на реални корени на едно уравнение с реални коефициенти.
  2. Да се види нуждата от такива методи във физиката и да се приложат за намиране на температурата на микровълновото фоновото лъчене, още наричано реликтово лъчене.

 

I. Закон на Планк за излъчването. Известен експериментален факт е, че нажежените тела излъчват: животът на Земята би бил невъзможен ако тя не получаваше топлина от лъчите на Слънцето. Всъщност излъчват всички тела, независимо от тяхната температура, излъчвания спектър на телата при стайна температура например е в инфрачервената област, с дължина на вълната 10-20 микрона (максимумът е около 16 микрона). Спектърът на излъчване на едно тяло зависи почти изцяло от температурата му и се описва от разпределението на Планк. По-точно спектърът на Планк описва електромагнитното лъчене намиращо се в равновесие с идеално черно тяло, но с голяма точност е валидно и за реалните тела.

            Законите на излъчването заемат важно място в изследванията по физика в края на 19-ти век. Натрупани са много експериментални факти, но резултатите изглеждат противоречиви и не могат да се обяснят със съществуващите теории. За да може да обясни тези противоречия немският теоретик Макс Планк изказва предположението, че светлината се излъчва на порции, наречени кванти. Това е силен удар върху дотогавашните представи на физиците възпитани в духа на безкрайно малките величини още от времето на Нютон. Дотогава се е смятало, че времето, пространството и енергията са безкрайно делими. В началото законът на Планк се е разглеждал като удобно средство за обяснение на експерименталните факти. По-късно обаче Айнщайн приема, че светлината не само се излъчва, а се разпространява под формата на кванти, наречени фотони. В много случаи фотоните се държат като частици, а не като лъчи. Съвременното схващане за светлината е дуалистично: тя се разглежда като лъчене или като частици – фотони, в зависимост от конкретната й проява. Идеята на Планк е гениално досещане, която променя изцяло възгледите ни за характера на физическите закони и доведе до създаването и развитието на квантовата теория. За откриването на закона за излъчване на твърдо тяло Планк получава Нобелова награда по физика за 1918 г.

            Нека с w бележим кръговата честота на електромагнитната вълна. Спектралната плътност uw на излъчената светлина от дадено тяло се дефинира като енергия в единица обем и в единица честотен интервал. Законът на Планк гласи:

 

.                                                                                                  (1)

Тук k е константата на Болцман (k=1.38.10-23 J.K-1), , където константата на Планк h=6.62.10-34 J.s; с е скоростта на светлината. Величината  е енергията на фотон с кръгова честота на трептене w. Ако с x бележим безразмерната величина  (1) може да се запише както следва:

            .                                                                            (2)

 

 

Фиг. 1 Графика на плътността на излъчването uw

Графиката на функцията  е показана на Фиг.1. От нея се вижда, че спектърът на лъчене има максимум при определена стойност на x. Следва, че ако познаваме честотата на вълната, при която се наблюдава максимум на излъчване на дадено тяло можем да определим температурата му. Максимумът на (2) се определя от нулата на първата производна или:

            3(1-е-x)-x=0.                                                                                                                (3)

За съжаление уравнение (3), както и много други, нямат аналитично решение. С числените методи за решаване на нелинейни уравнения ще се занимаваме по-късно в тази лекция.

 

II. Микровълновото фоновото лъчене Много от небесните тела излъчват в радиодиапазона, (където дължината на вълната е от порядъка на милиметри или сантиметри). За изучаването на тези тела се обособи дял от астрономията наречен радиоастрономия и бяха построени радиотелескопи. При настройката на един от тези радиотелескопи двама учени – Арно Пензиас и Робърт Уилсън откриват, че съществува микровълнов фон, който не идва от някаква конкретна точка, а изпълва цялата Вселена. Това е важно откритие защото се оказва, че то свидетелства за най-ранните етапи от развитието на Вселената. По това време е бил разработен моделът на “големия взрив” или на “горещата Вселена”, според който Вселената се разширява изотропно и е хомогенна в достатъчно големи мащаби. В началото веществото е имало много голяма плътност и извънредно висока температура: >108 K. В хода на последвалото разширяване температурата на веществото спада, но излъчената светлинна енергия остава в пространството като “реликт” или свидетелство за по-ранните събития. Реликтовото или микровълновото фоново лъчене е важно доказателство в полза на теорията за горещата вселена. С разширяването на пространството температурата (или все едно честотата) на лъченето пада. Първоначално реликтовото лъчене е било регистрирано на дължина на вълната 7.35 см, а в последствие и на други дължини в диапазона 0.6 мм – 50 см. Изчислено е, че в момента на всеки атом във вселената се падат 109 фотона от реликтовото лъчене или средно 400-500 фотона на кубичен сантиметър. За откритието си Арно Пензиас и Робърт Уилсън получават Нобелова награда през 1978 г.

            Важно е да се знае тяло с каква температура би излъчило спектъра на реликтовото лъчене, в този смисъл говорим още за температура на самото лъчене. Максимумът на излъчване е приблизително на 1.89 мм. Нека решението на (3) е x0. Тогава от равенството  може да се пресметне температурата. Следователно задачата се свежда до численото намиране на корена x0 на (3)

 

III. Поставяне на задачата за намиране на корен на нелинейно уравнение. Нека да потърсим корени на уравнението:

            f(x)=0                                                                                                                           (4)

Това уравнение може да бъде полином или трансцедентно уравнение. Намирането на нули на полиноми е един съществен раздел на математиката още от Ренесанса. Добре известно е например, че за полиноми от степен по-голяма от четири няма аналитично решение. Съществуват редица теореми, които указват къде да търсим корените на полинома, броя на положителните и отрицателните корени и др., които съществено облекчават задачата за намиране на нули за този клас нелинейни уравнения и за тях са разработени специални методи. Малко функции обаче във физиката са полиноми. Ето защо ние ще решаваме общата задача.

            Разглеждайки (4) виждаме, че от ляво и от дясно стоят реални числа. При работа с реални числа, независимо дали с компютър или на ръка, се работи с краен брой значещи разряда, следователно винаги съществува грешка от закръгляне и най-многото, на което можем да се надяваме е (4) да е приблизително изпълнено. Понятието “приблизително” се нуждае от уточнение. Ние можем:

a)      да търсим x такова, че |f(x)|<e

b)      да търсим x достатъчно близо до истинския корен x0: |x-x0)|<e.

Методите, които ще разгледаме удовлетворяват второто изискване, въпреки че първото е по-близо до дефиницията “корен на уравнение (4)”. Ако f(x) е непрекъсната при достатъчно малко e двете изисквания съвпадат. Проблемът е, че e не може да е произволно малко (защо?). Независимо от това в повечето случаи критерият b) е достатъчен. Всъщност точният прочит на критерий b) e: търсим област с големина 2e  около истинския корен x0, където (4) е приблизително изпълнено“. Тази задача е сравнително лесна ако знаем, че в дадена област на аргумента (не е задължително тя да е малка) има корен на (4). От друга страна намирането на корен (или корени) в общия случай е много тежка задача. По-този начин задачата се разпада на две:

1.      отделяне на област, където има корен

2.      уточняване на тази област, докато тя стане по-малка от зададената стойност 2e.

 

Ние ще се занимаваме с подзадача 2. Все пак въпросът как да определим областта, в която има корен е много съществен за да го отминем. Един очевиден признак за наличие на корен в дадена област е следният: нека a и b са две стойности на х. Ако f(a)f(b)<0, то в интервала (а,b) има поне един корен на (4) (вж. Фиг.2а). Не можем обаче със сигурност да твърдим, че коренът е само един. Това, което можем да твърдим е, че между а и b има нечетен брой корени на (4) (Фиг.2б). Следователно при намирането на един корен не можем да сме сигурни, че сме намерили всички корени в този интервал.

И така: проблемът, който ще решаваме е следният: знаем, че в дадена област има поне един корен; трябва да намерим нейна подобласт с предварително зададена големина около един от корените, така че да е изпълнено условието b).

 

Фиг.2а. Достатъчно условие за наличие на корен е f(a)f(b)<0

 

Фиг. 2б. Наличие на нечетен брой корени ако f(a)f(b)<0.

 

IV. Метод на разполовяването. Това е един малко бавен, но абсолютно надежден алгоритъм. Ако f(x) се пресмята достатъчно бързо той е и най-добрият избор. Методът се основава отново на предположението, че има област (a,b), където f(a)f(b)<0. Нека х1 е средата на (a,b). Ако f(a)f(x1)<0 делим интервала (а,х1) и означаваме с х2 средата му, в противен случай с х2 бележим средата на (х1,b). Продължаваме този алгоритъм докато получим област (xn,xn+1), така че |xn-xn+1|<e. Със сигурност можем да твърдим, че в посочения интервал има поне един корен.

            Лесно можем да изчислим, колко итерации са необходими за постигане на дадена точност. Нека например първоначалния интервал е 1, а търсената точност е 10-16 (машинният епсилон за числа с двойна точност в Паскал и Фортран). При всяка итерация интервала се разполовява, така след n итерации той ще е 1/2n. оттук получаваме:

                   или                                                               (5)

Уравнение (5) показва, че са необходими приблизително 53 итерации за постигане на нужната точност. При всяка итерация функцията се изчислява само веднъж, така че са необходими всичко 53 изчисления на функцията. При съвременните възможности на изчислителните машини това не би трябвало да представлява трудност дори за тези със скромни възможности.

            Методът на разполовяването има един съществен недостатък: той е неприложим ако коефициентите на нелинейното уравнение са комплексни, а също и за система уравнения.

 

V. Метод на текущите Този метод е по-бързо сходящ от метода на разполовяването и може да се използва за решаване на уравнения с комплексни коефициенти.

            Принципът на този алгоритъм е показан на Фиг.3. При него се започва от две начални приближения: x1 и x2. На всяка стъпка хр+1 се определя от хр-1 и хр като

 

 

Фиг.3 Метод на секущите

пресечна точка на правата свързваща точките (хрр) и (хр-1р-1) и абцисата. От аналитичната геометрия e известно уравнението на права минаваща през две точки :

                                                                                                             (6)

Тук ур и ур-1 са равни съответно на f(xp) f(xp-1), а по дефиниция на стойността на функцията у в точката хр+1 нула. От (6) получаваме:

                                                                                                         (7)

Итерациите продължават докато две последователни стойности на х са достатъчно близо една до друга или |f(x) |<e. Методът на секущите е по-бързо сходящ от метода на разполовяването, т.е. необходими са по-малко пресмятания на функцията. За да работи обаче този метод е необходимо първоначалните приближения x1и x2 да са достатъчно близо до корена (не е необходимо коренът да е между тези две точки). Тук няма да извеждаме необходимите условия. Твърдението е, че при достатъчно добър старт методът на секущите е сход            ящ към проста нула на дадена функция с непрекъсната втора производна.

            Тук за пръв път се сблъскваме с един общ проблем за итерационите процедури: често трябва да избираме между метод, който е напълно надежден, но бавен, и бърз метод, който гарантира сходимост само при достатъчно добро първо приближение. Решението най-често е следното – в началото избираме първия метод докато получим някаква област достатъчно малка за да служи като начално приближение за по-бързия метод и тогава стартираме втория метод.

 

VI. Метод на Нютон. Методът на Нютон (наричан понякога метод на Нютон-Рафсон) не е по-бързо сходящ от метода на секущите, но той може да се обобщи както за уравнения с комплексни коефициенти, така и за системи от нелинейни уравнения. Принципът на алгоритъма е следният (Фиг.4): в точката на началното приближение x1 прекарваме допирателна към f(x); следващото приближение х2 е пресечната точка на допирателната с абсцисата; построяваме допирателна към f(x) точка х2 и т.н. докато разликата между две последователни точки е по-малка от предварително зададена големина на интервал или |f(x) |<e. Както е показано в анализа:

 

Фиг.4 Метод на Нютон

            .                                                                                                     (8)

Това е уравнение на права минаваща през дадена точка с даден наклон. От (8) се вижда, че освен функцията при всяка итерация трябва да се пресметне и нейната производна.

            Както и при метода на секущите методът на Нютон гарантира сходимост само при достатъчно добро първо приближение.

 

Литература:

1. Дж. Форсайт. М. Малкълм, К. Молър, Компютърни методи за математически пресмятания, София Наука и изкуство 1986

2. Б. Сендов В. Попов, Числени методи, София, Университетско издателство 1996

3.Ч. Кител, Х. Кремер, Статистическа термодинамика, София Наука и изкуство 1988

4. С. Вайнберг, Первые три минуты, Москва 1981