Matrixmechanica

Uit Wikipedia, de vrije encyclopedie
Naar navigatie springen Naar zoeken springen

De matrixmechanica is een formulering van de kwantummechanica die in 1925 werd opgesteld door Werner Heisenberg, Max Born en Pascual Jordan.

De matrixmechanica is een van de twee hoofdmethoden van de beschrijving van gekwantificeerde verschijnselen in de natuur. Het breidde het Bohr-model uit door te beschrijven hoe kwantumovergangen optreden. De matrixmechanica interpreteert fysische eigenschappen van deeltjes als matrices die in de tijd evolueren. De matrixmechanica, in haar moderne formulering ook wel bekend als het Heisenbergbeeld, is equivalent aan de van Schrödinger afkomstige golfformulering van de kwantummechanica en ligt aan de basis van Diracs bra-ket notatie voor de golffunctie.

In tegenstelling tot de golfformulering, produceert het spectra van (meestal energie) operators door puur algebraïsche, ladder-operator, methoden. Zich baserend op deze methoden, heeft Pauli het waterstofatoomspectrum afgeleid in 1926, vóór de ontwikkeling van golfmechanica.

Ontwikkeling van matrixmechanica[bewerken | brontekst bewerken]

In 1925 formuleerden Werner Heisenberg, Max Born en Pascual Jordan de matrixmechanische representatie van de kwantummechanica.

Driekoningen in Helgoland[bewerken | brontekst bewerken]

In 1925 werkte Werner Heisenberg in Göttingen aan het probleem van het berekenen van de spectraallijnen van waterstof. In mei 1925 begon hij te proberen atoomsystemen alleen door waarneembare grootheden te beschrijven. Op 7 juni vertrok Heisenberg, om te ontsnappen aan de gevolgen van een zware aanval van hooikoorts, naar het pollenvrije Noordzee-eiland Helgoland. Terwijl hij daar tussen het klimmen en leren van gedichten van Goethe's West-östlicher Diwan doorging, bleef hij nadenken over het spectrale probleem en realiseerde hij zich uiteindelijk dat de aanname van niet commutatieve observabelen het probleem zou kunnen oplossen, en hij schreef later:[1]

"Het was ongeveer drie uur 's nachts toen het eindresultaat van de berekening voor mij lag. Eerst was ik diep geschokt. Ik was zo opgewonden dat ik niet aan slaap kon denken. Dus verliet ik het huis en wachtte op de zonsopgang op de top van een rots."

De drie fundamentele documenten[bewerken | brontekst bewerken]

Nadat Heisenberg was teruggekeerd naar Göttingen, liet hij Wolfgang Pauli zijn berekeningen zien en zei hij op een gegeven moment:

"Alles is nog steeds vaag en onduidelijk voor mij, maar het lijkt alsof de elektronen niet meer in banen zullen bewegen."

Op 9 juli gaf Heisenberg hetzelfde document van zijn berekeningen aan Max Born, zeggende: '... hij had een gek artikel geschreven en durfde het niet op te sturen voor publicatie, en dat Born het zou lezen en hem erover zou adviseren ...' voorafgaand aan publicatie. Heisenberg vertrok toen een tijdje en liet Born achter om het artikel te analyseren.[2]

In het artikel formuleerde Heisenberg de kwantumtheorie zonder scherpe elektronenbanen. Hendrik Kramers had eerder de relatieve intensiteiten van spectraallijnen in het Sommerfeld-model berekend door de Fourier-coëfficiënten van de banen als intensiteiten te interpreteren. Maar zijn antwoord was, net als alle andere berekeningen in de oude kwantumtheorie, alleen correct voor grote banen.

Heisenberg, na een samenwerking met Kramers,[3] begon te begrijpen dat de overgangskansen niet helemaal klassieke grootheden waren, omdat de enige frequenties die in de Fourier-serie voorkomen de frequenties zouden moeten zijn die waargenomen worden in kwantumsprongen, niet de fictieve die afkomstig zijn van Fourier-analyse van scherpe klassieke banen. Hij verving de klassieke Fourier-serie door een matrix van coëfficiënten, een vage quantum-analogie van de Fourier-serie. Klassiek geven de Fourier-coëfficiënten de intensiteit van de uitgezonden straling, dus in de kwantummechanica was de grootte van de matrixelementen van de positie operator de intensiteit van de straling in het heldere-lijnenspectrum. De hoeveelheden in de formulering van Heisenberg waren de klassieke positie en de impuls, maar nu waren ze niet langer scherp gedefinieerd. Elke hoeveelheid werd vertegenwoordigd door een verzameling van Fourier-coëfficiënten met twee indices, die overeenkomen met de begin- en eindtoestanden.[4]

Toen Born het artikel las, zag hij in dat deze formulering getranscribeerd en uitgebreid kon worden naar de systematische taal van matrices,[5] die hij had geleerd van zijn studie onder Jakob Rosanes[6] aan Breslau University. Born, met de hulp van zijn assistent en oud-student Pascual Jordan, begon onmiddellijk met het maken van de transcriptie en extensie, en ze dienden hun resultaten in voor publicatie; het artikel werd slechts 60 dagen na het artikel van Heisenberg ontvangen voor publicatie.[7] Alle drie de auteurs dienden voor het einde van het jaar een vervolgdocument in voor publicatie.[8] (Een korte bespreking van Borns rol in de ontwikkeling van de matrixmechanica formulering van kwantummechanica samen met een bespreking van de sleutelformule die de niet-commutativiteit van de kansamplitudes omvat, is te vinden in een artikel van Jeremy Bernstein.[9] Een gedetailleerd historisch en technisch verslag is te vinden in Mehra en Rechenberg's boek The Historical Development of Quantum Theory. Volume 3. The Formulation of Matrix Mechanics and Its Modifications 1925–1926. [10])

Tot nu toe werden matrices zelden door natuurkundigen gebruikt; ze werden beschouwd als behorend tot het rijk van de zuivere wiskunde. Gustav Mie had ze gebruikt in een artikel over elektrodynamica in 1912 en Born had ze gebruikt in zijn werk over de roostertheorie van kristallen in 1921. Hoewel matrices in deze gevallen werden gebruikt, kwam matrixalgebra met zijn vermenigvuldiging niet op de voorgrond zoals dat gebeurde in de matrixformulering van de kwantummechanica.[11]

Born had echter, zoals reeds opgemerkt, matrixalgebra van Rosanes geleerd, maar Born had ook Hilberts theorie van integraalvergelijkingen en kwadratische vormen voor een oneindig aantal variabelen geleerd, zoals blijkt uit een citaat van Born of Hilberts werk Grundzüge einer allgemeinen Theorie der Linearen Integralgleichungen gepubliceerd in 1912.[12][13]

Jordan was ook goed uitgerust voor de taak. Hij was een aantal jaren assistent van Richard Courant in Göttingen bij de voorbereiding van het boek van Courant en David Hilbert Methoden der mathematischen Physik I, dat in 1924 werd gepubliceerd.[14] Dit boek bevatte bij toeval een groot aantal van de wiskundige instrumenten die nodig zijn voor de voortdurende ontwikkeling van de kwantummechanica.

In 1926 werd John von Neumann assistent van David Hilbert, en hij zou de term Hilbertruimte gebruiken om de algebra en analyse te beschrijven die werden gebruikt bij de ontwikkeling van de kwantummechanica.[15][16]

De redenering van Heisenberg[bewerken | brontekst bewerken]

Vóór matrixmechanica beschreef de oude kwantumtheorie de beweging van een deeltje door een klassieke baan, met een goed gedefinieerde positie en impuls X ( t ), P ( t ), met de beperking dat de tijdintegraal over een periode T van de impuls maal de snelheid een positief geheel veelvoud van constante van Planck moet zijn

.

Hoewel deze beperking correct banen selecteert met min of meer de juiste energiewaarden E n , beschreef het oude kwantummechanische formalisme geen tijdsafhankelijke processen, zoals de emissie of absorptie van straling.

Wanneer een klassiek deeltje zwak is gekoppeld aan een stralingsveld, zodat de stralingsdemping kan worden verwaarloosd, zal het straling uitzenden in een patroon dat zich elke orbitale periode herhaalt. De frequenties waaruit de uitgaande golf bestaat, zijn dan gehele veelvouden van de orbitale frequentie, en dit weerspiegelt het feit dat X ( t ) periodiek is, zodat de Fourier representatie alleen frequenties 2πn/T heeft.

.

De coëfficiënten X n zijn complexe getallen. Die met negatieve frequenties moeten de complexe conjugaat zijn van die met positieve frequenties, zodat X ( t ) altijd reëel zal zijn,

.

Een kwantummechanisch deeltje kan daarentegen niet continu straling uitzenden, het kan alleen fotonen uitzenden. Ervan uitgaande dat het kwantumdeeltje begon in baannummer n , een foton uitzond en vervolgens eindigde in baannummer m , is de energie van het foton En − Em, wat betekent dat de frequentie (En − Em)/h is.

Voor grote n en m , maar met n m relatief klein, zijn dit de klassieke frequenties van Bohrs correspondentieprincipe

.

In de bovenstaande formule is T de klassieke periode van ofwel baan n of baan m , omdat het verschil tussen beide hoger is in h . Maar voor n en m klein, of als n m groot is, zijn de frequenties geen gehele veelvouden van een enkele frequentie.

Aangezien de frequenties die het deeltje uitzendt hetzelfde zijn als de frequenties in de Fourier-beschrijving van zijn beweging, suggereert dit dat 'iets' in de tijdsafhankelijke beschrijving van het deeltje met frequentie (EnEm)/h oscilleert.

Heisenberg noemde deze hoeveelheid X nm , en eiste dat het zou worden teruggebracht tot de klassieke Fourier-coëfficiënten binnen de klassieke limiet. Voor grote waarden van n , m maar met n m relatief klein, X nm is de ( n m ) e Fourier-coëfficiënt van de klassieke beweging in een baan n. Aangezien X nm een tegenovergestelde frequentie heeft als X mn , wordt de voorwaarde dat X echt is

.

Per definitie heeft X nm alleen de frequentie (EnEm)/h,

.

Dit is de oorspronkelijke vorm van de bewegingsvergelijking van Heisenberg.

Gezien twee arrays X nm en P nm die twee fysieke grootheden beschrijven, zou Heisenberg een nieuwe array van hetzelfde type kunnen vormen door het combineren van de termen X nk P km , die ook oscilleren met de juiste frequentie. Aangezien de Fourier-coëfficiënten van het product van twee hoeveelheden de convolutie van de Fourier-coëfficiënten van elk afzonderlijk is, kon Heisenberg door de overeenstemming met de Fourier-reeks de regel afleiden waarmee de arrays moeten worden vermenigvuldigd,

.

Born wees erop dat dit de wet is van matrixvermenigvuldiging, zodat de positie, de impuls, de energie, alle waarneembare grootheden in de theorie, geïnterpreteerd worden als matrices. Onder deze vermenigvuldigingsregel is het product afhankelijk van de volgorde: XP verschilt van PX .

De X matrix is een volledige beschrijving van de beweging van een kwantummechanisch deeltje. Omdat de frequenties in de kwantumbeweging geen veelvouden zijn van een gemeenschappelijke frequentie, kunnen de matrixelementen niet worden geïnterpreteerd als de Fourier-coëfficiënten van een scherp klassiek traject . Desalniettemin voldoen X ( t ) en P ( t ) als matrices aan de klassieke bewegingsvergelijkingen; zie ook de stelling van Ehrenfest hieronder.

Basisprincipes van matrices[bewerken | brontekst bewerken]

Toen het in 1925 werd geïntroduceerd door Werner Heisenberg, Max Born en Pascual Jordan, werd matrixmechanica niet onmiddellijk geaccepteerd en was het aanvankelijk een bron van controverse. De latere introductie van golfmechanica door Schrödinger werd sterk geprefereerd.

Een deel van de reden was dat de formulering van Heisenberg voor die tijd in een vreemde wiskundige taal was, terwijl de formulering van Schrödinger gebaseerd was op bekende golfvergelijkingen. Maar er was ook een diepere sociologische reden. De kwantummechanica had zich ontwikkeld via twee paden, één in een richting die de dualiteit van golfdeeltjes benadrukte, en de andere in een richting, ontstaan door Bohr, die de nadruk legde op afzonderlijke energietoestanden en kwantumsprongen. (Hier kan worden vermeld dat Einstein de voorkeur gaf aan de richting die de dualiteit van golfdeeltjes benadrukte.) De Broglie had de afzonderlijke energietoestanden gereproduceerd in het dualiteitskader van golfdeeltjes - de kwantumconditie is de staande golfconditie, en dit gaf hoop op degenen in de dualiteitschool met golfdeeltjes die alle afzonderlijke aspecten van de kwantummechanica zouden onderbrengen in een continue golfmechanica.

Matrixmechanica kwam daarentegen van de Bohr-school, die zich bezighield met discrete energietoestanden en kwantumsprongen. De volgelingen van Bohr waardeerden geen fysieke modellen die elektronen afbeelden als golven of helemaal niet. Ze gaven er de voorkeur aan zich te concentreren op de grootheden die rechtstreeks verband hielden met experimenten.

In de atoomfysica gaf spectroscopie observationele gegevens over atomaire overgangen die voortkomen uit de interacties van atomen met licht quanta. De Bohr-school vereiste dat alleen de grootheden die in principe met spectroscopie meetbaar waren, in de theorie zouden voorkomen. Deze grootheden omvatten de energieniveaus en hun intensiteiten, maar ze omvatten niet de exacte locatie van een deeltje in zijn Bohr-baan. Het is heel moeilijk om een experiment voor te stellen dat zou kunnen bepalen of een elektron in de grondtoestand van een waterstofatoom zich rechts of links van de kern bevindt. Het was een diepe overtuiging dat dergelijke vragen geen antwoord hadden.

De matrixformulering is gebaseerd op de premisse dat alle fysieke observabelen worden vertegenwoordigd door matrices, waarvan de elementen worden geïndexeerd door twee verschillende energieniveaus. De verzameling eigenwaarden van de matrix werd uiteindelijk begrepen als de verzameling van alle mogelijke waarden die de observabele kan hebben. Aangezien de matrices van Heisenberg Hermitisch zijn, zijn de eigenwaarden reëel.

Als een observabele wordt gemeten en het resultaat is een bepaalde eigenwaarde, dan is de corresponderende eigenvector de toestand van het systeem onmiddellijk na de meting. De handeling van meten in matrixmechanica 'stort' de toestand van het systeem in. Als men twee observabelen tegelijkertijd meet, stort de toestand van het systeem ineen tot een gemeenschappelijke eigenvector van de twee observabelen. Omdat de meeste matrices geen eigenvectoren gemeen hebben, kunnen de meeste waarnemingen nooit tegelijkertijd exact worden gemeten. Dit is het onzekerheidsbeginsel.

Als twee matrices hun eigenvectoren delen, kunnen ze tegelijkertijd diagonaal zijn. In de basis waar ze beide diagonaal zijn, is het duidelijk dat hun product niet afhankelijk is van hun volgorde, omdat vermenigvuldiging van diagonale matrices slechts vermenigvuldiging van getallen is. Het onzekerheidsprincipe is daarentegen een uitdrukking van het feit dat vaak twee matrices A en B niet altijd commuteren, dat wil zeggen dat AB − BA niet noodzakelijk gelijk is aan 0. De fundamentele commutatierelatie van matrixmechanica,

impliceert dan dat er geen toestanden zijn die tegelijkertijd een definitieve positie en impuls hebben.

Dit principe van onzekerheid geldt ook voor veel andere paren waarneembare waarnemingen. De energie commuteert bijvoorbeeld ook niet met de positie, dus het is onmogelijk om de positie en energie van een elektron in een atoom precies te bepalen.

In 1928 nomineerde Albert Einstein Heisenberg, Born en Jordan voor de Nobelprijs voor natuurkunde.[17] De aankondiging van de Nobelprijs voor de natuurkunde voor 1932 werd uitgesteld tot november 1933.[18] Op dat moment werd aangekondigd dat Heisenberg de Prijs voor 1932 had gewonnen "voor de creatie van de kwantummechanica, waarvan de toepassing onder meer heeft geleid tot de ontdekking van de allotrope vormen van waterstof".[19] en Erwin Schrödinger en Paul Adrien Maurice Dirac deelden de prijs uit 1933 "voor de ontdekking van nieuwe productieve vormen van atoomtheorie".[19]

Men zou zich heel goed kunnen afvragen waarom Born, samen met Heisenberg, in 1932 de Prijs niet ontving en Bernstein speculeert hierover. Een daarvan heeft betrekking op de toetreding van Jordan tot de Nazi-partij op 1 mei 1933 en een Storm Trooper aan het worden.[20] De affiliaties van de Jordaanse partij en de banden van Jordan met Born hebben mogelijk de kans van Born op de prijs in die tijd beïnvloed. Bernstein merkt verder op dat toen Born in 1954 uiteindelijk de prijs won, Jordan nog leefde, terwijl de prijs werd toegekend voor de statistische interpretatie van de kwantummechanica, toe te schrijven aan Born alleen.[21]

Heisenbergs reacties op Born for Heisenberg die de prijs ontving voor 1932 en op Born die de prijs ontving in 1954, zijn ook leerzaam om te evalueren of Born de prijs had moeten delen met Heisenberg. Op 25 november 1933 ontving Born een brief van Heisenberg waarin hij zei dat hij schriftelijk was vertraagd vanwege een "slecht geweten" dat hij alleen de prijs had ontvangen "voor zijn werk in Göttingen in samenwerking - jij, Jordan en ik." Heisenberg zei verder dat de bijdrage van Born en Jordan aan de kwantummechanica niet kan worden veranderd door 'een verkeerde beslissing van buitenaf'.[22]

In 1954 schreef Heisenberg een artikel ter ere van Max Planck voor zijn inzicht in 1900. In het artikel crediteerde Heisenberg Born en Jordan voor de uiteindelijke wiskundige formulering van matrixmechanica en Heisenberg benadrukte verder hoe groot hun bijdragen aan kwantum waren mechanica, die niet "voldoende erkend werden in het publieke oog".[23]

Wiskundige ontwikkeling[bewerken | brontekst bewerken]

Nadat Heisenberg de matrices voor X en P had geïntroduceerd, kon hij hun vinden matrixelementen in bijzondere gevallen door giswerk, begeleid door de correspondentieprincipe. Omdat de matrixelementen de kwantummechanica zijn analogen van Fourier-coëfficiënten van de klassieke banen, het eenvoudigste geval is de harmonische oscillator, waar de klassieke positie en de impuls, X ( t ) en P ( t ) sinusvormig zijn.

Harmonische oscillator[bewerken | brontekst bewerken]

In eenheden waar de massa en frequentie van de oscillator gelijk zijn aan één (zie nondimensionalization), is de energie van de oscillator

De ingestelde waarde van H zijn de banen met de klok mee en het zijn geneste cirkels in fase-ruimte. De klassieke baan met energie E is

De oude kwantumconditie schrijft voor dat de integraal van over een baan, het gebied van de cirkel in faseruimte, een geheel veelvoud moet zijn van Constante van Planck. Het gebied van de cirkel van de straal is 2πE. Dus

of, in natuurlijk element met ħ = 1, de energie is een geheel getal.

De Fourier-componenten van en zijn eenvoudig en vooral als ze worden gecombineerd in de hoeveelheden

.

Zowel als , hebben maar één frequentie en X en P kunnen worden hersteld van hun som en verschil.

Aangezien een klassieke Fourier-reeks heeft met alleen de laagste frequentie, en het matrixelement is de e Fourier-coëfficiënt van de klassieke baan, de matrix voor is niet nul op de lijn net erboven de diagonaal, waar deze gelijk is aan . De matrix voor is eveneens alleen niet-nul op de lijn onder de diagonaal, met dezelfde elementen.

Dus, uit and , reconstructie levert op

en

wat, tot de keuze van eenheden, de Heisenberg-matrices zijn voor de harmonische oscillator. Merk op dat beide matrices hermitian zijn, omdat ze zijn opgebouwd uit de Fourier-coëfficiënten van reële hoeveelheden.

Het vinden van X(t) en P(t) is direct, omdat het quantum Fourier-coëfficiënten zijn, zodat ze evolueren gewoon met de tijd,

Het matrixproduct van en is niet hermitisch, maar heeft een echt en imaginair deel. Het echte deel is de helft van de symmetrische uitdrukking , terwijl het imaginaire deel evenredig is met de commutator

.

Het is eenvoudig om expliciet te verifiëren dat in het geval van de harmonische oscillator is, vermenigvuldigd met de identiteit.

Het is ook eenvoudig om te controleren of de matrix

is een diagonale matrix, with eigenvalues Ei.

Behoud van energie[bewerken | brontekst bewerken]

De harmonische oscillator is een belangrijk geval. Het vinden van de matrices is gemakkelijker dan het bepalen van de algemene voorwaarden uit deze speciale formulieren. Daarom onderzocht Heisenberg de anharmonic oscillator, met Hamiltoniaanse

In dit geval is de en matrices zijn niet langer eenvoudig uit diagonale matrices, omdat de corresponderende klassieke banen enigszins platgedrukt en verplaatst zijn, zodat ze bij elke klassieke frequentie Fourier-coëfficiënten hebben. Om de matrixelementen te bepalen, eiste Heisenberg dat de klassieke bewegingsvergelijkingen worden nageleefd als matrixvergelijkingen,

Hij merkte op dat als dit kon worden gedaan, , beschouwd als een matrixfunctie van en , geen tijdsafgeleide heeft.

waarin 'A∗B' de anticommutator is,

.

Aangezien alle off diagonale elementen een frequentie hebben die gelijk is aan nul; constant zijn betekent dat is diagonaal. Het was Heisenberg duidelijk dat in dit systeem de energie precies kon worden geconserveerd in een willekeurig kwantumsysteem, een zeer bemoedigend teken.

Het proces van emissie en absorptie van fotonen leek te eisen dat het behoud van energie gemiddeld op zijn best zou blijven. Als een golf met precies één foton sommige atomen passeert en een ervan absorbeert, moet dat atoom de anderen vertellen dat ze het foton niet meer kunnen absorberen. Maar als de atomen ver van elkaar verwijderd zijn, kan elk signaal de andere atomen niet op tijd bereiken en kunnen ze uiteindelijk toch hetzelfde foton absorberen en de energie naar de omgeving afvoeren. Wanneer het signaal hen bereikte, zouden de andere atomen die energie op de een of andere manier recall moeten hebben. Deze paradox leidde ertoe Bohr, Kramers en Slater om de exacte energiebesparing op te geven. Het formalisme van Heisenberg, toen het werd uitgebreid tot het elektromagnetische veld, zou dit probleem duidelijk omzeilen, een hint dat de interpretatie van de theorie golffunctie instorting met zich meebrengt.

Differentiatietoepassing - canonieke commutatierelaties[bewerken | brontekst bewerken]

Eisen dat de klassieke bewegingsvergelijkingen behouden blijven, is niet sterk genoeg om de matrixelementen te bepalen. De constante van Planck komt niet voor in de klassieke vergelijkingen, zodat de matrices kunnen worden geconstrueerd voor veel verschillende waarden van ħ en toch voldoen aan de bewegingsvergelijkingen, maar met verschillende energieniveaus.

Dus om zijn programma uit te voeren, moest Heisenberg de oude kwantum conditie gebruiken om de energieniveaus vast te stellen en vervolgens de matrices in te vullen met Fourier-coëfficiënten van de klassieke vergelijkingen, verander vervolgens de matrixcoëfficiënten en het energieniveau enigszins om er zeker van te zijn dat aan de klassieke vergelijkingen wordt voldaan. Dit is duidelijk niet het geval. De oude kwantumcondities verwijzen naar het gebied dat wordt omsloten door de scherpe klassieke banen, die niet bestaan in het nieuwe formalisme.

Het belangrijkste dat Heisenberg ontdekte, is hoe de oude kwantum conditie vertaald kan worden naar een simpele verklaring in matrixmechanica. Om dit te doen, onderzocht hij de actie-integraal als een matrixhoeveelheid,

Er zijn verschillende problemen met deze integraal, allemaal voortkomend uit de onverenigbaarheid van het matrixformalisme met het oude beeld van banen. Welke periode T moet worden gebruikt? Semiclassically , het moet m of n zijn, maar het verschil is order ħ en er wordt gezocht naar een antwoord op order ħ. De 'kwantum'-voorwaarde vertelt ons dat J mn is 2πn op de diagonaal, dus het feit dat J klassiek constant is, vertelt ons dat de niet-diagonale elementen nul zijn.

Zijn cruciale inzicht was om de kwantumconditie te differentiëren met betrekking tot n . Dit idee is alleen logisch in de klassieke limiet, waar n is niet een geheel getal maar de continue actiehoekvariabelen J , maar Heisenberg voerde analoge manipulaties uit met matrices, waarbij de tussenliggende uitdrukkingen zijn soms discrete verschillen en soms afgeleiden.

In de volgende discussie zal duidelijkheidshalve worden gedifferentieerd op de klassieke variabelen en zal de overgang naar matrixmechanica achteraf plaatsvinden, geleid door het correspondentieprincipe.

In de klassieke setting is de afgeleide de afgeleide met betrekking tot J van de integraal die J definieert, dus het is tautologisch gelijk aan 1.

waar de afgeleiden dP / dJ en dX / dJ moeten worden geïnterpreteerd als verschillen met betrekking tot J op overeenkomstige tijden op nabijgelegen banen, precies wat zou worden verkregen als de Fourier-coëfficiënten van de orbitale beweging werden gedifferentieerd. (Deze afgeleiden zijn symplectisch orthogonaal in fase-ruimte ten opzichte van de tijdafgeleiden dP / dt en dX / dt ). De laatste uitdrukking wordt verduidelijkt door de variabele canoniek toe te voegen aan J , die de hoekvariabele θ wordt genoemd: De afgeleide met betrekking tot tijd is een afgeleide met betrekking tot θ , tot een factor 2πT ,

De integraal van de kwantumconditie is dus de gemiddelde waarde over één cyclus van de Poisson-beugel van X en P .

Een analoge differentiatie van de Fourier-serie van P dX toont aan dat de niet-diagonale elementen van de Poisson-beugel allemaal nul zijn. De Poisson-haak van twee canoniek geconjugeerde variabelen, zoals X en P , is de constante waarde 1, dus deze integraal is eigenlijk de gemiddelde waarde van 1; dus het is 1, zoals we al lang wisten, want het is tenslotte dJ / dJ . Maar Heisenberg, Born en Jordan waren, in tegenstelling tot Dirac, niet bekend met de theorie van Poisson-haakjes, dus voor hen evalueerde de differentiatie effectief { X, P } in J, θ coördinaten.

De Poisson-beugel heeft, in tegenstelling tot de actie-integraal, een eenvoudige vertaling naar matrixmechanica - hij komt normaal gesproken overeen met het imaginaire deel van het product van twee variabelen, de commutator.

Om dit te zien, onderzoekt u het (antisymmetrische) product van twee matrices A en B in de correspondentielimiet, waarbij de matrixelementen langzaam variërende functies van de index zijn, rekening houdend met het feit dat het antwoord klassiek nul is.

In de correspondentielimiet, wanneer indices m , n groot en dichtbij zijn, terwijl k , r klein zijn, de mate van verandering van de matrixelementen in de diagonale richting is het matrixelement van de J - afgeleide van de overeenkomstige klassieke grootheid. Het is dus mogelijk om elk matrixelement diagonaal door de correspondentie te verplaatsen,

waar de rechterkant eigenlijk alleen de ( m n ) 'de Fourier-component is van dA / dJ in de baan nabij m aan deze semi-klassieke volgorde, niet een volledig goed gedefinieerde matrix.

De semiklassieke tijdsafgeleide van een matrixelement wordt verkregen tot een factor i door te vermenigvuldigen met de afstand tot de diagonaal,

aangezien de coëfficiënt A m (m + k) semiklassiek de k 'de Fourier-coëfficiënt van de' 'm' 'is - de klassieke baan.

Het imaginaire deel van het product van A en B kan worden geëvalueerd door de matrixelementen te verschuiven zodat het klassieke antwoord, dat nul is, wordt gereproduceerd.

Het leidende nonzero-residu wordt dan volledig gegeven door de verschuiving. Aangezien alle matrixelementen zich op indices bevinden die een kleine afstand hebben tot de grote indexpositie ( m, m ), helpt het om twee tijdelijke notaties te introduceren:

A[r,k] = A(m+r)(m+k) voor the matrices, en (dA/dJ)[r]

voor de eerste Fourier-componenten van klassieke hoeveelheden,

Als je de sommatievariabele in de eerste som van naar r '=' 'k' '-' 'r' 'omdraait, wordt het matrixelement,

en het is duidelijk dat het belangrijkste (klassieke) deel annuleert. Het leidende kwantumgedeelte, het negeren van het hogere orde product van derivaten in de resterende expressie, is dan

=

zodat, uiteindelijk,

die kan worden geïdentificeerd met i keer de k-de klassieke Fourier-component van de Poisson-haak.

De oorspronkelijke differentiatietruc van Heisenberg werd uiteindelijk uitgebreid tot een volledige semi-klassieke afleiding van de kwantumconditie, in samenwerking met Born en Jordan. Zodra ze dat konden vaststellen

deze voorwaarde verving en verlengde de regel old quantization, waardoor de matrixelementen van P en X voor een willekeurig systeem konden worden bepaald gewoon uit de vorm van de Hamiltoniaan.

De nieuwe kwantiseringsregel werd verondersteld universeel waar te zijn , hoewel de afleiding van de oude kwantumtheorie semiklassieke redenering vereiste. (Een volledige kwantumbehandeling, voor meer uitgebreide argumenten van de haakjes, werd echter gewaardeerd in de jaren 1940 om Poisson-haakjes uit te breiden tot Moyal bracket s.)

Toestandsvectoren en de Heisenberg-vergelijking[bewerken | brontekst bewerken]

Om de overgang naar standaard kwantummechanica te maken, was de belangrijkste verdere toevoeging de kwantum toestandsvector, nu geschreven ψ, dat is de vector waar de matrices op inwerken. Zonder de toestandsvector is het niet duidelijk welke beweging de Heisenberg-matrices beschrijven, omdat ze alle bewegingen ergens bevatten.

De interpretatie van de toestandsvector, waarvan de componenten zijn geschreven ψ m , werd geleverd door Born. Deze interpretatie is statistisch: het resultaat van een meting van de fysieke grootheid die overeenkomt met de matrix A is willekeurig, met een gemiddelde waarde gelijk aan

Als alternatief, en equivalent, geeft de toestandsvector de waarschijnlijkheidsamplitude s n voor het kwantumsysteem om in de energietoestand te zijn n.

Nadat de toestandsvector was geïntroduceerd, kon de matrixmechanica naar elke basis worden geroteerd, waarbij de - matrix niet langer diagonaal hoeft te zijn. De bewegingsvergelijking van Heisenberg in zijn oorspronkelijke vorm stelt dat A mn in de tijd evolueert als een Fourier-component, Amn,

die in differentiële vorm kan worden herschikt

en het kan worden aangepast zodat het waar is op een willekeurige basis, door op te merken dat de H matrix diagonaal is met diagonale waarden E m ,

Dit is nu een matrixvergelijking, dus het geldt voor elke basis. Dit is de moderne vorm van de bewegingsvergelijking van Heisenberg.

De formele oplossing is:

Al deze vormen van de bewegingsvergelijking hierboven zeggen hetzelfde, dat A ( t ) equivalent is aan A (0) , door een basisrotatie door de unitary matrix e iHt , een systematisch beeld opgehelderd door Dirac in zijn braket notatie. Omgekeerd, door de basis voor de toestandsvector telkens te roteren door e iHt , kan de tijdsafhankelijkheid in de matrices ongedaan worden gemaakt. De matrices zijn nu tijdonafhankelijk, maar de toestandsvector roteert,

Dit is de Schrödinger-vergelijking voor de toestandsvector, en deze tijdsafhankelijke verandering van basis komt neer op transformatie naar het Schrödinger-beeld, met ⟨x | ψ⟩ = ' 'ψ (x)' '. In quantummechanica in de Heisenberg picture de state vector, | ψ⟩ verandert niet met de tijd, terwijl een waarneembare A voldoet aan de Heisenberg-bewegingsvergelijking ,

De extra term is voor operators zoals

die een expliciete tijdsafhankelijkheid hebben, naast de tijdsafhankelijkheid van de besproken unitaire evolutie.

De Heisenberg-afbeelding maakt geen onderscheid tussen tijd en ruimte, en is dus beter geschikt voor relativistische theorieën dan de Schrödingervergelijking. Bovendien is de gelijkenis met klassieke fysica duidelijker: de Hamiltoniaanse bewegingsvergelijkingen voor klassieke mechanica worden hersteld door de commutator hierboven te vervangen door de Poisson-haak (zie ook hieronder). Volgens de Stone-von Neumann-stelling moeten de Heisenberg-afbeelding en de Schrödinger-afbeelding unitair equivalent zijn, zoals hieronder wordt beschreven.

Verdere resultaten[bewerken | brontekst bewerken]

Matrixmechanica ontwikkelde zich snel tot moderne kwantummechanica en leverde interessante fysische resultaten op over de spectra van atomen.

Golfmechanica[bewerken | brontekst bewerken]

Jordan merkte op dat de commutatierelaties ervoor zorgen dat P fungeert als een differentiële operator .

De identiteit van de operator

staat de evaluatie toe van de commutator van P met elke kracht van X , en het impliceert dat

wat, samen met lineariteit, impliceert dat een P - commutator effectief onderscheid maakt tussen elke analytische matrixfunctie van X .

Ervan uitgaande dat grenzen verstandig zijn gedefinieerd, strekt dit zich uit tot willekeurige functies - maar de uitbreiding hoeft niet expliciet te worden gemaakt totdat een zekere mate van wiskundige nauwkeurigheid vereist is,

Aangezien X een Hermitische matrix is, moet deze diagonaal zijn en uit de uiteindelijke vorm van P zal duidelijk zijn dat elk reëel getal een eigenwaarde kan zijn. Dit maakt een deel van de wiskunde subtiel, omdat er voor elk punt in de ruimte een eigen eigenvector is.

In de basis waar X diagonaal is, kan een willekeurige toestand worden geschreven als een superpositie van toestanden met eigenwaarden x ,

,

zodat ψ ( x ) = ⟨x | ψ⟩, en de operator X elke eigenvector vermenigvuldigt met x ,

Definieer een lineaire operator D die ψ onderscheidt,

,

en merk dat op

,

zodat de operator - iD dezelfde commutatierelatie volgt als P . Het verschil tussen P en - iD moet dus pendelen met X ,

,

dus het kan tegelijkertijd diagonaal zijn met X : de waarde die werkt op elke eigentoestand van X is een functie f van de eigenwaarde x .

Deze functie moet echt zijn, omdat zowel P als - iD Hermitisch zijn,

,

het roteren van elke staat met een fase f ( x ), dat wil zeggen de fase van de golffunctie opnieuw definiëren:

.

De operator iD wordt opnieuw gedefinieerd met een bedrag:

,

wat betekent dat, in de geroteerde basis, P gelijk is aan - iD .

Daarom is er altijd een basis voor de eigenwaarden van X waar de actie van P op een golffunctie bekend is:

,

en de Hamiltoniaan in deze basis is een lineaire differentiaaloperator op de state-vector componenten,

De bewegingsvergelijking voor de toestandsvector is dus slechts een gevierde differentiaalvergelijking,

Aangezien D een differentiële operator is, moeten er eigenwaarden van X zijn om elke zin waardevol te kunnen definiëren, die grenst aan elke gegeven waarde. Dit suggereert dat de enige mogelijkheid is dat de ruimte van alle eigenwaarden van X alle reële getallen zijn, en dat P iD is, tot een faserotatie .

Om dit rigoureus te maken, is een verstandige bespreking van de beperkende ruimte van functies vereist, en in deze ruimte is dit de Stone-von Neumann-stelling: alle operators X en P die de commutatierelaties gehoorzamen kan worden gemaakt om in te werken op een ruimte van golffuncties, met P een afgeleide operator. Dit houdt in dat er altijd een Schrödinger picture beschikbaar is.

Matrixmechanica strekt zich op natuurlijke wijze gemakkelijk uit tot vele vrijheidsgraden. Elke vrijheidsgraad heeft een aparte X operator en een aparte effectieve differentiële operator P , en de golffunctie is een functie van alle mogelijke eigenwaarden van de onafhankelijke pendelende X variabelen.

Dit betekent in het bijzonder dat een systeem van N interagerende deeltjes in 3 dimensies wordt beschreven door één vector waarvan de componenten in een basis waar alle X diagonaal zijn een wiskundige functie is van 3 N -dimensionale ruimte die al hun mogelijke posities beschrijft , in feite een veel grotere verzameling waarden dan de loutere verzameling van N driedimensionale golffuncties in één fysieke ruimte. Schrödinger kwam onafhankelijk tot dezelfde conclusie en bewees uiteindelijk de gelijkwaardigheid van zijn eigen formalisme met dat van Heisenberg.

Aangezien de golffunctie een eigenschap is van het hele systeem en niet van een enkel onderdeel, is de beschrijving in de kwantummechanica niet helemaal lokaal. De beschrijving van verschillende kwantumdeeltjes heeft ze gecorreleerd, of entangled. Deze verstrengeling leidt tot vreemde correlaties tussen verre deeltjes die de klassieke Bell's ongelijkheid schenden.

Zelfs als de deeltjes maar in slechts twee posities kunnen zijn, vereist de golffunctie voor N -deeltjes 2 N complexe getallen, een voor elke totale configuratie van posities. Dit zijn exponentieel veel getallen in N , dus het simuleren van kwantummechanica op een computer vereist exponentiële bronnen. Omgekeerd suggereert dit dat het mogelijk zou kunnen zijn om kwantumsystemen van grootte N te vinden die fysiek de antwoorden berekenen op problemen die klassiek 2 N bits vereisen om op te lossen. Dit is de ambitie achter quantum computing.

Ehrenfest theorie[bewerken | brontekst bewerken]

Voor de tijdonafhankelijke operators X en P , A / ∂t = 0, dus de Heisenberg-vergelijking hierboven reduceert tot :[24]

,

waar de vierkante haken [,] de commutator aangeven. Voor een Hamiltoniaan die is, voldoen de operators X en P aan:

,

waarbij de eerste klassiek de snelheid is en de tweede klassiek de kracht of potentiële gradiënt. Deze reproduceren Hamilton's vorm van de bewegingswetten van Newton. In de Heisenberg picture voldoen de operatoren X en P aan de klassieke bewegingsvergelijkingen. U kunt de verwachtingswaarde van beide zijden van de vergelijking nemen om te zien dat, in elke staat | ψ⟩:

Dus de wetten van Newton worden precies nageleefd door de verwachte waarden van de operators in een bepaalde staat. Dit is de stelling van Ehrenfest, wat een duidelijk gevolg is van de bewegingsvergelijkingen van Heisenberg, maar minder triviaal in het Schrödinger-beeld, waar Ehrenfest het ontdekte.

Transformatietheorie[bewerken | brontekst bewerken]

In de klassieke mechanica is een canonieke transformatie van fase-ruimtecoördinaten er een die de structuur van de Poisson-haakjes behoudt. De nieuwe variabelen hebben dezelfde Poisson-haakjes met elkaar als de oorspronkelijke variabelen . Tijdsevolutie is een canonieke transformatie, aangezien de faseruimte op elk moment net zo goed een keuze van variabelen is als de faseruimte op een ander moment.

De Hamiltoniaanse stroom is de canonieke transformatie:

Aangezien de Hamiltoniaan een willekeurige functie kan zijn van x en p , zijn er zulke oneindig kleine canonieke transformaties die overeenkomen met elke klassieke grootheid G, waar G dient als de Hamiltoniaan om een stroom van punten in faseruimte te genereren voor een tijdsinterval s ,

Voor een algemene functie op faseruimte, de oneindig kleine verandering bij elke stap ds onder deze kaart is

De hoeveelheid G wordt de oneindig kleine generator van de canonieke transformatie genoemd.

In de kwantummechanica is de kwantumanaloog G nu een Hermitische matrix en de bewegingsvergelijkingen worden gegeven door commutatoren,

De oneindig kleine canoniale bewegingen kunnen formeel worden geïntegreerd, net zoals de bewegingsvergelijking van Heisenberg werd geïntegreerd,

waar U = e iGs en s een willekeurige parameter is.

De definitie van een kwantumcanonieke transformatie is dus een willekeurige unitaire verandering van basis op de ruimte van alle toestandvectoren. U is een willekeurige unitaire matrix, een complexe rotatie in faseruimte,

Deze transformaties laten de som van het absolute kwadraat van de golffunctiecomponenten invariant , terwijl ze staten nemen die veelvouden zijn van elkaar (inclusief toestanden die denkbeeldige veelvouden zijn van elkaar) naar toestanden die hetzelfde zijn veelvoud van elkaar.

De interpretatie van de matrices is dat ze fungeren als generatoren van bewegingen op de ruimte van staten .

De beweging gegenereerd door P kan bijvoorbeeld worden gevonden door de bewegingsvergelijking van Heisenberg op te lossen met P als Hamiltoniaan,

Dit zijn vertalingen van de matrix X door een veelvoud van de identiteitsmatrix,

Dit is de interpretatie van de afgeleide operator D : e iPs = e D , het exponentiële van een afgeleide operator is een vertaling (dus Lagrange's shift operator).

De operator X genereert eveneens vertalingen in P . De Hamiltoniaan genereert vertalingen in de tijd , het impulsmoment genereert rotaties in de fysieke ruimte en de operator X 2 + P 2 genereert rotations in phase space .

Wanneer een transformatie, zoals een rotatie in de fysieke ruimte, met de Hamiltoniaan commuteert, wordt de transformatie een symmetrie (achter een degeneratie) van de Hamiltoniaan genoemd - de Hamiltoniaan uitgedrukt in geroteerde coördinaten is hetzelfde als het origineel Hamiltoniaan. Dit betekent dat de verandering in de Hamiltoniaan onder de oneindig kleine symmetriegenerator L verdwijnt,

Hieruit volgt dat de verandering in de generator onder tijdvertaling ook verdwijnt,

zodat de matrix L constant in de tijd is: hij blijft behouden.

De een-op-een associatie van infinitesimale symmetrie generatoren en behoudswetten werd ontdekt door Emmy Noether voor klassieke mechanica, waar de commutatoren zijn Poisson haakjes, maar de kwantummechanische redenering is identiek. In de kwantummechanica levert elke unitaire symmetrietransformatie een behoudswet op, want als de matrix U de eigenschap heeft

dus daaruit volgt

en dat de tijdsafgeleide van U nul is - hij blijft behouden.

De eigenwaarden van unitaire matrices zijn zuivere fasen, zodat de waarde van een unitair geconserveerde grootheid een complex aantal eenheidsgroottes is en geen reëel getal. Een andere manier om dit te zeggen is dat een unitaire matrix het exponentiële is van i maal een Hermitische matrix, zodat de additief geconserveerde reële grootheid, de fase, slechts goed gedefinieerd is tot een geheel veelvoud van . Alleen wanneer de unitaire symmetriematrix deel uitmaakt van een familie die willekeurig dicht bij de identiteit komt, worden de geconserveerde reële hoeveelheden enkelvoudig gewaardeerd, en dan wordt de eis dat ze behouden blijven een veel veeleisender beperking.

Symmetrieën die continu kunnen worden verbonden met de identiteit worden continu genoemd, en vertalingen, rotaties en boosts zijn voorbeelden. Symmetrieën die niet continu verbonden kunnen worden met de identiteit zijn discreet , en de werking van ruimte-inversie, of pariteit, en ladingconjugatie zijn voorbeelden.

De interpretatie van de matrices als generatoren van canonieke transformaties is te danken aan Paul Dirac.[25] De overeenstemming tussen symmetrieën en matrices werd door Eugene Wigner als volledig aangetoond, als antiunitaire matrices die symmetrieën omvatten die tijd omvatten omkering zijn inbegrepen.

Selectieregels[bewerken | brontekst bewerken]

Het was Heisenberg fysiek duidelijk dat de absolute vierkanten van de matrixelementen van , de Fourier-coëfficiënten van de oscillatie, de emissiesnelheid van elektromagnetische straling zouden opleveren.

In de klassieke limiet van grote banen, als een lading met positie en lading oscilleert naast een gelijke en tegengestelde lading op positie 0, het momentane dipoolmoment is , en de tijdsvariatie van dit moment vertaalt zich direct in de ruimte-tijdvariatie van het vectorpotentiaal, wat resulteert in genest uitgaande sferische golven.

Voor atomen is de golflengte van het uitgezonden licht ongeveer 10.000 keer de atoomstraal en het dipoolmoment is de enige bijdrage aan het stralingsveld, terwijl alle andere details van de atomaire ladingsverdeling kunnen worden genegeerd.

Het negeren van terugreactie, het vermogen uitgestraald in elke uitgaande modus is een som van afzonderlijke bijdragen van het kwadraat van elke onafhankelijke tijd Fourier-modus van ,

In de weergave van Heisenberg zijn de Fourier-coëfficiënten van het dipoolmoment de matrixelementen van . Deze correspondentie stelde Heisenberg in staat om de regel te geven voor de overgangsintensiteiten, de fractie van de tijd dat, vanaf een begintoestand , een foton wordt uitgezonden en het atoom naar een eindtoestand springt ,

Hierdoor kon de grootte van de matrixelementen statistisch worden geïnterpreteerd: ze geven de intensiteit van de spectraallijnen, de kans op kwantumsprongen door de emissie van dipoolstraling .

Aangezien de overgangssnelheden worden gegeven door de matrixelementen van , waar nul is, mag de bijbehorende overgang afwezig zijn. Deze werden de selectieregels genoemd, die een puzzel waren tot de komst van matrixmechanica.

Een willekeurige toestand van het waterstofatoom, spin negeren, wordt aangeduid met | n ; ℓ, m ⟩, waarbij de waarde van ℓ een maat is voor het totale orbitale impulsmoment en m is de z - component, die de oriëntatie van de baan definieert. De componenten van het impulsmoment pseudovector zijn

waarbij de producten in deze uitdrukking onafhankelijk zijn van orde en echt, omdat verschillende componenten van X en P pendelen.

De commutatierelaties van 'L' met alle drie de coördinaatmatrices X, Y, Z (of met een willekeurige vector) zijn gemakkelijk te vinden,

,

wat bevestigt dat de operator 'L' rotaties genereert tussen de drie componenten van de vector van coördinaatmatrices 'X' .

Hieruit kan de commutator van L z en de coördinaatmatrices X, Y, Z worden afgelezen,

,
.

Dit betekent dat de hoeveelheden X + iY , X iY hebben een eenvoudige afkoopregel

,
.

Net als de matrixelementen van X + iP en X − iP voor de harmonische oscillator Hamiltonian, impliceert deze commutatiewet dat deze operatoren alleen bepaalde niet-diagonale matrixelementen hebben in toestanden van bepaalde m ,

wat betekent dat de matrix (X + iY) een eigenvector van L z neemt met eigenwaarde m naar een eigenvector met eigenwaarde m + 1. Op dezelfde manier ( X iY ) verlaag m met één eenheid, terwijl Z de waarde van m niet verandert.

Dus in een basis van | ℓ, m⟩ staat waar L 2 en L z hebben bepaalde waarden, de matrixelementen van een van de drie componenten van de positie zijn nul, behalve wanneer hetzelfde is of verandert met één eenheid.

Dit legt een beperking op de verandering in het totale impulsmoment. Elke toestand kan zo worden gedraaid dat het impulsmoment zoveel mogelijk in de z - richting is, waarbij m = ℓ. Het matrixelement van de positie die inwerkt op | ℓ, m⟩ kan alleen waarden van m produceren die groter zijn met één eenheid, zodat als de coördinaten worden geroteerd zodat de eindtoestand | is ℓ ', ℓ' ⟩, de waarde van ℓ 'kan maximaal één groter zijn dan de grootste waarde van ℓ die in de begintoestand voorkomt. Dus ℓ ’is maximaal ℓ + 1.

De matrixelementen verdwijnen voor ℓ ’> ℓ + 1, en het omgekeerde matrixelement wordt bepaald door Hermiticiteit, dus deze verdwijnen ook wanneer ℓ’ <ℓ − 1: dipoolovergangen zijn verboden met een verandering in impulsmoment van meer dan één eenheid.

Somregels[bewerken | brontekst bewerken]

De bewegingsvergelijking van Heisenberg bepaalt de matrixelementen van P in de Heisenberg-basis uit de matrixelementen van X .

,

die het diagonale deel van de commutatierelatie verandert in een somregel voor de grootte van de matrixelementen:

.

Dit levert een relatie op voor de som van de spectroscopische intensiteiten van en naar een bepaalde toestand, hoewel om absoluut correct te zijn, bijdragen van de stralingsopvangkans voor ongebonden verstrooiingstoestanden moeten in de som worden opgenomen: