Квантовая теория поля

Из Википедии, бесплатной энциклопедии

Ква́нтовая тео́рия по́ля (КТП) — раздел физики, изучающий поведение квантовых систем с бесконечно большим числом степеней свободы — квантовых полей; является теоретической основой описания микрочастиц, их взаимодействий и превращений. На языке КТП основываются физика высоких энергий и физика элементарных частиц, её математический аппарат используется в физике конденсированного состояния[⇨]. КТП в виде Стандартной модели в настоящее время является единственной экспериментально подтверждённой теорией, способной описывать и предсказывать результаты экспериментов при достижимых в современных ускорителях высоких энергиях[⇨].

Квантовая теория поля — результат работы нескольких поколений физиков на протяжении большей части XX века. Её развитие началось в 1920-х годах с описания взаимодействий между светом и электронами, что привело к появлению первой КТП — квантовой электродинамики[⇨]. Вскоре обнаружилось первое серьёзное теоретическое препятствие для построения более строгой теории, связанное с появлением и сохранением различных бесконечностей при вычислении рядов теории возмущений. Эта проблема нашла решение только в 50-х годах XX века после изобретения процедуры перенормировки[⇨]. Вторым серьёзным препятствием стала очевидная неспособность КТП описать слабые и сильные взаимодействия, до такой степени, что некоторые теоретики призывали отказаться от теоретико-полевого подхода[1][2]. Развитие калибровочной теории в 70-х годах XX века привело к возрождению КТП в виде Стандартной модели элементарных частиц[⇨].

Математический аппарат КТП строится на основе прямого произведения гильбертовых пространств состояний (пространство Фока) квантового поля и действующих в нём операторов. В отличие от квантовой механики, где исследуют свойства волновой функции «микрочастиц» как неких неуничтожимых объектов; в КТП основными объектами исследования являются квантовые поля и их элементарные возбуждения, а главную роль играет аппарат вторичного квантования с операторами рождения и уничтожения частиц, действующими в пространстве состояний Фока[⇨]. Аналогом квантовомеханической волновой функции в КТП является полевой оператор, способный действовать на вакуумный вектор фоковского пространства и порождать одночастичные возбуждения квантового поля. Физическим наблюдаемым величинам здесь также соответствуют операторы, составленные из полевых операторов[⇨].

История[править | править код]

Основное уравнение квантовой механики — уравнение Шрёдингера — является релятивистски неинвариантным, что видно из несимметричного вхождения времени и пространственных координат в уравнение[3]. Оно соответствует классической связи кинетической энергии и импульса частицы . Релятивистское соотношение между энергией и импульсом[en] имеет вид [4]. Предполагая, что оператор импульса в релятивистском случае такой же, как и в нерелятивистской области, и, используя эту формулу для построения релятивистского гамильтониана по аналогии[5], в 1926 году было предложено релятивистски инвариантное уравнение для свободной частицы с нулевым спином (уравнение Клейна — Гордона — Фока). Однако проблема предложенного уравнения заключается в том, что волновую функцию здесь сложно интерпретировать как амплитуду вероятности, потому что плотность вероятности не будет положительно определённой величиной во всём пространстве, что связано с наличием второй производной по времени[6][7].

Несколько иной подход был реализован в 1928 году П. Дираком, который пытался получить дифференциальное уравнение первого порядка, где обеспечено равноправие временной координаты и пространственных координат[6]. Поскольку оператор импульса пропорционален первой производной по координатам, то гамильтониан Дирака должен быть линейным по оператору импульса[8]. С учётом того же релятивистского соотношения энергии и импульса на квадрат этого оператора налагаются ограничения. Соответственно и линейные «коэффициенты» также должны удовлетворять определённому ограничению, а именно их квадраты должны быть равны единице и быть взаимно антикоммутативны. Таким образом, они точно не могут быть числами, но могут быть матрицами, причём размерности не менее 4, а волновая функция — четырёхкомпонентным объектом, получившим название биспинора. В результате было получено уравнение Дирака, в котором участвуют 4-матрицы Дирака и четырёхкомпонентная волновая функция. Формально уравнение Дирака записывается в виде, аналогичном уравнению Шрёдингера с гамильтонианом Дирака[8]. Однако это уравнение, как и уравнение Клейна — Гордона, имеет решения с отрицательными энергиями[9]. Данное обстоятельство явилось причиной для предсказания существования античастиц, что позже подтвердилось в эксперименте (открытие позитрона)[10]. Наличие античастиц есть следствие релятивистского соотношения между энергией и импульсом[11].

Релятивистские уравнения Клейна — Гордона и Дирака рассматриваются в КТП как уравнения для операторных полевых функций[К 1]. Соответственно вводится в рассмотрение «новое» гильбертово пространство состояний системы квантовых полей, на которые действуют полевые операторы. Иногда эту процедуру квантования полей называют «вторичным квантованием»[13][14][К 2].

Теоретические основы[править | править код]

Линии магнитного поля визуализируемые с помощью железных опилок. Когда лист бумаги посыпают железными опилками и помещают над постоянным магнитом, то опилки выравниваются в соответствии с направлением магнитного поля, образуя дуги.

В основе квантовой теории поля лежат классическая теория поля, квантовая механика и специальная теория относительности (СТО)[16][17].

В основе самой ранней успешной классической теории поля лежал закон всемирного тяготения Ньютона, несмотря на полное отсутствие концепции полей в его трактате 1687 года Philosophiæ Naturalis Principia Mathematica[18]. Описанная И. Ньютоном сила тяжести представляет собой «действие на расстоянии», и её влияние на далёкие объекты происходит мгновенно, независимо от расстояния. Однако в переписке с Р. Бентли И. Ньютон заявлял, что «немыслимо, чтобы неодушевлённая грубая материя без посредничества чего-то ещё, что не является материальным, действовала бы на другую материю и влияла на неё без взаимного контакта»[19]. Только в XVIII веке физики-теоретики открыли удобное описание гравитации на основе полей — числовую величину (вектор), присвоенную каждой точке пространства, указывающую действие гравитации на любую пробную частицу в этой точке. Однако это считалось просто математическим трюком[18].

Понятие о полях обрело более формальное описание с развитием электромагнетизма в XIX веке. М. Фарадей ввёл английский термин «поле» (англ. field) в 1845 году. Он представил поле как обладающее физическими эффектами свойство пространства (даже если оно лишено материи). Фарадей выступал против «действия на расстоянии» (дальнодействия) и предполагал, что взаимодействия между объектами происходят через заполняющие пространство «силовые линии». Это описание полей сохранилось по сей день[19][20][21].

Теория классического электромагнетизма приобрела завершённую форму в 1864 году в виде уравнений Максвелла, которые описывали взаимосвязь между электрическим полем, магнитным полем, электрическим током и электрическим зарядом. Уравнения Максвелла подразумевали существование электромагнитных волн — явления, при котором электрические и магнитные поля распространяются из одной точки пространства в другую с конечной скоростью света. Таким образом, действие на расстоянии было окончательно опровергнуто[22][23]. В теории Максвелла все взаимодействия передавались через эфир — среду с необычными механическими свойствами. Многочисленные экспериментальные проверки не подтвердили никаких движений среды, что послужило причиной отказа от этой идеи, — для объяснения эффектов специальной теории относительности оказалось достаточно пустоты. Однако в современной теории пустота — это вакуум, который, по словам А. Мигдала, можно было назвать эфиром, если бы не путаница со старым понятием[24].

Несмотря на успех электродинамики, она не смогла объяснить ни дискретных линий в атомных спектрах, ни распределение излучения чёрного тела[en]* на разных длинах волн[25]. Исследование М. Планком излучения абсолютно чёрного тела положило начало квантовой механике. Он рассматривал атомы, которые поглощают и излучают электромагнитное излучение, как крошечные осцилляторы, энергия которых может принимать только серию дискретных, а не непрерывных значений. Сегодня они известны как квантовые гармонические осцилляторы. Этот процесс ограничения энергии дискретными значениями называется квантованием[26]. Основываясь на этой идее, А. Эйнштейн в 1905 году предложил объяснение фотоэффекта, согласно которому свет состоит из отдельных пакетов энергии, называемых фотонами. Это означало, что электромагнитное излучение, описываемое в виде волн в классическом электромагнитном поле, также существует в форме частиц[27][28].

В том же году, когда была опубликована статья о фотоэффекте, Эйнштейн опубликовал свою специальную теорию относительности, пересекающуюся с электродинамикой Максвелла. Новые правила, называемые преобразованиями Лоренца, описывали изменение временных и пространственных координат событий при изменении скорости наблюдателя, и различие между временем и пространством оказалось размыто. Эйнштейн предположил, что все физические законы должны быть одинаковыми для движущихся при различных скоростях наблюдателей, то есть, что физические законы инвариантны относительно преобразований Лоренца[23].

В 1913 году Н. Бор представил модель атомной структуры, в которой электроны внутри атомов могут принимать только серию дискретных, а не непрерывных энергий[28]. Это ещё один пример квантования. Модель Бора успешно объяснила дискретную природу спектральных линий атомов. В 1924 году Л. де Бройль выдвинул гипотезу дуальности волна-частица, согласно которой микроскопические частицы проявляют как волнообразные, так и частицеподобные свойства при различных обстоятельствах[27]. Объединив эти различные идеи, между 1925 и 1926 годами была сформулирована новая научная теория: квантовая механика. Существенный вклад в новую теорию внесли М. Планк, Л. де Бройль, В. Гейзенберг, М. Борн, Э. Шрёдингер, П. Дирак и В. Паули[29].

С экспериментальной точки зрения, уравнение Шрёдингера, лежащее в основании квантовой механики, могло объяснить вынужденное излучение атомов, когда электрон испускает новый фотон под действием внешнего электромагнитного поля, но оно не могло объяснить спонтанное излучение, при котором энергия электрона спонтанно уменьшается и происходит излучение фотона даже без действия внешнего электромагнитного поля. Теоретически уравнение Шредингера не могло описывать фотоны и оказалось несовместимо с принципами СТО — оно рассматривает время как обычный числовой параметр, одновременно представляя пространственные координаты линейными операторами[30][31].

Квантовая электродинамика[править | править код]

КТП началась с изучения электромагнитных взаимодействий, поскольку электромагнитное поле было единственным известным классическим полем в 1920-х годах[32].

Благодаря работам М. Борна, В. Гейзенберга и П. Йордана в 1925—1926 годах была разработана квантовая теория, описывающая свободное (не взаимодействующее с материей) электромагнитное поле, используя каноническое квантование и рассматривая электромагнитное поле как набор бесконечного числа квантовых гармонических осцилляторов. Однако такая теория, не учитывавшая взаимодействия, была не в состоянии сделать количественные предсказания о реальном мире[33].

В своей основополагающей статье 1927 года «Квантовая теория испускания и поглощения излучения» П. Дирак ввёл термин квантовая электродинамика (КЭД) — теория, в которой к условиям, описывающим свободное электромагнитное поле, добавляется дополнительный член взаимодействия между плотностью электрического тока и электромагнитным векторным потенциалом[34]. Используя теорию возмущений первого порядка, он успешно объяснил явление спонтанного излучения. Согласно принципу неопределённости, квантовые гармонические осцилляторы не могут оставаться неподвижными, но они обладают ненулевым минимумом энергии и всегда должны колебаться, даже в состоянии с самой низкой энергией (в основном состоянии). Следовательно, даже в идеальном вакууме остаётся колеблющееся электромагнитное поле с нулевой энергией. Именно такие квантовые флуктуации электромагнитных полей в вакууме «стимулируют» спонтанное излучение электронов в атомах. Теория Дирака[35] оказалась чрезвычайно успешной в объяснении как испускания, так и поглощения излучения атомами[К 3]. Применяя теорию возмущений второго порядка, он смог учесть рассеяние фотонов и объяснил другие квантовые эффекты, такие как резонансная флуоресценция[en] и нерелятивистское комптоновское рассеяние. Тем не менее применение теории возмущений в более высоких порядках столкнулось с бесконечностями при вычислениях[34].

В 1927 году Ф. Хунд (при расчётах основного состояния двухъямного потенциала)[37] и независимо от него Л. Мандельштам и М. Леонтович[38] впервые выявили «туннельный эффект». В 1928 году Г. Гамовым (который знал об результатах Л. Мандельштама и М. Леонтовича[39]) и американскими учёными Р. Гёрни[en] и Э. Ко́ндоном при разработке теории альфа-распада были получены первые формулы эффекта туннелирования[40][41]. Применив идею о квантово-механическом проникновении волновой функции альфа-частицы через кулоновский барьер, Гамову удалось показать, что частицы даже с не очень большой энергией могут с определённой вероятностью вылетать из ядра[40].

В 1928 году П. Дирак записал волновое уравнение, описывающее релятивистские электроны, — уравнение Дирака. Оно имело важные следствия: спин электрона равен 1/2 (в единицах приведённой постоянной Планка ħ); g-фактор электрона равен 2. Это привело к правильной формуле Зоммерфельда[en] для тонкой структуры атома водорода; и уравнение Дирака можно использовать для вывода формулы Клейна — Нисины, описывающей релятивистское комптоновское рассеяние. Несмотря на то, что результаты находились в согласии с теорией, оставались и нерешённые вопросы — в частности, в теории предполагалось существование состояний с отрицательной энергией, которые могли бы сделать атомы нестабильными, поскольку они, в этом случае, всегда могли распадаться на состояния с более низкой энергией с излучением[42].

В то время преобладало мнение, что мир состоит из двух очень разных ингредиентов: материальных частиц (таких как электроны) и квантовых полей (таких как фотоны). Материальные частицы считались вечными, а их физическое состояние описывалось вероятностями нахождения каждой частицы в любой заданной области пространства или диапазоне скоростей. С другой стороны, фотоны считались просто возбуждёнными состояниями лежащего в основе квантованного электромагнитного поля и могли свободно рождаться или уничтожаться. Между 1928 и 1930 годами П. Йордан, Ю. Вигнер, В. Гейзенберг, В. Паули и Э. Ферми обнаружили, что материальные частицы также можно рассматривать как возбуждённые состояния квантовых полей. Как фотоны являются возбуждёнными состояниями квантованного электромагнитного поля, так и каждому типу частиц соответствует своё квантовое поле: электронное поле, протонное поле и так далее. Имея достаточно энергии, теперь можно было бы создавать материальные частицы. Основываясь на этой идее, Э. Ферми в 1932 году предложил объяснение бета-распада, известное как взаимодействие Ферми. Ядра атомов не содержат электронов сами по себе, но в процессе распада электрон создаётся из окружающего электронного поля, аналогично рождённому из окружающего электромагнитного поля фотону при излучении возбуждённого атома[43].

В 1930 году Д. Иваненко с В. Амбарцумяном высказали гипотезу рождения массивных и элементарных частиц в процессе их взаимодействия (включая рождение электрона при бета-распаде), что исключало господствовавшую до этого теорию их спонтанного рождения и легло в основу КТП и теории элементарных частиц[44][45]. Тогда же П. Дирак и другие поняли, что состояния с отрицательной энергией, появляющиеся из решений уравнения Дирака, можно интерпретировать как частицы с той же массой, что и электроны, но с противоположным электрическим зарядом. Это не только обеспечило стабильность атомов, но и стало первым предсказанием существования антивещества. Позитроны были обнаружены в 1932 году К. Андерсоном в космических лучах[43]. При наличии достаточного количества энергии, например, путём поглощения фотона, можно создать электрон-позитронную пару, процесс, называемый рождением пары; обратный процесс, аннигиляция, также может происходить с испусканием фотона. Это показало, что количество частиц не обязательно остаётся фиксированным во время взаимодействия[46]. При квантовании полей Дирака с учётом запрета Паули не возникает проблем с отрицательными энергиями из-за симметричного описания электронов и позитронов, как показал В. Гейзенберг в 1934 году[47]. Поэтому КТП естественным образом включает античастицы в свой формализм[48], и уравнения Дирака и Клейна — Гордона следует понимать как уравнения для полевых операторов, действующих на вектор состояний квантовых полей, которые удовлетворяют уравнению Шрёдингера[47].

Бесконечности и перенормировка[править | править код]

Р. Оппенгеймер показал в 1934 году, что пертурбативные (то есть, основанные на теории возмущений) вычисления в более высоких порядках КЭД всегда приводят к бесконечным величинам, например для собственно-энергетической части[en] электрона и нулевой энергии вакуума для электронного и фотонного полей[49]. Это означало, что существующие вычислительные методы не могли должным образом справиться с взаимодействиями, в которых принимали участие фотоны с чрезвычайно высокими импульсами[50]. Проблема нашла решение 20 лет спустя, когда был разработан системный подход к устранению таких бесконечностей[51]. Между 1934 и 1938 годами Э. Штюкельберг опубликовал серию статей, в которых была представлена релятивистски инвариантная формулировка КТП. В 1947 году Штюкельберг также независимо разработал полную процедуру перенормировки для устранения расходимостей. Однако в то время эти достижения не были поняты и признаны теоретическим сообществом[52].

В 1947 году У. Лэмб и Р. Ризерфорд измерили малую разницу в энергетических уровнях 2S1/2 и 2P1/2 атома водорода, также названную лэмбовским сдвигом. Пренебрегая вкладом фотонов, энергия которых превышает массу электрона, Г. Бете успешно оценил численное значение этой разницы[52][53]. Впоследствии Н. Кролл[en], У. Лэмб, Дж. Френч[en] и В. Вайскопф использовали другой метод для вывода, в котором бесконечности взаимно сокращались и получалась конечная величина. Однако этот метод был громоздким и ненадёжным, и его нельзя было обобщить на другие вычисления[54][55].

Прорыв в конечном итоге произошёл примерно в 1950 году, когда Дж. Швингер, Р. Фейнман, Ф. Дайсон и С. Томонага разработали более приемлемый метод устранения бесконечностей. Его основная идея состоит в замене вычисленных значений массы и заряда электрона, какими бы бесконечными они ни были, их конечными экспериментальными значениями. Эта систематическая вычислительная процедура известна как перенормировка и может применяться к произвольному порядку в теории возмущений[51]. С. Томонага так описал это в своей Нобелевской лекции[56]:

Поскольку эти части модифицированной массы и заряда из-за полевых вкладов [становятся бесконечными], их невозможно вычислить с помощью теории. Однако масса и заряд, наблюдаемые в экспериментах, являются не исходной массой и зарядом, а массой и зарядом, изменёнными полевыми вкладами, и они конечны. С другой стороны, масса и заряд, фигурирующие в теории, являются… значениями, модифицированными полевыми вкладами. Поскольку это так, и, в частности, поскольку теория не может вычислить модифицированные массу и заряд, мы можем принять процедуру феноменологической подстановки их экспериментальных значений… Эта процедура называется перенормировкой массы и заряда … После долгих и кропотливых вычислений, менее искусных, чем у Швингера, мы получили результат … который согласуется с американцами.

С применением процедуры перенормировки были окончательно проведены расчёты, объясняющие аномальный магнитный момент электрона (отклонение g-фактора электрона от 2) и поляризацию вакуума. Эти результаты в значительной степени совпадали с экспериментальными измерениями, что ознаменовало конец «войны с бесконечностями»[54].

В то же время Р. Фейнман ввёл в обиход формулировку квантовой теории через интегралы по траекториям и диаграммы Фейнмана[57]. Последние используются для визуализации вычислений в теории возмущений. Каждую диаграмму можно интерпретировать как пути частиц и их взаимодействия, причём каждой вершине и линии ставится в соответствие определённое математическое выражение, а произведение этих выражений даёт амплитуду рассеяния процесса, представленного диаграммой[58].

Именно с изобретением процедуры перенормировки и диаграммной техники Фейнмана КТП получила законченную теоретическую основу[57]. Многие теоретики после 1949 года из-за успеха КЭД полагали, что КТП вскоре сможет объяснить все микроскопические явления, а не только взаимодействия между элементарными частицами КЭД. Вопреки этому оптимизму, КТП вступила в очередной период депрессии, который длился почти два десятилетия[59].

Первым препятствием оказалась ограниченная применимость процедуры перенормировки. В вычислениях теории возмущений в КЭД все бесконечные величины можно исключить путём переопределения небольшого числа физических величин (массы и заряда электрона). Ф. Дайсон доказал в 1949 году, что это возможно только для «перенормируемых теорий», примером которых является КЭД. Однако большинство теорий, включая теорию слабого взаимодействия Ферми, неперенормируемы[59].

Вторая серьёзная проблема возникает из ограниченной применимости метода диаграмм Фейнмана. Для сходимости рядов необходимо, чтобы константа связи была достаточно малым числом. Константа связи в КЭД — это постоянная тонкой структуры α ≈ 1/137, величина которой позволяет учитывать только простейшие диаграммы Фейнмана низшего порядка. Напротив, константа связи при сильном взаимодействии примерно равна единице, что делает сложные диаграммы Фейнмана более высокого порядка столь же важными, как и простые. Таким образом, не оказалось возможности получить надёжные количественные предсказания в задачах с сильным взаимодействием при использовании теории возмущений[60].

Столкнувшись с этими бесконечностями, Дж. Уилер и В. Гейзенберг предложили в 1937 и 1943 годах соответственно заменить проблематичную КТП так называемой теорией S-матриц[en]. Поскольку конкретные детали микроскопических взаимодействий недоступны для наблюдений, теория должна пытаться описать только отношения между небольшим количеством наблюдаемых (например, энергией атома) во взаимодействии, а не заниматься микроскопическими деталями взаимодействия. В 1945 году Р. Фейнман и Дж. Уилер смело предложили полностью отказаться от КТП и предложили действие на расстоянии в качестве механизма взаимодействия частиц[61][62]. В то время КТП использовалась эвристически как руководящий принцип, но не как основа для количественных расчётов[60].

Стандартная модель[править | править код]

Элементарные частицы Стандартной модели: шесть типов кварков, шесть типов лептонов, четыре типа калибровочных бозонов, несущих фундаментальные взаимодействия, а также бозон Хиггса, который наделяет элементарные частицы массой.

В 1954 году Я. Чжэньнин и Р. Миллс обобщили локальную калибровочную симметрию КЭД, что привело к созданию неабелевых калибровочных теорий (теорий Янга — Миллса), основанных на более сложных локальных группах симметрии[63]. В КЭД электрически заряженные частицы взаимодействуют посредством обмена фотонами, тогда как в неабелевой калибровочной теории частицы, несущие новый тип «заряда», взаимодействуют посредством обмена безмассовыми калибровочными бозонами. В отличие от фотонов, эти калибровочные бозоны сами несут заряд[64][65].

В 1960 году Ш. Глэшоу разработал неабелеву калибровочную теорию, объединившую электромагнитное и слабое взаимодействия. В 1964 году А. Салам и Дж. Уорд пришли к той же теории другим путём, но их теория была неперенормируемой[66]. П. Хиггс, Р. Браут, Ф. Энглер, Дж. Гуральник, К. Хаген[en] и Т. Киббл в своих знаменитых статьях в Physical Review Letters[en] предложили, что калибровочная симметрия в теориях Янга — Миллса нарушается с помощью механизма, называемого спонтанным нарушением симметрии, благодаря которому калибровочные бозоны могут приобретать массу[67]. Объединив более раннюю теорию Глэшоу, Салама и Уорда с идеей спонтанного нарушения симметрии, С. Вайнберг и независимо А. Салам в 1967 году[68] создали теорию, описывающую электрослабые взаимодействия между всеми лептонами и влияние бозона Хиггса. Его теория была вначале проигнорирована[66][63], пока интерес к ней не вернул в 1971 году Г. т’Хоофт, который доказал перенормируемость неабелевых калибровочных теорий. Для включения кварков теорию электрослабого взаимодействия С. Вайнберга и А. Салама обобщили Ш. Глэшоу, И. Илиопулос и Л. Майани в 1970 году, что ознаменовало завершение её построения[66]. Г. т’Хоофт и М. Велтман развили технику рамерной регуляризации для расчёта перенормируемых диаграмм. Эти результаты привели к завершению построения теории возмущений для унитарной матрицы рассеяния в теориях с калибровочными полями[68].

Х. Фрич, М. Гелл-Манн и Г. Лойтвилер[en] в 1971 году обнаружили, что некоторые явления, связанные с сильным взаимодействием, также могут быть объяснены в рамках неабелевой калибровочной теории. Так появилась квантовая хромодинамика (КХД). В 1973 году Д. Гросс, Ф. Вильчек и Х. Политцер показали, что неабелевы калибровочные теории асимптотически свободны, когда при перенормировке константа связи сильного взаимодействия уменьшается с увеличением энергии взаимодействия. Подобные открытия были сделаны несколько раз в прошлом, но они оказались незамеченными[69]. Таким образом, по крайней мере, при высоких энергиях, константа связи в КХД становится достаточно малой, чтобы гарантировать применимость разложения в ряд теории возмущений, что приводит к возможности получения количественных оценок для сильного взаимодействия[64]. Переносчиками взаимодействия между кварками служат восемь квантов калибровочного поля, которые были названы глюонами[70].

Эти теоретические открытия привели к возрождению интереса к КТП. Полная теория, включающая теорию электрослабого взаимодействия и хромодинамику, сегодня называется Стандартной моделью элементарных частиц[71]. Стандартная модель успешно описывает все фундаментальные взаимодействия, кроме гравитации, а её многочисленные предсказания получили точное экспериментальное подтверждение в последующие десятилетия[72]. Существование бозона Хиггса, который занимает центральное место в механизме спонтанного нарушения симметрии, было окончательно подтверждено в 2012 году экспериментами в ЦЕРНе, подводя итог полной проверке всех составляющих Стандартной модели[73].

Прочие разработки[править | править код]

В 1970-х годах появились разработки непертурбативных методов в неабелевых калибровочных теориях. Монополь 'т Хоофта — Полякова был открыт теоретически Г. 'т Хоофтом и А. Поляковым, трубки потока[en] — Х. Нильсеном[en] и П. Олесеном, инстантоны — Поляковым и соавторами. Исследование этих объектов недоступно с помощью теории возмущений[74].

Суперсимметрия также появилась в то же время. Первая суперсимметричная КТП в четырёх измерениях была построена Ю. Гольфандом и Е. Лихтманом в 1970 году, но их результат не вызвал широкого интереса из-за «железного занавеса». Суперсимметрия получила широкое распространение в теоретическом сообществе только после работы Ю. Весса и Б. Зумино[en] в 1973 году[75].

Среди четырёх фундаментальных взаимодействий гравитация остаётся единственным, которому не хватает последовательного описания в рамках КТП[76]. Хотя гравитон можно рассматривать как ещё одну элементарную частицу[77], но гравитация остаётся неперенормируемой теорией[76]. Различные попытки создания теории квантовой гравитации привели к развитию теории струн[78], которая сама относится к типу двумерной КТП с конформной симметрией[en][79]. Дж. Шерк[en] и Дж. Шварц впервые предложили в 1974 году, что теория струн может быть квантовой теорией гравитации[80].

Физика конденсированного состояния[править | править код]

Хотя КТП возникла в результате изучения взаимодействий между элементарными частицами, то есть используется для расстояний много меньших атомарных, она успешно применяется к другим физическим системам, особенно к многочастичным системам в физике конденсированного состояния. Исторически механизм спонтанного нарушения симметрии Хиггса был результатом применения Й. Намбу теории сверхпроводников к элементарным частицам, в то время как концепция перенормировки возникла благодаря исследованиям фазовых переходов второго рода в веществе[81].

Вскоре после введения фотонов А. Эйнштейн выполнил процедуру квантования колебаний в кристалле, что привело к появлению первой квазичастицы в твёрдом теле — фонона. Л. Ландау утверждал, что низкоэнергетические возбуждения во многих системах конденсированной материи можно описывать в терминах взаимодействий между набором квазичастиц. Диаграммный метод КТП Фейнмана естественным образом подошёл для анализа различных явлений в конденсированных средах[82]. Калибровочная теория используется для описания квантования магнитного потока в сверхпроводниках, удельного сопротивления в квантовом эффекте Холла, а также связи между частотой и напряжением при нестационарном эффекте Джозефсона для переменного тока[82].

Классический формализм теории поля[править | править код]

Лагранжев формализм[править | править код]

Классическое поле является функцией пространственных и временных координат[83]. Примеры включают гравитационное поле в ньютоновской гравитации g(x, t), электрическое поле E(x, t) и магнитное поле B(x, t) в классической электродинамике. Классическое поле можно рассматривать как числовую величину, приписываемую каждой точке пространства, которая изменяется во времени. Следовательно, оно имеет бесконечно много степеней свободы[К 4][83].

В лагранжевой механике функция Лагранжа L является функцией времени и динамических переменных системы и записывается в виде суммы по всем материальным точкам системы[84]. В случае непрерывной системы, каковым является поле — центральное понятие теории[85], сумма заменяется пространственным интегралом от плотности функции Лагранжа — лагранжевой плотности

где жирным шрифтом выделены пространственные компоненты 4-вектора координат, а нулевая компонента — время. Поэтому в теории поля лагранжианом называют обычно лагранжеву плотность[86][87]. Действие по определению есть интеграл по времени от лагранжиана[84]

то есть действие в теории поля есть четырёхмерный интеграл от лагранжевой плотности по четырёхмерному пространству-времени[84].

Поле описывается полевой функцией (выступает в качестве динамической переменной), которое может быть вещественной или комплексной скалярной (псевдоскалярной), векторной, спинорной или иной функцией. В теории поля предполагается, что лагранжиан зависит только от динамических переменных — от полевой функции и её производных, то есть отсутствует явная зависимость от координат, наличие которой нарушало бы релятивистскую инвариантность. Локальность теории требует, чтобы лагранжиан содержал конечное количество производных и не содержал, например, интегральных зависимостей. Более того, чтобы получить дифференциальные уравнения не выше второго порядка (в целях соответствия классической механике), предполагается, что лагранжиан зависит только от полевой функции и её первых производных ()[88],

Принцип наименьшего действия (принцип Гамильтона) означает, что реальное изменение состояния системы происходит таким образом, чтобы действие было стационарным (вариация действия равна нулю). Этот принцип позволяет получить полевые уравнения движения — уравнения Эйлера — Лагранжа[К 5][86][88]:

Поскольку физические свойства системы определяются действием, в котором лагранжиан является подынтегральным выражением, то данному лагранжиану соответствует единственное действие, но не наоборот. А именно, лагранжианы, отличающиеся друг от друга полной 4-дивергенцией некоторого 4-вектора , физически эквивалентны[88].

Лагранжиан системы полей[править | править код]

Лагранжиан системы невзаимодействующих (свободных) полей есть просто сумма лагранжианов отдельных полей. Уравнения движения для системы свободных полей — это совокупность уравнений движения отдельных полей. Взаимодействие полей учитывается в лагранжиане добавлением дополнительных нелинейных слагаемых. Таким образом, полный лагранжиан системы взаимодействующих полей является суммой свободного лагранжиана и лагранжиана взаимодействия [89]:

Введение лагранжиана взаимодействия приводит к неоднородности и нелинейности уравнений движения. Лагранжианы взаимодействия обычно являются полиномиальными функциями участвующих полей (степени не ниже третьей), умноженными на некоторую числовую константу — так называемую константу связи. Лагранжиан взаимодействия может быть пропорционален третьей или четвёртой степени самой полевой функции, или произведению различных полевых функций[90].

Гамильтонов формализм[править | править код]

От лагранжева формализма можно перейти к гамильтоновому по аналогии с лагранжевой и гамильтоновой механикой. Полевая функция здесь выступает в качестве обобщённой (канонической) координаты. Соответственно необходимо определить также и обобщённую (каноническую) плотность импульса , сопряжённую этой координате согласно стандартной формуле (точка над функцией обозначает частную производную по времени)[91][92][87]:

Тогда плотность гамильтониана поля равна по определению[91]

Уравнения движения в гамильтоновом подходе имеют вид[93]:

Динамика любых величин в рамках гамильтонова формализма подчиняется следующему уравнению:

где фигурными скобками обозначена скобка Пуассона[93]. При этом для самих функций и выполнено следующее[92][94]:

Соотношения с участием скобок Пуассона обычно и являются основой для квантования полей, когда полевые функции заменяются соответствующими операторами, а скобки Пуассона — на коммутатор операторов[95].

Симметрии в квантовой теории поля[править | править код]

Определение и виды симметрий[править | править код]

Симметриями в квантовой теории поля называются преобразования координат и (или) полевых функций, относительно которых инвариантны уравнения движения, а значит, инвариантно действие. Сами преобразования при этом образуют группу[96]. Симметрии называются глобальными, если соответствующие преобразования не зависят от 4-координат[97]. В противном случае говорят о локальных симметриях[98][99]. Симметрии могут быть дискретными или непрерывными[100]. В последнем случае группа преобразований является непрерывной (топологической), то есть в группе задана топология, относительно которой групповые операции непрерывны[101]. В квантовой теории поля однако обычно используется более узкий класс групп — группы Ли, в которых введена не только топология, но и структура дифференцируемого многообразия. Элементы таких групп можно представить как дифференцируемые (голоморфные или аналитические) функции конечного числа параметров. Группы преобразований обычно рассматриваются в некотором представлении — элементам групп соответствуют операторные (матричные) функции параметров[102].

Дискретные симметрии. CPT-теорема[править | править код]

Наиболее важное значение имеют следующие виды преобразований[103]:

  • C — зарядовое сопряжение — замена полевых функций на сопряжённые или замена частиц на античастицы.
  • P — чётность — изменение знаков пространственных компонент на противоположный.
  • T — обращение времени — изменение знака временной компоненты.

Доказано, что в локальной квантовой теории поля имеет место -симметрия, то есть инвариантность относительно одновременного применения этих трёх преобразований[104].

Непрерывные симметрии. Теорема Нётер[править | править код]

Согласно теореме Нётер инвариантность функционала действия относительно -параметрической группы преобразований приводит к динамическим инвариантам поля, то есть к законам сохранения. А именно, пусть преобразование координат осуществляется с помощью функций , а полевой функции — с помощью функции , где  — совокупность параметров. Обозначим значение производной функции по -му параметру при нулевом значении параметров, а через  — значения производных функций по -му параметру при нулевом значении параметров. Указанные величины по существу являются генераторами соответствующих групп преобразований[105].

Тогда нётеровские токи, определённые как[106]

обладают свойством . Сохраняющимися во времени величинами («нётеровскими зарядами») являются пространственные интегралы от нулевой компоненты токов[107]

Фундаментальной симметрией, присущей всем квантово-полевым теориям, является релятивистская инвариантность — инвариантность относительно неоднородной группы Лоренца (группы Пуанкаре), то есть относительно пространственно-временных трансляций и лоренцевых вращений[108]. Ещё одной глобальной симметрией для комплексных полей является глобальная калибровочная симметрия — симметрия относительно однопараметрической группы  — группы умножений на . Она связана с требованием вещественности лагранжиана и наблюдаемых физических величин, что приводит к зависимости от комплексных полей только через квадратичные формы, представляющие собой произведения взаимно комплексно-сопряжённых функций и их производных. Поэтому умножение на унитарный фазовый множитель не приводит к каким-либо изменениям[109].

Ниже в таблице приведены общие выражения для нётеровских токов и зарядов для основных глобальных симметрий и соответствующих законов сохранения.

Симметрия
Нётеровские токи
Нётеровские заряды и законы сохранения
Пространственно-временные трансляции[110][111]
Тензор энергии-импульса: . В частности  — гамильтониан (плотность) поля.
Закон сохранения 4-импульса: , в частности энергии (гамильтониана)
Лоренцевы вращения[112][113]
Тензор (полного) момента , где  — тензор орбитального момента,  — тензор спинового момента (спина), где  — параметры преобразования полевых функций при лоренцевых вращениях. Для скалярных полей
Закон сохранения полного момента  — пространственного интеграла от
Глобальная калибровочная симметрия [114]
4-вектор заряженного тока: . Для вещественных полей равен нулю.
Закон сохранения заряда (электрический заряд, барионный заряд, странность, очарование и т. д.): [115]. Для вещественных полей равен нулю.

Основные характеристики базовых полей[править | править код]

Ниже в таблице приведены описание и основные характеристики простейших полей, являющихся базовыми при построении реальных квантово-полевых теорий — скалярные, векторные и спинорные поля.

Характеристика
Скалярное поле
[116]
Векторное поле
[117][118]
Спинорное поле
[119]
Полевая функция
 — в общем случае комплексная функция.  — комплексно-сопряжённая функция. Если (то есть ), то имеем вещественное скалярное поле (переобозначив её просто как )
 — векторная функция (4-вектор), в общем случае с комплексными компонентами (заряженное векторное поле). Вещественное (нейтральное) векторное поле получается из условия равенства (комплексное поле приравнивается тогда к вещественному, делённому на )
 — четырёхкомпонентная функция (биспинор)-столбец,  — дираковски сопряжённая четырёхкомпонентная функция-строка,  — матрицы Дирака
Характер описываемых частиц
Частица со спином 0. Для вещественного поля — нейтральная, для комплексного — заряженная.
Частицы со спином 1 (проекции ), заряженные или нейтральные
Заряженные частицы со спином 1/2 ()
Лагранжиан
, где  — лагранжиан для вещественного поля
, где
Для вещественного поля
Уравнения движения Эйлера — Лагранжа
(уравнение Клейна — Гордона — верно и для сопряжённой функции)
(Уравнение Прока)
Дифференцирование по приводит (если ) к
С этим условием (Лоренца)
 — уравнение Дирака
Тензор энергии-импульса
[120]
Гамильтониан
где для вещественного поля —
4-вектор тока и заряд
, для вещественного поля равны нулю[121]
Спин-тензор
0
где

Локальные симметрии и калибровочные поля[править | править код]

Локальные преобразования можно определить как умножение полевой функции на некоторую функцию, зависящую от 4-координат. Например, локальные преобразования группы  — фазовое преобразование, зависящее от конкретной пространственно-временной точки, то есть умножение на . Как отмечалось выше, все комплексные поля симметричны относительно аналогичных глобальных преобразований[122]. Однако они часто неинвариантны относительно локальных преобразований. В частности, описанные выше скалярные и спинорные поля неинвариантны относительно локальных калибровочных преобразований. Причина этого — неинвариантность относительно такого преобразования обычной производной. Если ввести дополнительное поле и заменить производную в лагранжиане на так называемую калибровочно-ковариантную производную (e — калибровочный параметр, который равен электрическому заряду в КЭД)

то полученный лагранжиан будет инвариантен относительно локальных калибровочных преобразований[123]. Однако полученный таким образом лагранжиан будет по сути содержать взаимодействие двух полей — исходного и калибровочного . По общему правилу в таком случае необходимо ввести в общий лагранжиан также слагаемое, отвечающее за лагранжиан свободного калибровочного поля. Этот лагранжиан тоже должен быть калибровочно инвариантен и выбирается как лагранжиан свободного безмассового векторного поля . В итоге, например, для спинорного поля получаем лагранжиан квантовой электродинамики (КЭД)[124]:

то есть данный лагранжиан включает в себя лагранжианы свободного спинорного поля Дирака и калибровочного (электромагнитного) поля, а также лагранжиан взаимодействия этих полей. Если следующее преобразование полей выполняется в каждой точке пространства-времени x (локальное преобразование), то лагранжиан КЭД остаётся неизменным или инвариантным:

где α(x) — любая функция координат пространства-времени. Если лагранжиан теории (или, точнее, действие) инвариантен относительно некоторого локального преобразования, то это преобразование называется калибровочной симметрией теории[125]. Калибровочные симметрии образуют группу в каждой точке пространства — времени. В случае КЭД последовательное применение двух различных преобразований локальной симметрии и  — это ещё одно преобразование симметрии . Для любого α(x),  — элемент группы U(1), поэтому говорят, что КЭД обладает калибровочной симметрией U(1)[126].

Аналогичным образом можно написать калибровочно инвариантный лагранжиан комплексного скалярного поля — лагранжиан скалярной КЭД[127]:

U(1) — абелева группа. КТП можно построить для неабелевых групп, которые называют неабелевыми калибровочными теориями[128]. Квантовая хромодинамика — неабелева калибровочная теория с SU(3) группой симметрии. Она описывает дираковкие поля ψi, i = 1,2,3, которые представляют кварковые поля, и векторные поля Aa,μ, a = 1,...,8 — глюонные поля, которые являются SU(3) калибровочными бозонами[129]. Лагранжиан КХД имеет вид[130][131]:

где Dμ — калибровочная ковариантная производная (в случае с U(1) был один генератор, равный единице)[131]:

где g — константа связи, ta — восемь генераторов группы SU(3) в фундаментальном представлении (матриц 3×3)[131],

fabc — структурные константы SU(3)[132]. По повторяющимся индексам происходит неявное суммирование согласно обозначениям Эйнштейна. Этот лагранжиан инвариантен относительно преобразования[133][132]:

где U(x) — элемент SU(3) в каждой точке пространства-времени x:

Указанный подход можно обобщить на случай других локальных групп симметрии[124].

Предыдущее обсуждение симметрий происходит на языке лагранжиана. Другими словами, это «классические» симметрии. После квантования некоторые теории больше не будут демонстрировать свою классическую симметрию — явление, называемое аномалией[en]. Например, в формулировке интеграла по траекториям, несмотря на инвариантность плотности лагранжиана , при некотором локальном преобразовании полей мера интеграла по траекториям может измениться[134]. Для теории, описывающей природу, чтобы быть последовательным, она не должна содержать каких либо аномалий в калибровочной симметрии. Стандартная модель элементарных частиц — это калибровочная теория, основанная на группе SU(3) × SU(2) × U(1), в которой все аномалии точно сокращаются[135].

Теоретический фундамент общей теории относительности, принцип эквивалентности, также можно понимать как форму калибровочной симметрии, преобразуя общую теорию относительности в калибровочную теорию, основанную на группе Лоренца[136].

Теорема Нётер утверждает, что каждая непрерывная симметрия, то есть параметр в преобразовании симметрии, являющийся непрерывным, а не дискретным, приводит к соответствующему закону сохранения[137][138]. Например, U(1) симметрия КЭД означает сохранение заряда[139].

Калибровочные преобразования не связывают отдельные квантовые состояния. Скорее, они связывают два эквивалентных математических описания одного и того же квантового состояния. Например, поле фотона Aμ, будучи четырёхвекторным, имеет четыре кажущихся степени свободы, но фактическое состояние фотона описывается его двумя степенями свободы, соответствующими поляризации[en]. Остальные две степени свободы называются «избыточными», а разные способы записи Aμ можно связать друг с другом калибровочным преобразованием и, фактически, они описывают одно и то же состояние фотонного поля. В этом смысле калибровочная инвариантность — это не «настоящая» симметрия, а отражение «избыточности» выбранного математического описания[140].

Чтобы учесть избыточность калибровки в формулировке интеграла по траекториям, необходимо выполнить так называемую процедуру фиксации калибровки Фаддеева — Попова. В неабелевых калибровочных теориях такая процедура приводит к возникновению новых полей, называемых «ду́хами». Частицы, соответствующие полям духов, называются частицами-духами, которые не могут быть обнаружены извне[141]. Более строгое обобщение процедуры Фаддеева — Попова задаётся процедурой БРСТ квантования[142].

Спонтанное нарушение симметрии[править | править код]

Спонтанное нарушение симметрии — это механизм, при котором симметрия лагранжиана описываемой им системы нарушается[143].

Чтобы проиллюстрировать механизм, рассмотрим линейную сигма-модель[en], содержащую N вещественных скалярных полей (за номер поля отвечает индекс i), описываемых плотностью лагранжиана вида[144]:

где μ и λ — действительные параметры. Теория допускает глобальную симметрию O(N)[144]:

Состояние с наименьшей энергией (основное состояние или вакуумное состояние) классической теории представляется любым однородным полем ϕ0, которое удовлетворяет условию

Без ограничения общности, пусть основное состояние находится в N-м направлении[144]:

Исходные N полей можно переписать в виде:

и исходная плотность лагранжиана записывается как

где k = 1,...,N-1. Исходная O(N) больше не появляется, а остаётся только подгруппа O(N-1). Большая симметрия до спонтанного нарушения симметрии называется «скрытой» или спонтанно нарушенной[145].

Теорема Голдстоуна утверждает, что при спонтанном нарушении симметрии каждая нарушенная непрерывная глобальная симметрия приводит к появлению безмассового поля, называемому бозоном Голдстоуна. В приведённом выше примере O(N) имеет N(N-1)/2 непрерывных симметрий (равной размерности его алгебры Ли), а O(N-1) имеет (N-1)(N-2)/2. Число нарушенных симметрий — это разность этих величин N-1, что также соответствует N-1 безмассовым полям πk[145].

С другой стороны, когда калибровочная (в отличие от глобальной) симметрия спонтанно нарушается, образующийся бозон Голдстоуна «съедается» соответствующим калибровочным бозоном, становясь дополнительной степенью свободы для калибровочного бозона[146]. Теорема об эквивалентности бозонов Голдстоуна гласит, что при высокой энергии амплитуда излучения или поглощения продольно поляризованного массивного калибровочного бозона становится равной амплитуде излучения или поглощения бозона Голдстоуна, который был «съеден» калибровочным бозоном[147].

В КТП ферромагнетизма спонтанное нарушение симметрии может объяснить выравнивание магнитных диполей при низких температурах[148][149]. В Стандартной модели элементарных частиц W и Z бозоны, которые иначе были бы безмассовыми в результате калибровочной симметрии, приобретают массы через спонтанное нарушение симметрии благодаря бозону Хиггса. Этот процесс называется механизмом Хиггса[150].

Импульсное представление[править | править код]

Для решения уравнений движения можно перейти к так называемому импульсному представлению с помощью преобразования Фурье[151][К 6]:

с учётом свойств Фурье-образа , в частности Фурье-образ производных равен .

Нахождение решения уравнений движения можно показать на примере уравнения Клейна — Гордона[151].

Используя импульсное представление полевых функций, можно получить и остальные характеристики поля в импульсном представлении. Покажем это на примере 4-импульса для того же вещественного скалярного поля Клейна — Гордона[154].

Характеристика
Скалярное поле
[158]
Векторное поле
[159]
Спинорное поле
[160]
Импульсное представление полевой функции: в выражении
отвечает за частицу,  — за античастицу.
для вещественного поля
Плотность частиц с импульсом Общее число частиц
4-импульс поля