1.2. Степенные законы распределения вероятностей

1.2. Степенные законы распределения вероятностей
Еще одной отличительной чертой многих сложных систем являются степенные законы распределения вероятностей (СЗРВ). Т.е. статистические характеристики происходящих в них событий обыкновенно имеют плотность вероятности вида

, (2)

где показатель a обычно лежит в диапазоне от нуля до единицы. При статистическом описании катастроф и стихийных бедствий распределение (2) является правилом, практически не знающим исключений. В качестве классического примера можно привести закон Рихтера–Гутенберга: зависимость количества землетрясений от их энергии определяется формулой (2) с a » 2/3 для землетрясений с магнитудой менее 7,5 и с a » 1 для более сильных. Точно так же распределены: относительная смертность[2] в результате землетрясений a » 0,25ч0,45, ураганов a » 0,4ч0,6, а также наводнений и торнадо a » 1,4, число заболевших a » 0,29 при эпидемиях в изолированных популяциях; площадь лесных пожаров a » 0,59 колебания биржевых индексов a = 1,40 масса снежных лавин. Степенное распределение имеют характеристики и многих других явлений, как связанных с катастрофами и риском, так и не имеющих к ним прямого отношения, например, динамики солнечных вспышек или научной продуктивности исследователей (число публикаций).

Степенные законы распределения представляют собой одну из отличительных черт сложности. Для простых систем наиболее типичны экспоненциальное

(3)

и нормальное (гауссово)

(4)

распределения (см. рис. 2). Первое описывает поведение "элементарных" объектов: в соответствии с формулой (3) распределены, например, телефонные разговоры по продолжительности или молекулы газа по энергии. Распределению (4) подчиняются величины, получающиеся при сложении большого числа независимых случайных слагаемых, поэтому для сложных систем (если понимать их как состоящие из большого числа элементов) можно было бы ожидать именно гауссовой статистики. Однако, как показывают приведенные выше примеры, это зачастую не так.

Рис. 2. Типичный вид плотности вероятности величин, распределенных в соответствии с нормальным, экспоненциальным и степенным законами, с различным представлением данных по осям Верхний график позволяет сравнить скорость спадания плотности вероятности для хвостов распределений. На нижнем левом графике (логарифмический масштаб по оси ординат) нормальное и экспоненциальное распределение представляются, соответственно, в виде параболы и прямой. А на нижнем правом (двойной логарифмический масштаб) вид прямой имеет степенной закон распределения, что говорит о скейлинговом поведении, т.е. об отсутствии выделенных масштабов при СЗРВ.

Разница между нормальным и степенным распределениями носит не формальный, а принципиальный характер. Если статистика системы описывается формулой (4), то свыше 99,7% событий отклоняется от среднего значения m не более чем на 3s (т.н. правило трех сигм), а, скажем, за 5s выбивается и вовсе менее одного события на миллион. При этом появляется возможность "законно" пренебречь очень крупными событиями, считая их практически невероятными, т.е. можно отрезать хвост распределения.

Статистика величин, описываемых распределением (2), отличается тем, что крупные события, приходящиеся на хвост распределения, происходят недостаточно редко, чтобы ими можно было пренебречь. По этой причине СЗРВ называют также распределениями с тяжелыми хвостами. Распределения вида (3) или (4), имеющие хвост, спадающий быстрее любой степени x, в этой связи уместно именовать компактными, подразумевая небольшую протяженность диапазона значений, принимаемых случайной величиной со сколь-нибудь значимой вероятностью.

В терминах оценки безопасности и риска хвост распределения соответствует так называемым гипотетическим авариям, возможность которых, как явствует уже из самого названия, на практике не учитывается. Наличие СЗРВ в корне подрывает вошедшие в плоть и кровь представления о надежности и риске. Эти представления базируются на явном, а чаще всего неявном, предположении, что серьезные неприятности происходят исключительно в результате неблагоприятного стечения ряда обстоятельств, т.е. что любое крупное событие возникает как сумма большого числа мелких независимых событий, которая в силу центральной предельной теоремы нормально распределена. На самом деле события в сложных системах не являются независимыми.

Природа степенных законов распределения (а в конечном итоге, и катастроф) связана с сильной взаимозависимостью происходящих событий. Но это даже не "эффект домино", когда упавшая костяшка с некоторой близкой к единице вероятностью сшибает следующую, та еще одну и т.д. В этом случае распределение числа упавших костяшек имело бы вид (3) и все равно быстро бы убывало с ростом x. К возникновению СЗРВ приводит "цепная реакция", т.е. лавинообразное нарастание возмущения с вовлечением в событие все большего количества ресурса.

Проиллюстрируем это на примере простейшего ветвящегося процесса. Предположим, что произошла вспышка инфекционного заболевания, при котором каждый заразившийся человек ("частица" в терминах теории ветвящихся процессов) в течение дня может с вероятностью p умереть (распад частицы), с вероятностью p0 выздороветь (исчезновение частицы) или с вероятностью pi заразить еще i1 человека, i = 1,2,… (сохранение частицы или ее деление на 2,3,… частицы). Очевидно, что здесь имеется положительная обратная связь, т.е. чем больше людей инфицировано, тем больше их заразится в дальнейшем. Динамика болезни будет определяться коэффициентом размножения ветвящегося процесса m = Si ipi. Если m Ј 1, то вспышка рано или поздно угаснет и можно показать, что вероятность nj того, что к этому моменту умрет ровно j человек, при больших j дается формулой

, (5)

где зависимость коэффициента b от m определяется соотношением

. (6)

При этом единичное значение коэффициента размножения соответствует критическому ветвящемуся процессу, описываемому формулой (2) с a = 1/2.

Описанный ветвящийся процесс можно проиллюстрировать еще одной задачей. Речь идет о нахождении времени разорения азартного игрока, играющего против казино в небезобидную игру, для которой вероятность проигрыша составляет p, а вероятность iкратного выигрыша – pi. Легко понять, что каждый проигрыш здесь соответствует смерти одного больного в рассмотренном примере, а выигрыш – акту заражения новых людей. Распределение вероятностей времени (числа игр), в течение которого игрок, исходно имевший денег на одну ставку, наконец разорится (а при m Ј 1 это случится непременно) дается формулой (5). Таким образом, ввязавшись в игру с гарантированным проигрышем, можно весьма долго ощущать себя "на коне", что не меняет, однако, финала.

При m близком к единице ветвящиеся процессы могут порождать степенное распределение. Однако они не могут претендовать на удовлетворительное описание природы СЗРВ без объяснения, почему коэффициент размножения для самых разнообразных явлений оказывается именно таким. Поэтому подробное обсуждение вопроса о механизмах их возникновения мы отложим до §2, посвященной теории самоорганизованной критичности, а сейчас подробнее остановимся на их свойствах. Здесь есть некоторые тонкости, связанные с различиями между чистой теорией и реальной физикой, поэтому математика и физика будут рассмотрены отдельно.

Математический аспект. Устойчивые распределения

В истории науки уже неоднократно случалось так, что теоретический аппарат, понадобившийся физикам, в том или ином виде уже давно был разработан математиками. Так произошло и со степенными законами распределения – в теории вероятности изучается класс так называемых устойчивых распределений, представляющих собой предельные законы для сумм независимых одинаково распределенных слагаемых. Он включает в себя как компактные распределения, так и распределения с тяжелыми хвостами.

Устойчивыми эти законы называют потому, что сумма любого числа случайных величин с некоторым устойчивым распределением после соответствующей перенормировки имеет то же самое распределение, что и каждое отдельное слагаемое:

(7)

(символ d над знаком равенства означает эквивалентность распределения вероятностей правой и левой частей). Обсуждая вопросы теории устойчивых распределений, мы будем следовать книгам

Устойчивые распределения образуют четырехпараметрическое семейство функций p(x) = g(x;a,b,g,l), которые за исключением нескольких частных случаев (формулы (8), (10) и (11) – см. ниже) не выражаются через элементарные функции. Масштабный параметр l > 0 и параметр неслучайного сдвига g соответствуют линейному преобразованию координат

,

где g' зависит от b, g и a, причем g' = g, если a № 1. Параметр формы b, ограниченный по модулю единицей, задает асимметрию функции распределения (при отрицательных значениях параметра она скошена влево, при положительных – вправо). Параметр a управляет асимптотикой распределения и может принимать значения в интервале 0 < a Ј 2. При a = 2 (и любых b) получается нормальное распределение (4)

, (8)

а при a < 2 (если b № 1) распределение имеет степенную асимптотику при x ® Ґ

,

т.е. его хвост описывается формулой (2).

Таким образом, распределения с тяжелыми хвостами являются не альтернативой нормального распределения, а его естественным дополнением. Если сумма независимых случайных величин после линейной перенормировки (x1 + x2 +…+ xn – an)/bn сходится к какому-либо закону, то он принадлежит к семейству устойчивых законов, причем константы an и bn определяются однозначно и выполнено соотношение

. (9)

При этом нормальному распределению, для которого существуют все статистические моменты, соответствует лишь одно значение a = 2, а все остальные дают распределения, имеющие бесконечный второй момент, а следовательно, и дисперсию.

Помимо бесконечной дисперсии степенное распределение имеет при a Ј 1 бесконечное математическое ожидание E x. Случай a < 1 интересен также и тем, что в силу (9) нормировочная постоянная bn растет быстрее, чем n. Т.е. закон больших чисел становится неприменим. Особенно любопытно эта ситуация выглядит при пограничном значении a = 1, дающем в случае b = 0 распределение Коши

, (10)

для которого bn = n, и если выбрать g = 0, то будет an = 0 и получится, что

.

Т.е. вопреки привычным ожиданиям сходимости выборочного среднего к среднему по ансамблю, это выборочное среднее оказывается распределено в точности так же, как одно слагаемое. Т.е. мы усредняем наблюдаемые величины, чтобы получить какое-то среднее значение, но остаемся с тем же разбросом, что и до усреднения.

Очевидно, что нормировка будет еще больше для меньших значений a. Например, для распределения Леви

(11)

bn = n2, т.е. получается, что сумма одинаково распределенных слагаемых растет как квадрат их числа.

Применительно к описанию катастроф и бедствий это означает, что из-за степенного вида законов распределения должен наблюдаться нелинейный, все более ускоряющийся рост суммарного ущерба со временем. Этот результат производит шокирующее впечатление, и его иногда ошибочно воспринимают как свидетельство нестационарности процесса. Это, конечно же, не так. Просто по мере увеличения числа зарегистрированных событий n их выборочное среднее (x1 + x2 +…+ xn)/n стремится к математическому ожиданию, а оно при a < 1 бесконечно. Нелинейное и ускоряющееся со временем нарастание суммарного ущерба также перестает казаться парадоксальным, если учесть, что из-за катастрофического поведения определяющее влияние на его значение оказывает величина ущерба от крупнейшего события. Можно показать, что при a < 1

,

т.е. в сумму случайных величин, распределение которых имеет хвост вида (2) с a < 1, с точностью до коэффициента вклад вносит лишь максимальное слагаемое (в то время как для величин с конечным средним вклад любого отдельного слагаемого в сумму стремится к нулю).

Диапазон значений показателя от нуля до единицы выделен еще благодаря одному обстоятельству. Такие величины, как ущерб от катастрофы, энергия землетрясения и другие характеристики, описывающие сложные системы, как правило, неотрицательны. Поэтому носитель распределения должен быть ограничен слева. Для устойчивых законов это имеет место лишь при a < 1 и b = 1.

Физический аспект. Масштаб и математическое ожидание

Изложенные выше результаты теории устойчивых распределений не проливают света на механизм возникновения СЗРВ. В самом деле, если слагаемые имеют конечную дисперсию, то в силу центральной предельной теоремы предельное распределение будет нормальным, что соответствует устойчивому закону с a = 2. А чтобы получить меньшие значения a, необходимо складывать величины с бесконечной дисперсией, т.е. уже имеющие степенной хвост.

Кроме того, как мы увидим ниже, сами по себе устойчивые распределения не очень хороши для практического описания сложных систем, т.к. представляют собой математическую идеализацию. Тем не менее, приведенные результаты дают общее представление о довольно непривычных свойствах степенных законов распределения и даже позволяют в некоторых случаях определять их показатели на основе общих соображений.

Продемонстрируем это на конкретном примере. Энергия землетрясения E пропорциональна произведению площади разлома S и смещения пластов DL. Для не очень сильных землетрясений, не достигающих дна земной коры, S ~ L2, где L – линейная протяженность разлома. Кроме того, в силу закона Гука[3] DL ~ L. Отсюда находим, что

. (12)

Разобьем площадь разлома S на n участков равной площади и предположим, что каждый из них вносит независимый вклад в энергию землетрясения, т.е. что

. (13)

Применение соотношения (12) к левой и правой частям формулы (13) дает

,

откуда в силу формул (7) и (9) немедленно получаем для энергии устойчивое распределение с a = 2/3.

Для сильных землетрясений соответствующие формулы имеют вид S ~ LH и DL ~ H, где H << L – толщина коры, и соотношение (12) запишется как E ~ S, откуда получается единичное значение a.

К сожалению, несмотря на всю привлекательность и простоту приведенных выкладок, здесь есть скрытый порочный круг. Записывая соотношение (13), мы неявно предполагаем масштабную инвариантность сейсмичности, т.е. то, что землетрясения "устроены одинаково" вне зависимости от энергии и площади разлома. Иначе говоря, мы изначально предполагаем отсутствие характерных масштабов, что означает степенные законы распределения. Хотя это предположение само по себе является нетривиальным и нуждается в объяснении и доказательстве, на уровне феноменологической теории можно считать его экспериментальным фактом, а приведенный вывод – исчерпывающим.

Есть еще одно весьма существенное обстоятельство, отличающее чистую теорию от практики. Очевидно, что в природе никакое явление не может характеризоваться бесконечными значениями среднего или дисперсии. Поэтому ясно, что степенные зависимости вида (2) приблизительны и должны нарушаться при очень больших значениях аргумента. Т.е. степенное спадание плотности вероятности соответствует средней асимптотике, и вместо тяжелых хвостов на практике должны иметь место "полутяжелые"

, (14)

где скейлинговая f(y) приблизительно постоянна при y ~ 1 и быстро убывает при y ® Ґ. При этом "тяжесть хвоста" переносится в область промежуточных значений x. Строго говоря, чисто степенная зависимость нарушается и при x ® 0, т.к. иначе распределение (14) не будет нормируемым, однако то, как конкретно это происходит, не существенно при анализе крупных событий.

Замена формулы (2) на (14) при переходе от идеальных СЗРВ к реальным имеет одно весьма неожиданное качественное следствие. Естественно предположить, что введенное обрезание степенного хвоста делает бесконечное математическое ожидание конечным, но очень большим. Однако вопреки интуитивным представлениям для распределения (14) математическое ожидание чрезвычайно мало по сравнению с крупными событиями, которые могут происходить в системе. Оно не несет никакой информации о катастрофах, которые потому и катастрофы, что оказались намного крупнее типичных событий, характеризуемых значением математического ожидания.

При описании катастроф математическое ожидание вообще является практически бесполезным. Дело здесь в коэффициенте пропорциональности в формуле (14), который определяется из условия нормировки

(15)

и является очень маленьким, т.к. интеграл (15) "набирает" основное значение в области значений x << xc. Хотя интегралы для первого (математическое ожидание) и последующих моментов

при a < 1 набираются в районе больших x ~ xc, за счет малости нормировочного коэффициента среднее также "съезжает" в область малых значений и поэтому непригодно для анализа крупных событий.

Не менее существенно и другое обстоятельство: на практике из-за ограниченной чувствительности приборов и методик невозможно получить достоверных оценок среднего. Не зарегистрировав или не сумев разрешить часть малых событий, мы неизбежно ошибемся при определении коэффициента нормировки, а следовательно, и среднего. Причем чем больший кусок распределения мы "потеряем", тем больше будет ошибка.

Перечисленных недостатков лишена статистическая характеристика, называемая масштабом

, (16)

которая представляет собой среднее, взятое с весом x, т.е. определяет характерный размер крупного события, при этом полностью игнорируя мелкие. Иначе говоря, величина Sc x определяет, событий какого масштаба (отсюда и название) следует ожидать от системы. Поскольку интегралы, определяющие и числитель, и знаменатель в формуле (16), пропорциональны коэффициенту нормировки и набираются в области больших значений, их отношение не будет чувствительным к потере части данных о малых событиях. Оценка масштаба также малочувствительна и к невозможности отличить несколько отдельных событий от одного события суммарного размера.

Для компактных распределений масштаб будет, естественно, совпадать по порядку величины с математическим ожиданием Sc x ~ E x, поскольку интегралы для всех моментов, начиная с нулевого, набираются в одной и той же области, в то время как для распределений с тяжелыми хвостами будет Sc x >> E x. В этой связи можно говорить о системах, склонных к катастрофам, как о имеющих два характерных масштаба (для типичных и для крупных событий), сильно различающихся по порядку. Эта разница лежит в основе упоминавшегося выше явления перемежаемости. Когда на фоне большого числа типичных событий происходит одно или несколько крупных, это воспринимается как вспышка активности. Если же наблюдатель (или сама система) имеет порог чувствительности, по величине лежащий между средним и масштабом, то типичные события воспринимаются как покой, а о вспышках активности говорят как о прерванном равновесии.

Легко видеть, что для распределения (14) Sc x ~ xc, однако по небольшой статистической выборке оценить xc практически невозможно, а оценить масштаб не составит труда. К сожалению, если выборка слишком коротка, величину масштаба также не удается найти, поскольку его оценка растет с ростом объема выборки до тех пор, пока не наберется достаточное число крупных событий.

Завершая обсуждение СЗРВ, еще раз взглянем на формулу (14). Диапазон значений a от нуля до единицы, в который попадают показатели для распределений характеристик катастроф и бедствий, и который является выделенным с точки зрения теории устойчивых распределений, снова оказывается в особом положении. Если a > 1, то, как отмечалось, среднее конечно даже для чисто степенного хвоста вида (2), т.е. интеграл для m1 набирается там же, где и нормировочный – в области малых значений. Следовательно, среднее отслеживает небольшие события, которые и вносят основной вклад в суммарный ущерб, несмотря на возможность крупных. Если a < 0, то нормировочный интеграл (15) набирает свое значение вне области малых значений, и, следовательно, математическое ожидание отслеживает крупные события, т.е. для системы как раз они и характерны.

Первую ситуацию можно воспринимать как докатастрофическую, соответствующую, например, автомобильным авариям, в которых погибает множество людей, однако несчастья с большим числом жертв нетипичны. Вторая ситуация является уже сверхкатастрофической, однако, поскольку авторам не известны ни возможные механизмы возникновения распределений с отрицательными a, ни конкретные примеры таких распределений, мы не можем предложить для нее никаких интерпретаций.

Таким образом, все интересное и опасное в мире сложности и риска описывается степенными законами с 0 < a Ј 1.