Кванты Скотт Паттерсон Brainiac Кен Дженнингс Moneyball
Н О В А Я Н О Р М А Л Ь Н О С Т Ь
Download 3.43 Kb. Pdf ko'rish
|
Удовольствие от x. Увлекательная экскурсия в мир математики от одного из лучших преподавателей в мире
Н О В А Я Н О Р М А Л Ь Н О С Т Ь
185 практически не упоминаются в учебниках по элементарной статистике, а если и встречаются, то обычно рассматриваются как некие патологии. Это странно. Я попытаюсь объяснить, что многие явления современной жизни приобретают больший смысл при условии понимания этих «па- тологических» распределений. Это новая нормальность. Возьмем, к примеру, распределение размеров городов в США. Вме- сто того чтобы скапливаться вокруг некоей средней величины колоко- лообразной кривой, подавляющее большинство городов имеют неболь- шой размер и, следовательно, скапливаются в левой части графика. 0 2×10 5 4×10 5 Население города 0 0,001 0,002 0,003 0,004 Процентная доля городов И чем больше население города, тем реже такие города встречаются. Иначе говоря, в совокупности распределение будет представлять собой скорее кривую в форме буквы L, чем колоколообразную кривую. И в этом нет ничего удивительного. Все знают, что мегаполисов го- раздо меньше, чем маленьких городов. Хотя это не так очевидно, раз- меры городов подчиняются простому красивому распределению — если посмотреть на них в логарифмическом масштабе. Будем считать, что различие между двумя городами одно и то же, если их население отличается в одно и то же число раз (подобно тому как две любые клавиши рояля, отстоящие на октаву, всегда разнятся вдвое по частоте). И сделаем то же самое на вертикальной оси. М Н О Г О Л И К И Е Д А Н Н Ы Е 186 Население города Процентная доля городов 10 4 10 5 10 6 10 7 10 -8 10 -7 10 -6 10 -5 10 -4 10 -3 10 -2 Теперь данные располагаются на кривой, представляющей собой почти идеальную прямую линию. Исходя из свойств логарифмов, не- трудно вывести, что исходная L-образная кривая представляет собой степенну2ю зависимость, которая описывается функцией вида y = c x a , где x — население города, у — количество городов, имеющих такой раз- мер, с — константа, а показатель степени a (показатель степенно2й зави- симости) определяет отрицательный наклон прямой линии. Степенны2е распределения 91 имеют некоторые нелогичные, с точки зрения традиционной статистики, свойства. Например, в отличие от нормального распределения, их моды, медианы и средние значения не совпадают из-за скошенной асимметричной формы L-образных кривых. Президент Буш извлек из этого немалую пользу, заявив в 2003 году, что сокращение налогов позволило каждой семье сэкономить в среднем 1586 долларов 92 . Хотя математически это верно, здесь он к своей выгоде взял за основу среднее значение вычета, под которым скрывались огром- ные вычеты в сотни тысяч долларов, полученные 0,1% богатейшего на- селения страны. Известно, что «хвост» в правой части распределения |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling