Реклама Rambler's Top100 Service     Все Кулички
 
Заневский Летописец
 
    Виртуальный орган невиртуальной жизни
     Тринадцатый год издания 11.01.2012         N 2066   

Статистический ликбез - 2

(Начало)
    Если разобрались, тогда этот вопрос считаем закрытым и в дальнейшем зафиксируем (для уменьшения ненужных артефактов) число избирателей на каждом участке (N) равным 999, а длину шкалы графика - 1000.

    Получается такая картинка:

Равномерное распределение по интервалу
    Теперь посмотрим на что похоже равномерное распределение голосов "ЗА" независимое от явки.
    При этом будем считать, что голосов "ЗА" не может быть более половины от общего числа голосующих.
    Для этого строку
       $Y=floor(rand(1,$N)); // общее количество бюллетеней (явка от 1 до N)
надо заменить на строку
       $X=floor(rand(1,$N/2)); // общее количество голосов "ЗА" (от 1 до N/2),
а также заменить в следующей строке $Y на $X.
    График соответственно изменяется:
Равномерное распределение по интервалу
    Распределение занимает ровно заданную нами половину шкалы (N/2), но по-прежнему равномерно.

    Повторяю еще раз: это распределение голосов по интервалу N (по числу избирателей), а не в зависимости от явки или еще от чего-нибудь.
    Это - исходные последовательности, моделирующие явку и число голосовавших "ЗА", которые зависят от всевозможных причин, но не друг от друга.

    А вот распределение голосов, в случае их зависимости от явки.

$N=999; // Количество избирателей на каждом участке
$r=array(); // массив распределения
for($i=0;$i<10000;$i++) { // Возьмем 10000 участков
	//инициализируем датчик случайных чисел для данного участка
srand((double) microtime()*1000000); 
$Y=floor(rand(1,$N)); // общее количество бюллетеней (явка от 1 до N)
$X=floor(rand(1,$Y)); // число голосов "ЗА", непонятно почему зависимое от явки
$XY=floor(($X/$N)*1000); // индексы распределения по интервалу N с шагом 0,1*N
	// количество участков с равным числом явившихся суммируется 
                 // и записывается в нужное место массива распределения ([$XY])
$r[$XY]++; 
}
Неравномерное распределение по интервалу
    Оба взаимных опровергателя (г-н К. - как мне надоела его фамилия! - и золотомедальный краснодипломник и победитель олимпиад) сливаются в экстазе некомпетентности, поскольку в качестве исходной последовательности берут неизвестно что с заранее неизвестными статистическими характеристиками.
    И (что характерно для дилетантов) делают на основании этого "неизвестно чего" весьма глобальные выводы.
    Это печально.

    Широко распространенный способ получения случайных величин с гауссовским распределением требует исходной последовательности равномерно распределенных случайных чисел (таких как на рисунке 2).

    Почему так получается, нетрудно разобраться даже ученику начальной школы.
    Объясняю этот вопрос на самом простом примере.
    Как известно, грани обычного игрального кубика при броске выпадают всегда с равной вероятностью (одна шестая), то есть распределение случайных чисел от 1 до 6 является равномерным.
    Поэтому игральный кубик можно использовать в качестве генератора случайных чисел от 1 до 6 с равномерным распределением.
    Возьмите три игральных кубика.
    При каждом броске грани всех трех кубиков тоже будут выпадать с равной вероятностью.
    Но сумма черных точек на верхних гранях кубиков будет моделировать гауссовское (нормальное) распределение.
    Потому что, например, число 3 может получиться только при трех единицах на верхних гранях кубиков, а число, например, 4 - при следующих комбинациях:

1,1,2,
1,2,1,
2,1,1.
    Каждая из этих комбинаций выпадает с равной вероятностью, но сумма на верхних гранях - одинакова, поэтому появляется втрое чаще.
    Число 5 будет выпадать еще чаще, поскольку число нужных комбинаций еще увеличится.
    Чаще всего будет получаться сумма 10 и 11, потом кривая распределения пойдет на спад.
    То есть получится колоколообразная кривая, называемая в просторечии Гауссовой кривой.

    Но для ее получения нужны случайные числа с равномерным распределением по диапазону, а из каких попало случайных чисел гауссовского распределения не получается.

(Продолжение)



    Моделирование выборов и прочая статистика
    А также другие Заметки политического обывателя
    


Обложка      Предыдущий номер       Следующий номер

   А Смирнов    ©1999-2024
Designed by Julia Skulskaya© 2000