Статистический ликбез - 3
(Начало)
В свете всего вышесказанного крайне любопытно рассмотреть широко обсуждаемые в последнее время объяснения пиков на "красивых" процентах.
Для этого опять возьмем за основу коды г-на К., но напишем их правильно.
А "правильно" (то есть так, как в реальной жизни) все происходит прямо противоположным образом: сначала подсчитываются все голоса за всякие партии, а также испорченные бюллетени и прочие отходы избирательного производства, а потом все эти числа складываются.
Так получается число явки.
Этот порядок обеспечивает, прежде всего, юридическую безопасность членов избирательной комиссии, ибо если сумма голосов за всех кандидатов будет превышать число явки, то такой протокол легко опротестовывается в суде, а членов избирательной комиссии ждут те или иные неприятности.
Таким образом, корректно написанная модель выглядит так:
$N=222; // Количество избирателей на каждом участке
$r=array();
for($i=0;$i<10000;$i++) { // Возьмем 10000 участков
//инициализируем датчик случайных чисел для данного участка
srand((double) microtime()*1000000);
$X=rand(0,$N/2); // число голосов "ЗА"
$Xprotiv=rand(1,$N/2); // число голосов "ПРОТИВ"
$Y=$X+$Xprotiv; // общая явка на участок
$XY=floor(($X/$Y)*1000); // индексы распределения по интервалу N с шагом 0,1*N
// количество участков с равным отношением голосов "за" к явке суммируется
// и записывается в нужное место([$XY]) массива распределения $r
$r[$XY]++;
}
Картинка для списочного количества избирателей N равным 222 человека приведена ниже.
|