Stolica.ru
    Реклама Rambler's Top100 Service     Все Кулички
 
Заневский Летописец
 
    Виртуальный орган невиртуальной жизни
     Тринадцатый год издания 12.01.2012         N 2067   

Статистический ликбез - 3

(Начало)
    В свете всего вышесказанного крайне любопытно рассмотреть широко обсуждаемые в последнее время объяснения пиков на "красивых" процентах.
    Для этого опять возьмем за основу коды г-на К., но напишем их правильно.

    А "правильно" (то есть так, как в реальной жизни) все происходит прямо противоположным образом: сначала подсчитываются все голоса за всякие партии, а также испорченные бюллетени и прочие отходы избирательного производства, а потом все эти числа складываются.
    Так получается число явки.

    Этот порядок обеспечивает, прежде всего, юридическую безопасность членов избирательной комиссии, ибо если сумма голосов за всех кандидатов будет превышать число явки, то такой протокол легко опротестовывается в суде, а членов избирательной комиссии ждут те или иные неприятности.

    Таким образом, корректно написанная модель выглядит так:

$N=222; // Количество избирателей на каждом участке 
$r=array(); 
for($i=0;$i<10000;$i++) { // Возьмем 10000 участков
	//инициализируем датчик случайных чисел для данного участка
srand((double) microtime()*1000000);
$X=rand(0,$N/2); // число голосов "ЗА"
$Xprotiv=rand(1,$N/2);     // число голосов "ПРОТИВ"
$Y=$X+$Xprotiv;           //   общая явка на участок
$XY=floor(($X/$Y)*1000); // индексы распределения по интервалу N с шагом 0,1*N
      // количество участков с равным отношением голосов "за" к явке суммируется 
                // и записывается в нужное место([$XY]) массива распределения $r
$r[$XY]++; 
}
    Картинка для списочного количества избирателей N равным 222 человека приведена ниже.
Неравномерное распределение по интервалу
    Легко заметить, что пики на "красивых" процентах никуда не исчезли, что свидетельствует о том, что найденное объяснение - истинно, а описываемое явление - объективно.
    (Настолько объективно, что проявлялись даже на последовательностях с заранее неизвестными статистическими характеристиками.)

    Здесь обязательно кто-нибудь задаст вопрос: почему мы брали распределения от 0 до N/2, то есть с левой стороны графика, а получили распределение шириной во всю картинку?

    Вопрос совершенно правильный.
    Он, прежде всего, означает, что задающий его человек действительно старается понять, что происходит на самом деле, а не просто буквы читает.
    А ответ такой: это две разные шкалы.
    Первая (рассмотренная ранее) - от нуля до N (длины последовательности), вторая (рис. 5) - от нуля до 100% явки.

    Чтобы их не перепутать, шкалы обычно подписываются и оцифровываются (г-ну К. это тоже неизвестно).
    Но я частично исправил его очередную халатность, поставив справа внизу маленькую циферку: обратите на нее внимание.

    (Кстати, вот еще одно свидетельство некомпетентности надоевшего мне автора: в PHP функция rand по определению целочисленная.
    Поэтому применять к ней функцию выделения целой части floor - бессмысленно.)
    На этом вводную теоретическую часть можно считать законченной и приступать непосредственно к моделированию.

(Продолжение)



    Моделирование выборов и прочая статистика
    А также другие Заметки политического обывателя
    


Обложка      Предыдущий номер       Следующий номер

   А Смирнов    ©1999-2017
Designed by Julia Skulskaya© 2000