Блог им. Dim-77 → Интернет-голосование на сайте ПАИ
Получил ответ от ПАИ, вынужден создать эту тему, ибо ответ слишком уж обьемен. Об уровне ар-
гументации устроителей конкурса судите сами)) Если коротко, банда краеведов добралась до ресурсов
интернет провайдера Март))
Дмитрий, судя по вашему e-mail вы каким-то образом относитесь к великолукскому провайдеру Mart.
Давайте я вам поясню то, что пояснял уже другим.
Если кратко, то любые подозрения в том, что голоса снимались как-то выборочно, абсурдны, так как мы в принципе не снимали голоса за конкретных номинантов — мы лишь поставили маску на вывод данных обо всех голосах с групп ip-адресов, с которых были замечены массовые голосования всего за одного, либо за одну и ту же группу номинантов, которые явственно нарушали принцип допустимости голосования не более одного раза в сутки.
Такие некорректные голосования были выявлены путём завода базы данных голосования в специальную программу для анализа и обработки больших массивов данных — это специализированное ПО, которым пользуются социологи, в службах статистики etc. При этом мы привлекали как раз специалиста-социолога.
Мы не списывали «двойственные» случаи, когда мы не были на 100% уверены в наличии некой «автоматизации» процесса. Во всех дисквалифицированных случаях прослеживались абсолютно чёткие закономерности. При этом всего в нескольких случаях были совершены попытки «простым способом» обмануть систему и проголосовать значительно больше 24 раз (сколько дней шло голосование на момент обнуления) с абсолютно одного и того же ip адреса через всевозможные «маски». При этом в таких случаях мы учитывали, что такой ip может быть промежуточным шлюзом и смотрели по нему именно динамику и конкретные данные голосования: за кого, когда. (Просто, как вы понимаете, не бывает, чтобы даже через такой шлюз от какого-то провайдера ВСЕ его клиенты в общем-то В КАКОЙ-ТО КОНКРЕТНЫЙ МОМЕНТ решили проголосовать сразу за пяток номинантов, и при этом практически абсолютно единообразно)
Для примера… Вы, я подозреваю, знаете, как устроен интернет? Так вот, напомню, что адрес соединения в IPv4 состоит из 4-х групп цифр, разделённых точкой. При этом последняя цифра может быть от 1 до 256.
Например: 192.190.10.10. Формально, этот адрес и, например, 192.190.10.11 — разные. И, скажем, могут принадлежать одному провайдеру, но разным пользователям в одном и том же, условно доме (или вообще в разных концах города). Однако по закону распределения вероятностей не может быть такого в принципе, чтобы со, скажем, ip 192.190.10.10 до 192.190.10.99 за один день практически без пробелов были поданы голоса — и все за одного или нескольких (одних и тех же) номинантов. То есть если бы это были адреса обычного городского провайдера сети, или сети в крупном офисном здании, в любом случае были бы пропуски или те или иные отклонения.
Однако мы как раз выявили порядка 30-40 групп ip-адресов, с которых шло именно такое «кристальное» голосование. Для примера — группа ip-адресов с цифрами 93.191.78 (и далее после точки — «от и до») — за коротких промежуток времени с этой группы было подано РОВНО по 200 голосов за 5 конкретных номинантов: марафон «Усабрь», Медовый фестиваль, Зоозащиту, печатную продукцию «Усабря» и экологическое движение ЭКА. То есть кто-то (мы не знаем — кто именно, поэтому не предъявляли претензий ни к одному из номинантов, хотя в некоторых случаях чисто по человечески нам, конечно, совершенно точно ясно — кто инициатор накруток) явно на стороне, воспользовавшись услугами на аутсорсе, заказал такую накрутку, оплатив ровно по 200 голосов.
Или вот у меня интересовались про голосование за Великолукскую встречу воздухоплавателей, Там история вообще интересная… За целую группу номинантов из Великих Лук и окраин (и Великолукский молочные комбинат, и начальник Великолукского отдела ФСКН, и настоятель храма Николая Чудотворца в Новосокольниках) регулярно и целенаправленно набрасывались голоса в «довесок» к голосам за одного номинанта — создателей сайт «Лукиград» (за других номинантов при этом голосов практически не было — почти всё по нулям, что невозможно по теории вероятности). В среднем, пропорция была такая — по 170-190 голосов для «Лукиград», и в среднем по 20-30-50 голосов для остальных. Возможно, голоса набрасывались из ложно понятного чувства местного патриотизма, или вообще для попытки замаскировать своё основное голосование. Тут, причём, использовалась одна из самых хитрых схем: вот таких групп ip-адресов, как случай описан выше, здесь были не единицы, а десятки. То есть — подряд с 109.238.96.xxx 109.238.110.xxx (а это, на секундочку, более нескольких тысяч голосов). [тут и далее — по ipinfo.io — это голоса великолукского провайдера «Март» — у нас есть предположение, что у создателей сайта «Лукиград» или им сочувствующим был доступ к серверам этого провайдера для возможности той или иной автоматизации голосования]. Ещё такие же группы, откуда пачками падали голоса за «Лукиград» и «группу поддержки» (то есть — по характерному паттерну) — 78.25.120.xxx — 78.25.123.xxx, с 88.28.163.xxx по с 88.28.167.xxx и т.д. и т.п. Таких по этим номинантам — десятки (не случайно Лукиград до обнуления фальсифицированных результатов успел «набрать» более 7000 голосов, когда у большинства номинантов — не больше чем 2-3 сотни было).
В отдельных случаях были и хитрее попытки нас обмануть — те, которые автоматизированно не предупредишь при всём желании — выявлять накрутки здесь пока можно лишь после обработки данных в специальной программе и выявления характерных аномальных паттернов голосования и уже с ними — детального разбора. Примерно так, если помните, доказывали вбросы на выборах в Госдуму в 2012 году — через построения график кривой зависимости Гаусса и выявления «аномальных» всплесков.
РЕЗЮМИРУЮ:
Дисквалифицированы были лишь ВСЕ голоса с тех ip-адресов, где прослеживались признаки АНОМАЛЬНОГО голосования, определяемого по совокупности нескольких пунктов: в короткий промежуток времени или с определённой ритмичностью, которая может быть неочевидна при анализе небольших периодов, но выявляется при усреднении результатов и оценке большого массива данных, когда начинают вылезать закономерности), за одного или одну и ту же группу номинантов и практически только за них, через практически непрерывную последовательность РАЗНЫХ ip-адресов, тем не менее сходных до степени смешения (по последней группе цифр и по второй с конца группе цифр). Даже теоретически не может быть такого, чтобы с сотен ip-адресов в абсолютно чёткой последовательностью (с 78.25.120.10, и затем ....11, ...12....13, так до 78.25.121. и там тоже с начала и до конца почти — и таких групп ДЕСЯТКИ) все голосовали практически абсолютно идентично и за одних и тех же номинантов (при этом за одного — особенно). И тут не один факт учитывается, а ещё и локализация такого «вброса» по времени и последовательности. Это не it-технологии, а математика. Тут даже обсуждать нечего, это 100%-я — безапелляционно! — накрутка. Мы брали только такие — очевидные — случаи. Собственно, у нас все ходы записаны, и если есть человек, который разбирается в больших массивах данных, могу спокойно предоставить таблицу выборки, из которой сразу ясно, где, как и за кого вбрасывали.
Надеюсь, получилось не слишком сумбурно и я удовлетворил ваше любопытство.
С уважением, Сергей Васильев.
+7 953 230-6666
icq 304651162
skype s.v.vasilyev
гументации устроителей конкурса судите сами)) Если коротко, банда краеведов добралась до ресурсов
интернет провайдера Март))
Дмитрий, судя по вашему e-mail вы каким-то образом относитесь к великолукскому провайдеру Mart.
Давайте я вам поясню то, что пояснял уже другим.
Если кратко, то любые подозрения в том, что голоса снимались как-то выборочно, абсурдны, так как мы в принципе не снимали голоса за конкретных номинантов — мы лишь поставили маску на вывод данных обо всех голосах с групп ip-адресов, с которых были замечены массовые голосования всего за одного, либо за одну и ту же группу номинантов, которые явственно нарушали принцип допустимости голосования не более одного раза в сутки.
Такие некорректные голосования были выявлены путём завода базы данных голосования в специальную программу для анализа и обработки больших массивов данных — это специализированное ПО, которым пользуются социологи, в службах статистики etc. При этом мы привлекали как раз специалиста-социолога.
Мы не списывали «двойственные» случаи, когда мы не были на 100% уверены в наличии некой «автоматизации» процесса. Во всех дисквалифицированных случаях прослеживались абсолютно чёткие закономерности. При этом всего в нескольких случаях были совершены попытки «простым способом» обмануть систему и проголосовать значительно больше 24 раз (сколько дней шло голосование на момент обнуления) с абсолютно одного и того же ip адреса через всевозможные «маски». При этом в таких случаях мы учитывали, что такой ip может быть промежуточным шлюзом и смотрели по нему именно динамику и конкретные данные голосования: за кого, когда. (Просто, как вы понимаете, не бывает, чтобы даже через такой шлюз от какого-то провайдера ВСЕ его клиенты в общем-то В КАКОЙ-ТО КОНКРЕТНЫЙ МОМЕНТ решили проголосовать сразу за пяток номинантов, и при этом практически абсолютно единообразно)
Для примера… Вы, я подозреваю, знаете, как устроен интернет? Так вот, напомню, что адрес соединения в IPv4 состоит из 4-х групп цифр, разделённых точкой. При этом последняя цифра может быть от 1 до 256.
Например: 192.190.10.10. Формально, этот адрес и, например, 192.190.10.11 — разные. И, скажем, могут принадлежать одному провайдеру, но разным пользователям в одном и том же, условно доме (или вообще в разных концах города). Однако по закону распределения вероятностей не может быть такого в принципе, чтобы со, скажем, ip 192.190.10.10 до 192.190.10.99 за один день практически без пробелов были поданы голоса — и все за одного или нескольких (одних и тех же) номинантов. То есть если бы это были адреса обычного городского провайдера сети, или сети в крупном офисном здании, в любом случае были бы пропуски или те или иные отклонения.
Однако мы как раз выявили порядка 30-40 групп ip-адресов, с которых шло именно такое «кристальное» голосование. Для примера — группа ip-адресов с цифрами 93.191.78 (и далее после точки — «от и до») — за коротких промежуток времени с этой группы было подано РОВНО по 200 голосов за 5 конкретных номинантов: марафон «Усабрь», Медовый фестиваль, Зоозащиту, печатную продукцию «Усабря» и экологическое движение ЭКА. То есть кто-то (мы не знаем — кто именно, поэтому не предъявляли претензий ни к одному из номинантов, хотя в некоторых случаях чисто по человечески нам, конечно, совершенно точно ясно — кто инициатор накруток) явно на стороне, воспользовавшись услугами на аутсорсе, заказал такую накрутку, оплатив ровно по 200 голосов.
Или вот у меня интересовались про голосование за Великолукскую встречу воздухоплавателей, Там история вообще интересная… За целую группу номинантов из Великих Лук и окраин (и Великолукский молочные комбинат, и начальник Великолукского отдела ФСКН, и настоятель храма Николая Чудотворца в Новосокольниках) регулярно и целенаправленно набрасывались голоса в «довесок» к голосам за одного номинанта — создателей сайт «Лукиград» (за других номинантов при этом голосов практически не было — почти всё по нулям, что невозможно по теории вероятности). В среднем, пропорция была такая — по 170-190 голосов для «Лукиград», и в среднем по 20-30-50 голосов для остальных. Возможно, голоса набрасывались из ложно понятного чувства местного патриотизма, или вообще для попытки замаскировать своё основное голосование. Тут, причём, использовалась одна из самых хитрых схем: вот таких групп ip-адресов, как случай описан выше, здесь были не единицы, а десятки. То есть — подряд с 109.238.96.xxx 109.238.110.xxx (а это, на секундочку, более нескольких тысяч голосов). [тут и далее — по ipinfo.io — это голоса великолукского провайдера «Март» — у нас есть предположение, что у создателей сайта «Лукиград» или им сочувствующим был доступ к серверам этого провайдера для возможности той или иной автоматизации голосования]. Ещё такие же группы, откуда пачками падали голоса за «Лукиград» и «группу поддержки» (то есть — по характерному паттерну) — 78.25.120.xxx — 78.25.123.xxx, с 88.28.163.xxx по с 88.28.167.xxx и т.д. и т.п. Таких по этим номинантам — десятки (не случайно Лукиград до обнуления фальсифицированных результатов успел «набрать» более 7000 голосов, когда у большинства номинантов — не больше чем 2-3 сотни было).
В отдельных случаях были и хитрее попытки нас обмануть — те, которые автоматизированно не предупредишь при всём желании — выявлять накрутки здесь пока можно лишь после обработки данных в специальной программе и выявления характерных аномальных паттернов голосования и уже с ними — детального разбора. Примерно так, если помните, доказывали вбросы на выборах в Госдуму в 2012 году — через построения график кривой зависимости Гаусса и выявления «аномальных» всплесков.
РЕЗЮМИРУЮ:
Дисквалифицированы были лишь ВСЕ голоса с тех ip-адресов, где прослеживались признаки АНОМАЛЬНОГО голосования, определяемого по совокупности нескольких пунктов: в короткий промежуток времени или с определённой ритмичностью, которая может быть неочевидна при анализе небольших периодов, но выявляется при усреднении результатов и оценке большого массива данных, когда начинают вылезать закономерности), за одного или одну и ту же группу номинантов и практически только за них, через практически непрерывную последовательность РАЗНЫХ ip-адресов, тем не менее сходных до степени смешения (по последней группе цифр и по второй с конца группе цифр). Даже теоретически не может быть такого, чтобы с сотен ip-адресов в абсолютно чёткой последовательностью (с 78.25.120.10, и затем ....11, ...12....13, так до 78.25.121. и там тоже с начала и до конца почти — и таких групп ДЕСЯТКИ) все голосовали практически абсолютно идентично и за одних и тех же номинантов (при этом за одного — особенно). И тут не один факт учитывается, а ещё и локализация такого «вброса» по времени и последовательности. Это не it-технологии, а математика. Тут даже обсуждать нечего, это 100%-я — безапелляционно! — накрутка. Мы брали только такие — очевидные — случаи. Собственно, у нас все ходы записаны, и если есть человек, который разбирается в больших массивах данных, могу спокойно предоставить таблицу выборки, из которой сразу ясно, где, как и за кого вбрасывали.
Надеюсь, получилось не слишком сумбурно и я удовлетворил ваше любопытство.
С уважением, Сергей Васильев.
+7 953 230-6666
icq 304651162
skype s.v.vasilyev
- +15
- Dim-77
- 23 января 2015, 13:12
Комментарии (33)
rss свернуть / развернутьсвернуть ветку
свернуть ветку
тистику, результаты сей статистической обработки послужили
основанием для аннулирования голосования.Блин, сколько сижу
в интернете, с подобным еще не сталкивался нигде и никогда.
Либо организаторы заранее принимают меры против накрутки
голосов, либо не проводят опрос вообще… Ну у ПАИ какой-то
особый путь.Важно, не как проголосуют, а как подсчитают…
э
свернуть ветку
свернуть ветку
свернуть ветку
за калаибур. Если меры против накрутки не приняли, кто им до-
ктор? Логично бы было все результаты аннулировать тогда…
свернуть ветку
В общем облажались и с подсчетом и с организацией.
свернуть ветку
Получается, что мы должны были голосовать за всех номинантов поочередно. Бред какой-то. И естественно, что своих друзей просила поддержать голосами не кого попало, а определенного номинанта, ну а друзья уже могли добавить и еще кого-нибудь и попросить об этом же своих друзей.
Навертели с ответом… написали много, а не сказали толком ни о чем…
свернуть ветку
свернуть ветку
свернуть ветку
Там же не дураки сидят, в письме вроде всё доходчиво объяснил, что и как.
Мотальщики прочитают — вот что значит
свернуть ветку
Изначально голосование было организовано таким образом, что допускало накрутку голосов.
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
Рекламы было мало. Надо было поагрессивней рекламную акцию проводить как у зоозащитников.
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
ко всем же относится?
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку
свернуть ветку