Возможен ли вариант что группа людей (скажем человек 50), договорилась и заполнила анкеты демпинговыми данными (например сказали что они получают 100 долл и не больше, или наоборот поставили 3000). Тогда ведь актуальность информации теряется.Гарантировать - не можем. Я даже не могу оценить количественно достоверность нашей статистики, мы ведь не делаем статистическую выборку. С анонимным анкетированием от накруток особенно сложно защититься, т.к. нет идентификации пользователей.
Можете ли вы гарантировать что накрутчики не влияют на рейтинг и он не выходит за рамки погрешности проценов в 5?
Сейчас все анкеты просматриваются модератором и при необходимости отклоняются. Вот последние анкеты (3 - Киев):
+-----------+-----------------+----------------+----------+----------+
| survey_id | submission_date | monthly_salary | status | location |
+-----------+-----------------+----------------+----------+----------+
| 6160 | 2008-11-03 | 1200 | approved | 3 |
| 6159 | 2008-11-03 | 3000 | | 3 |
| 6155 | 2008-11-02 | 1700 | approved | 3 |
| 6154 | 2008-11-02 | 2700 | approved | 3 |
| 6153 | 2008-11-02 | 2000 | approved | 3 |
| 6150 | 2008-11-01 | 700 | approved | 3 |
| 6147 | 2008-11-01 | 6000 | | 3 |
| 6146 | 2008-11-01 | 1250 | approved | 3 |
| 6143 | 2008-11-01 | 1200 | approved | 3 |
| 6142 | 2008-11-01 | 1320 | approved | 3 |
| 6141 | 2008-11-01 | 1300 | approved | 3 |
| 6140 | 2008-11-01 | 1500 | approved | 3 |
| 6133 | 2008-11-01 | 1850 | approved | 3 |
+-----------+-----------------+----------------+----------+----------+
Плюс график динамики зарплат на главной рассчитывается по упрощенной схеме.Но в целом, да, это проблема. Т.е. накруток (аномальных всплесков активности) пока замечено не было, но не могу гарантировать что их не было в прошлом или что мы сможем отразить такую атаку в будущем.
Но это не значит, что сделать ничего нельзя. Обещаю заняться системой анти-флуда как только запустим новую Базу Компаний. Есть несколько идей, что можно сделать, но говорить подробно не хочу. ;)
Ваши идеи и помощь с реализацией принимаются с благодарностью.
1 коммент.:
проще всего по 6 сигме выкинуть данные слишком вылезающие за общий тренд.
Отправить комментарий