А почему не использовать готовые решения? Google Analytics, LiveInternet e.t.c..? Они ботов вычленяют достаточно адекватно. Да, выпадает и часть полезной статистики, но в целом система работает.
p.s. Просто у вас соотношение какое‑то уж сильно странное.
ShaDart, «готовые решения» — конечно же используются. Все сравнения приведены как раз с ними. Причем между «готовыми» решениями — расхождения в подсчете — меньше конечно, но тоже выходят за рамки «нормальной стат‑погрешности»... вот и решил проверить... :(
Там еще интересный момент есть: Директ утверждает о заходе, ну например в, 100 посетителей «чисто наши». Переходы с директа в заголовках отмечены соответственно... по крайней мере при утверждении в 100 заходов я их вижу. Правда не в таком количестве, а всего... 10. т.е. ладно, если они теряют данные в силу дальности, загруженности и т.д., но вот когда НАХОДЯТ — становится интересно. У меня‑то столько ЛЮДЕЙ — не регистрируется... :)