Статистика сайта - ответы на вопросы и не только...
- Статистика веб-сайта родилась из вопросов;
- Кому нужна статистика сайта;
- Сколько на самом деле стоит cтатистика сайта;
- Говорим на одном языке - проблема терминологии.
Говорим на одном языке - проблема терминологии.
В процессе анализа статистики сайта постоянно возникает путаница как с понятиями, описывающими статистические события, так и с обычной Интернет-терминологией.
Это происходит из-за большого количества участников формирующих эти самые понятия - фирм-производителей программного обеспечения, авторов книг, журналистов, сетевых сообществ и так далее. Они достаточно вольно описывают разные алгоритмы и способы подсчета статистики сайта, называют одинаковыми терминами разные понятия, или наоборот разными терминами одно и тоже, словно специально запутывая конечного пользователя.
Надо разобраться в терминах. Для этого последовательно рассмотрим все термины и понятия с учетом предметной области данной статьи - изучение статистики веб-сайта.
Хост (от англ. host - "хозяин") - сущность сети обладающая IP-адресом. Как правило, это персональный компьютер, сервер или коммутационное устройство. Функционирование сети Интернет заключается в обмене различными данными между хостами.
Сервер - компьютер, предназначенный для бесперебойной работы программного обеспечения.
HTTP (от англ. HyperText Transfer Protocol - "протокол передачи гипертекста") - сетевой протокол прикладного уровня для передачи файлов. Основным назначением http является передача веб-страниц. Именно это "http" мы видим в начале адресной строки браузера.
HTML (от англ. Hypertext Markup Language - "язык разметки гипертекста") - это стандартный язык разметки документов для веб-сайтов.
HTML-документ - текстовый файл с разметкой HTML, обычно содержит ссылки для быстрого перехода на другие страницы, а также ссылки на картинки. Часто называют гипертекстовым документом или просто гипертекстом.
Веб-сервер - программное обеспечение, принимающее и обрабатывающее запросы по http-протоколу. Фактически веб-сервер, обрабатывая запросы, отдает по http-протоколу файлы (html-документы, картинки и т.д.). Наиболее известные веб-сервера Apache и IIS.
Запрос (http-request) - специально сформированный пакет данных, посылаемый Вашему веб-серверу неким потребителем информации. Запрос содержит: требование на получение файла по указанному адресу, подпись агента - программного обеспечения сформировавшего запрос, адрес ссылающейся страницы и т.д.
Хит (от англ. hit - попадание) - событие, возникающее при выполнении веб-сервером запроса от потребителя. Запись о каждом хите производится в лог-файлы веб-сервера и содержит сам запрос, его время, IP-адрес потребителя и т.д. Так как веб-страница, обычно содержит сам html-документ и картинки оформления, то при просмотре страницы засчитывается целая серия хитов.
Веб-страница (или просто страница) - в самом простом случае это html-документ. Однако, как правило, html-документ содержит ссылки на элементы оформления - картинки. Поэтому чаще веб-страницей называют те данные, которые видят в браузере по конкретному адресу.
Веб-сайт - совокупность веб-страниц, которые доступны в Интернете через http-протокол. Страницы веб-сайта объединены общим корневым адресом - доменным именем.
Интернет адрес (веб-адрес, адрес) - это код позволяющий определить местоположение информации в сети Интернет. Обычно состоит из трех частей - используемый протокол, полное доменное имя, путь к файлу. Например, http://www.cnstats.com/ru/index.php
Браузер - программа для просмотра веб-сайтов. Браузер генерирует по команде человека запросы к веб-серверу и отображает веб-страницы полученные в ответ. Для корректного отображения веб-страницы браузеру обычно приходится делать серию запросов к веб-серверу: сначала скачать саму страницу (html-документ), затем скачать все картинки которые должны быть отображены на странице. Обычно характеризуется подписью агента и поддержкой cookie.
Робот (поисковый робот, паук) - программное обеспечение различных веб-сервисов (поисковых машин, веб-архивов, валидаторов кода и т.д.). Роботы по определенным алгоритмам формируют запросы к веб-серверу для получения информации с веб-сайта, например, перебирают все страницы сайта, с целью их индексации.
Посетитель - "потребитель" веб-сайтов, обычно это либо браузер, либо робот.
Просмотр (посещение или визит) - событие, возникающее при просмотре веб-страницы. Обычно характеризуется: временем просмотра, описанием потребителя (IP-адрес, используемый агент и т.д.), адресом самой веб-страницы и адресом ссылающейся страницы.
Сессия - серия просмотров страниц одним посетителем, в течение определенного времени. Обычно характеризуется: временем начала и конца, описанием посетителя (IP-адрес, используемый агент и т.д.), последовательным перечнем просмотренных страниц.
Пользователь - человек, который работает с веб-сайтом с помощью браузера. Для подсчета пользователей используются различные методики - словари используемых агентов, поддержка cookie, характер поведения и т.д.
Статистика сайта - сокращение от Статистика посещаемости веб-сайта.
Статистика посещаемости веб-сайта - отрасль знаний, в которой излагаются вопросы сбора, измерения и анализа количественных данных о посещениях веб-сайтов.