Третьего марта Google объявил, что скоро в его существовании откроется "новая глава". Он готовится запустить алгоритм, индексирующий контент практически сразу после его публикации. Об этом рассказал на конференции Search Marketing Expo менеджер продуктов Google Дилан Кейси.

Владельцы сайтов должны будут самостоятельно добавлять свежий контент в Google для мгновенной индексации. Аналитик Дэнни Салливан предположил, что Google придется серьезно поработать над отсеиванием спама на этой стадии.

Система будет работать на основе протокола синдикации в реальном времени PubSubHubbub (сокращенно - PuSH). Протокол основан на формате данных ATOM. Владельцам сайтов, которые желают воспользоваться возможностями мгновенной индексации, придется интегрировать этот протокол в свои сайты. Принцип работы аналогичен RSS: если сайт поддерживает протокол, Google получит возможность увидеть его поток и подключить к мгновенному индексу. PuSH не заменит традиционного краулинга – последний нужен как минимум для того, чтобы, обходя сайты, обнаруживать потоки данных.

Основную выгоду от нового протокола получат владельцы маленьких сайтов – среди них много таких, на которые индексирующий бот Google заходит не чаще раза в неделю. Кроме того, возможно, улучшится ситуация с определением первоисточника контента.

При этом PuSH – открытый протокол, и создаваемые им потоки (feeds) смогут видеть и Yahoo!, и Bing, и другие поисковики, которые захотят добавить мгновенную индексацию. Много интересного об устройстве протокола PuSH и о том, какую он пользу может принести, содержится в презентации, опубликованной на ReadWriteWeb. (с) Ашманов и Партнеры