Вы здесь

Как Google индексирует Twitter?

4 февраля 2015 года новости о сделке Google и Twitter распространились по всему Интернету, а 19 мая соглашение вступило в силу.

Можно наблюдать большой рост индексирования твитов в Google, но об индексировании всех твитов речь пока  не идёт. Google всё ещё выбирает, что можно индексировать, и, вне сомнений, более расположена к людям с большим количеством подписчиков или «авторитетных» личностей.

Индексирование твитов выросло с 0,6% в феврале до 3,4% в июне, увеличившись на целых 466%. При этом 96% твитов всё ещё остаётся вне пределов индекса Google. Я ни в коем случае не думаю, что на этом всё закончится. Готов поспорить, Google тестирует много чего в процессе интеграции Twitter и со временем мы увидим изменения.

В этом видео я объясняю, почему Google не нужно индексировать все твиты, даже несмотря на то, что у компании есть полный доступ к ним:

 

История

Нам легко поверить в то, что Google собирает все данные, которые есть в Интернете. В конце концов, для этого у них существует самая лучшая инфраструктура. Тем не менее, это не значит, что у них нет ограничений. Они есть, и компании приходится выбирать. Даже в свете новой сделки с Twitter, имея доступ ко всем твитам, им слишком сложно индексировать всё.

Это не значит, что их коэффициент индексации не будет повышаться со временем. Это произойдёт, но только после того, как они найдут эффективное применение дополнительным данным.

Покажите детали!

Одним из самых интересных  вопросов остаётся то, как быстро Google индексирует твиты. Люди давно считали, что поисковик всегда делает акцент на свежести твитов. Поэтому мы оценивали твиты по дням, в первые семь дней. Что изменилось с февраля по июнь можно увидеть ниже:

Есть чёткий признак того, что Google существенно повысила индексацию (на 466%). В этом нет ничего удивительного, и это приносит много пользы Twitter. Тем не менее, Google всё ещё НЕ индексирует 96,6% данных. Заметьте, индексация Twitter повышается в долгосрочной перспективе – на 12% из всех протестированных твитов (88% всё ещё не проиндексированы).

Мы также рассматривали индексацию по количеству подписчиков. Как в феврале, так и в июне есть много того, что указывает на индексацию контента от людей с большой базой подписчиков:

При этом период времени для выборки данных по июню составлял 7 недель, так что более старые твиты из образца были созданы до того, как новая сделка вступила в силу, и показатели повышения немного подавлены этим.

Чтобы посмотреть на отличия, мы также рассмотрели данные на сервисе Followerwonk Social Authority:

 

Используя Social Authority, можно увидеть всё более подробно, потому что в расчет берется уровень заинтересованности в твитах пользователя (чего не даёт обыкновенный подсчёт подписчиков). В этом контексте легко увидеть сильное расхождение с индексированием контента от авторитетных пользователей.

Это предполагает, что при выборе объекта индексирования Google смотрит не только на количество подписчиков.

Методология

В этом исследовании мы использовали определённых пользователей. Данные выбраны по 900+ пользователям, которых рассматривали как в феврале, так и в июне  этого года. Тех же пользователей мы принимали в расчет при тестировании индексирования Twitter в июле 2014 года.

Использование одинаковых пользователей важно, потому что мы не знаем, какие критерии Google может использовать для оценки необходимости индексации. Тем не менее, используя одинаковых людей, мы пытаемся убрать переменные параметры.

Итоги

Индексирование Twitter в поисковике Google значительно улучшилась – в 4,66 раза. Это много, но они всё ещё не индексируют большинство твитов.

Я ожидаю увидеть значительные изменения в дальнейшем использовании Google данных Twitter.

Источник


SNCE Рекомендует:

Будьте в курсе новостей индустрии, получайте только полезную информацию

Скоро... Подпишитесь чтобы узнать первым!