17 мая 2017

8 интересных вещей, которые вы наверняка не знали о Google-алгоритме

Время чтения: 10 мин.

Нечасто увидишь слова « интересно» и «алгоритм» в одном предложении. (Ладно-ладно, может и часто, если вы такой же маркетинговый ботан, как и я). Но только подумайте об этом: компания Google существует уже больше двух десятилетий. За такую-то долгую историю наверняка они уже кучу всяких интересностей напридумывали, верно?

Хотите верьте, хотите нет, но алгоритмы – это действительно круто. Ну, они подсчитывают и выдают нам результаты наших исследований. Но вот как же Google-алгоритмы работают? И как они развивались в течение всех этих лет?

Мы подумали, что вы наверняка об этом спросите, так что собрали несколько интересных фактов о Google-алгоритме и о том, как он стал таким, каким мы знаем его сегодня.

Ну и что же такое этот ваш алгоритм?

Как говорит сам Google: «Алгоритмы – это такие компьютерные процессы и формулы, которые забирают ваши вопросы и превращают их в ответы». Они пробегают по оцениваемым «триллионам» существующих веб-страниц, чтобы найти нужную для вас информацию. Просто на секундочку задумайтесь. «Триллионы». Один триллион в виде числа выглядит вот так:

1,000,000,000,000

Представьте, что было бы, если бы алгоритмов не существовало, и нам бы приходилось самим как-то выискивать нужные странички среди этого невообразимого количества информации. К счастью, компания Google разработала алгоритм, который умеет считывать – в таком темпе, в котором мало кто из людей способен вообще воспринимать информацию,  – разные сигналы с этих страниц, которые показывают, насколько велика вероятность, что у них есть то, что вам нужно в соответствии с поисковым запросом.

Но это касается не только слов на странице. Алгоритмы также умеют понимать, насколько часто запрашивается тот или иной контент, насколько велика вероятность того, что он – спам, и как он относится к вашему местоположению.

Маркетологам важна вся эта чепуха. Где и как ваши страницы ранжированы в Google напрямую влияет на органический трафик сайта, так что очень важно понимать, как работают алгоритмы и как можно оптимизировать себя под них. Более того, адаптироваться под них просто жизненно необходимо, так как Google-алгоритмы за эти годы менялись множество раз, и будут продолжать меняться, каждый раз становясь все более удобными.

8 интересных фактах о Google-алгоритме

1) Общий алгоритм Гугла носит свое гордое имя с 2013 года: Hummingbird (Колибри).

Источник: Search Engine Land

Если вы постоянно подстраиваетесь под Google-алгоритмы, то наверняка замечали их яркие мена: Panda (Панда), Penguin (Пингвин), and Pigeon (Голубь), – лишь некоторые из них.

Однако эти имена присваивались лишь обновлениям, производимым в самом алгоритме, который сейчас носит имя Hummingbird. Формально оно было озвучено в сентябре 2013 и по словам Search Engine Land [SEL] подчеркивает то, что этот алгоритм стал еще более «точным и быстрым», прямо как сама птичка.

SEL предложила одну из самых лучших аналогий, которые нам когда-либо приходилось видеть: Hummingbird – это «рецепт» из сотен «ингредиентов». Эти ингредиенты – разные кусочки, помогающие алгоритму определять качество тех триллионов страниц специально для вас.

2) Google вносит изменения в свой алгоритм около 500 раз в год.

Source: pyxle

SEO-сообщество Moz утверждает, что Google ежегодно вносит в свой алгоритм от 500 до 600 поправок, большинство из которых настолько малы, что о них обычно публично не заявляют.

Однако даже без учета этих мелких изменений Moz насчитало не меньше 140 обновлений Google-алгоритма с 2000 года. Этот список был довольно насыщенным, так что я привлек своего коллегу, чтобы он помог мне точно посчитать, сколько же их было на самом деле.

Разделив список на две колонки – 8 лет до и после 2008 года соответственно, – мы заметили кое-что интересное. Первые восемь лет насчитывали лишь 25 обновлений, а последние – целых 115.

Так почему же так много обновлений было сделано именно в последние годы? Наверняка это как-то связано с массовым увеличением числа интернет-пользователей. Но так же это касается и способов, которыми мы ищем.  51% цифровой мультимедиа потребляется через мобильные устройства – что спровоцировало не один  сбой Google из-за страниц, не оптимизированных под эти платформы.

Сегодня мы так же наблюдаем резкий скачок популярности голосового поиска. И пока не существует точных формул планирования или ранжирования запросов этого типа, мы уже представляем, что Google начнет изменять свой алгоритм под них – в конце концов, с 2008 года наблюдается прирост в 3400% в голосовых запросах.

Как мы уже говорили, чтобы понять алгоритм, нужно действовать оперативно. Он никогда не перестанет меняться, так что чтобы сайты продолжали занимать хорошие поисковые позиции, маркетологи должны учиться адаптироваться.  

3) Одной из первоначальных целей алгоритма было выявление рекламного спама.

Источник: Stanford InfoLab

«История» Google берет свое начало приблизительно 20 лет назад: в далеком 1997 году со-основатели Ларри Пейдж и Сергей Брин работали над своим первым поисковиком, который позже был назван BackRub.

Затем, в 1998, они опубликовали работу в Стэнфорде под названием «Анатомия системы крупномасштабного гипертекстового интернет-поиска». В ней и увидели свет первые упоминания о PageRank – технологии, которую Google до сих пор использует для ранжирования результатов поиска.

Но есть в этом довольно плотном тексте одна действительно выделяющаяся вещь. Во время написания этой работы Пейдж и Брин заметили, что «доминирующей бизнес-моделью для коммерческих поисковых систем является реклама. Цели рекламной бизнес-модели не всегда соответствуют обеспечению качественного поиска для пользователей».

Мы просто сходим с ума от того факта, что Google до сих пор остается верен этому положению. До написания этой статьи я побеседовал насчет алгоритма со своим коллегой Маркусом Эндрюсом на тему алгоритма, и он мне сказал, что «Google очень сосредоточен на пользователе».

На самом деле можно сделать вывод, что именно это служит причиной столь большого числа обновлений алгоритма – нахождение новых путей поиска лучшего контента для пользователей.

 

4) PageRank был назван в честь со-основателя Google Ларри Пейджа (Larry Page)

Источник: Stanford InfoLab

Когда технологии присваивается имя “PageRank”, кажется что это делается чисто интуитивно (page – страница, rank – рейтинг, ранжирование). Но на самом деле она была названа в честь одного из основателей Google – Ларри Пейджа, чья юная фотография смотрит на нас справа с картинки чуть выше. У самой технологии PageRank есть своеобразная история. Будучи весьма полезной, она казалась запутанной даже некоторым экспертам SEO. Именно поэтому SEL опубликовала статью-обзор “Что такое Google PageRank?”, и мало кто ее понял.

Сам Google говорит, что PageRank – это то, что «смотрит на ссылки между страницами, чтобы определить их актуальность». Но SEL утверждает, что это больше похоже на систему голосования, в которой внешние ссылки на страницу считаются голосами за избираемых лидеров.

Решающий довод? Кто угодно может просмотреть PageRank сайта.

Весной 2016 Google объявил, что хотя компания продолжит использовать технологию PageRank для внутренней отладки своего алгоритма, но публике больше не будет доступна никакая ее информация.

Согласно «ретроспективе того, как [PageRank] разрушила сеть» от SEL, для некоторых это стало прекрасной новостью. По всей видимости акцент делался на то, что на PageRank ссылались при создании огромного количества раздражающего, граничащего со спамом контента – например, ссылки, которые можно было просто купить.

Сегодня же технология ранжирования стала более взыскательной во многом благодаря MozRank для SEO и отслеживанию конкуренции.

 

5) А вот и Google Dance (танцы) – но это совсем не то, о чем вы можете подумать.

Источник: Search Engine Land

 

Нашим внутренним маркетинговым ботаникам хотелось бы, чтобы «The Google» было действительно физическим танцевальным движением. Однако на самом деле Google Dance назвали внезапные изменения в ранжировании, когда алгоритм тотально менялся каждый месяц.

Marketing Land обязана форуму WebmasterWorld идеями терминов, а также разными географически вдохновленными именами для каждого танца, вроде «Бостона» в феврале 2003 и «Флориды» позже в том же году. Но кажется, Флорида была последним танцем, ну или последним выдающимся танцем. Потому что именно тогда Google перестал выпускать тотальные обновления алгоритма каждый месяц, вместо этого начав стратегию мелких поправок, которой придерживается и по сей день.

В отслеживании этих изменений, особенно единичных и мелких, может помочь Google Weather Report от MozCast. Он определяет температуру, показывающую, как алгоритм изменился за последний день: чем выше температура и чем страшнее буря, тем значительнее изменения в ранжировании Google.

Не расстраивайтесь: ранее в этом году в Google состоялось мероприятие на SMX West conference под названием «Google Dance», на котором праздновалось «ежегодное собрание поисковых маркетологов».

 

6) Нет *реально* никакой первопричины, стоящей за названиями обновлений

Источник: Wade Creative Network

Мне очень хотелось бы верить, что за названием обновления «Пингвин» стоит какая-то умилительная история. Но согласно Moz, Google не придерживался никаких формальных методов наименования.

То же самое касается и «танцующих» названий: пользователи WebmasterWorld так же дали имена большинству остальных обновлений – «Бостон», так как оно было анонсировано на SES Boston; другие назывались в честь ураганов, хотя ходит слух, что имя «Dominic» досталось очередному обновлению от бостонской пиццерии.

Moz так же сообщает, что некоторые «самозванные» обновления алгоритмов, вроде «Caffeine» (кофеин),  «Panda» (панда) и «Vince» (Винс) произошли из самого Google, а последние два были названы в честь инженеров Google. 

7) Алгоритмы все больше приспосабливаются к поиску по картинке.

Источник: Forbes

Недавно компания Google анонсировала выход новейшего смартфона Pixel. Чем может похвастаться? «Лучшей в истории камерой для смартфона. »

То, что делает эту камеру такой крутой, – «первоклассные программные алгоритмы», – сказал руководитель продукта Исаак Рейнолдс.

К ним можно отнести алгоритм HDR+, помогающий пользователям делать снимки высокого качества при любом освещении и в движении.

А как это связано с поисковым алгоритмом Google? Напрямую никак не связано. Но это показывает еще более сильный прогресс в стремлении обеспечить пользователей лучшим контентом, в том числе фотографиями. В области визуальных запросов все лежит на плечах Cloud Vision API – технологии, позволяющей Google анализировать и определять содержимое картинок.

В конце 2015 года Google открыла доступ к API, чтобы гики вроде меня смогли поиграть с ним и посмотреть, как он распознает содержимое их собственных фотографий. Естественно сначала мне захотелось его немного «разогреть», и я скормил ему фото моей собаки:

Затем я испытал его этой замечательной фотографией команды нашего блога: 

Вау. А как это он узнал, что я загрузил фото черной собаки? И каким образом ему удалось распознать радость на лицах членов нашей команды?  

Так это же тот самый хитрый замечательный алгоритм, который кто-то запрограммировал – мы уже предсказываем тонны существующих фотографий с разными выражениями лица, объектами, достопримечательностями и прочим другим.

 

8) Есть здесь и человеческая сторона – «поисковые оценщики».

Источник: Google

Компания Google привлекает к работе людей для оценки качества результатов поиска. Каждый год проводится около 40 000 этих «оценок точности», как их называет Google, в каждой из которых поисковые оценщики определяют качество результатов по разным запросам.

Вот 146-страничный документ с критериями и инструкциями, согласно которым специальные люди оценивают качество этих результатов. И вроде бы он предназначен для людей, желающих стать оценщиками. Но помимо этого содержащаяся в руководстве информация также помогает разработчикам и маркетологам понять, что же представляет из себя качество поиска.

Некоторые его разделы могут также быть полезны для новичков в мире SEO. Загляните в раздел «Кошелек или Жизнь» (“Your Money or Your Life” ), в котором в качестве примера оценивается потенциал страницы о пользовательском здоровье и финансах. Некоторые критерии могут показаться очень уж обобщенными, но там так же представлены и некоторые специфические выводы о том, как поддерживать понятность своего контента, особенно если вы даете совет.

Там также есть еще три разных разделах, посвященных страницам самого высокого, самого низкого и среднего качества. И снова: то, что поначалу кажется чем-то очевидно-обобщенным, на самом деле несет в себе очень важную для маркетологов информацию. Например, если у страницы «истинно отсутствует цель», она будет причислена к классу «самого низкого качества».

Это кое-что, что действительно стоит держать в уме во время разработки и управления своим контентом. Перечитайте еще разок свои статьи и посмотрите, не стоит ли там чего-нибудь изменить.

Веселого поиска

Итак, теперь вы знаете, что алгоритмы могут быть интересными и веселыми, особенно когда у вас появляется возможность поиграть с API-распознавалкой фотографий.

А что касается такой богатой истории, как история Google-алгоритма, так тут обязательно найдется что-нибудь интересненькое и не без всплеска драмы по пути.

Мы с нетерпением ждем, что же будет дальше. И как всегда наготове проинформировать вас новыми постами.

А какие у вас любимые события из истории Google-алгоритма? Поделитесь в комментариях.