У травні 2024 року сталося важлива для SEO-індустрії подія. Голова компанії EA Digital Eagle Ефран Азимі звернув увагу на добірку внутрішніх документів Google, у яких на понад 2500 сторінках детально описувалися алгоритми роботи пошукової системи. Примітно, що застосування багатьох виявлених систем та параметрів ранжування заперечувалося представниками Google. Те, про що інтуїтивно здогадувалося багато веб-майстрів, стало достовірним.

Документація з'явилася на Github ще у березні 2024 року і протрималася там до 7 травня. Провідні SEO-експерти Майк Кінг та Ренд Фішкін опублікували свої огляди на результати витоку та поділилися висновками з широкою публікою. Довгий час Google мовчали, але зрештою визнали витік даних та підтвердили справжність документації.

«Ми застерігаємо від неправильних припущень про пошук на основі вирваної з контексту, застарілої або неповної інформації», — повідомив представник Google Девіс Томпсон у своєму листі. «Ми поділилися великою кількістю інформації про те, як працює пошук, і типами факторів, які враховуються в системах, а також працюємо над захистом результатів від маніпуляцій».

Варто звернути увагу на два моменти. По-перше, невідомо точно, чи змінилася система видачі на цей момент, витік характеризує стару версію пошукової системи. По-друге, незважаючи на колосальний обсяг інформації, в документах не йдеться про те, як саме ранжуються результати та враховуються атрибути. У будь-якому випадку, інформація залишається цінною для всієї маркетингової індустрії.

Далі розглянемо найбільш цікаві знахідки.

Що з'ясувалося з витоку

Авторитет сайтів

У документах бачимо метрику «siteAuthority». Google враховує авторитетність доменів у видачі, хоча раніше це заперечувалося. Що саме алгоритми враховують в авторитетності сайту – невідомо, але очевидно, що на це впливає сукупність різних сигналів.

The image is a screenshot of a Twitter conversation. The conversation involves three tweets and appears to discuss the impact of backlinks on domain authority. The text of the tweets is as follows: Tweet by //Andrew Rodgers (@AndyNRodgers) on October 27, 2016: "@JohnMu Would a backlink to a jpg URL have the same impact in the algorithm as a static URL? @methode" Engagement: 1 like, 2 retweets Tweet by //Andrew Rodgers (@AndyNRodgers) on October 27, 2016 (reply to the first tweet): "Not sure I understand. For overall domain authority would a backlink to a jpg URL be as impactful as to a webpage URL?" Engagement: 1 like Tweet by Gary Illyes (@methode) on October 27, 2016 (reply to Andrew Rodgers): "we don't really have 'overall domain authority'. A text link with anchor text is better though" Timestamp: 8:34 AM · Oct 27, 2016 from Kebayoran Lama, Indonesia The image also includes profile pictures and names of the participants in the conversation.

Кліки мають значення

Google повідомляли, що вони враховують кліки в ранжуванні сайтів. Однак завдяки витоку стало зрозуміло, що кліки безпосередньо впливають на видачу сайту в пошуковику. У документації можемо зустріти такі метрики, як хороші та погані кліки, довгі та короткі. Також можна зустріти згадку про «останній хороший клік». Останнє означає, що на ранжування впливає якість контенту та трафік на актуальний момент. При погіршенні трафіку сторінка сайту в рейтингу знижується. Зберігаються не тільки кліки, але й час сеансу, пов’язаний із ними. Таким чином, пошукова система відстежує весь шлях користувача на сайті і отримані дані використовує для ранжування.

Пісочниця сайтів та Page Trust

У всіх нових і «маленьких особистих» сайтів автоматично знижується рейтинг, доки до них не зросте довіра системи. У документації було виявлено атрибут «hostAge», який використовується для ізоляції свіжого спаму. Не зовсім зрозуміло, що відноситься до маленьких сайтів, можливо, невеликі односторінкові сайти, лендинги та блоги. У «пісочниці» сайт знаходиться 3 місяці і після цього терміну до нього застосовуються всі інші фільтри, що застосовуються в системі.

The image is a screenshot of a Twitter exchange between two users discussing the concept of the Google sandbox for new websites. The text of the tweets is as follows: Tweet by Vijay Kumar (@VijayKumarIM) on August 19: "That's great to hear from you... Usually how long does it take to relieve from Google sandbox for new website?" Engagement: 1 like Reply by John (@JohnMu) on August 19: "There is no sandbox." Timestamp: 10:48 AM · 19 Aug 2019 Engagement: 7 likes, 3 retweets The reply is highlighted by the user's profile picture and verification checkmark, indicating it is a response from a verified account.

Заголовки та описи

На рейтинг сайту впливає те, наскільки заголовки та описи сайту відповідають запитам користувачів. У документації можна знайти метрику «titlematchScore». Чим більше заголовок відповідає пошуковому запиту та ключовим словам, тим більше шансів на підвищення сторінки у видачі. Крім цього, заголовок та опис сайту повинні відповідати решті контенту на сайті.

Свіжість публікацій та якість посилань

Серед метрик можна знайти дати публікацій та їхню свіжість. Свіжі сторінки відносяться до контенту вищої якості. Ваші посилання повинні приходити з найбільш свіжих сторінок або сторінок, які опинилися в топі видачі з інших причин. Щодо дат публікацій, потрібно ще враховувати, що дати краще прописувати в кожному оновленні, заголовку тощо і бути послідовним. Протилежні дати можуть вплинути на зниження у рейтингу.

The image contains a snippet of technical documentation describing the attribute "sourceType." The text is as follows: sourceType Type: integer(), default: nil Description: is to record the quality of the anchor's source page and is correlated with but not identical to the index tier of the source page. In the docjoins built by the indexing pipeline (Alexandria), anchors marked TYPE_HIGH_QUALITY are from base documents. Anchors marked TYPE_MEDIUM_QUALITY are from documents of medium quality (roughly but not exactly supplemental tier documents). Anchors marked TYPE_LOW_QUALITY are from documents of low quality (roughly but not exactly blackhole documents). Note that the source_type can also be used as an importance indicator of an anchor (a lower source_type value indicates a more important anchor), so it is important to enforce that TYPE_HIGH_QUALITY < TYPE_MEDIUM_QUALITY < TYPE_LOW_QUALITY. To add a new source type in future, please maintain the proper relationship among the types as well. TYPE_FRESHDOCS, only available in freshdocs indexing, is a special case and is considered the same type as TYPE_HIGH_QUALITY for the purpose of anchor importance in duplicate anchor removal. This attribute is an integer used to record the quality of the anchor's source page, correlated with the index tier of the source page. It categorizes anchors into high, medium, and low quality, and can also serve as an importance indicator for anchors. There are specific rules for maintaining the relationship among different types, including a special case for freshdocs indexing.

Алгоритми заниження позицій

У документі можна знайти алгоритми зниження. Нижче розглянемо, що може вплинути на зниження сайту в рейтингу:

  • невідповідність якоря – посилання не відповідає цільовому сайту, на який воно посилається;
  • зниження рейтингу SERP — сигнал, який вказує на зниження рейтингу на основі факторів, що спостерігаються в SERP (поведінка користувача вказує на невдоволення сайтом);
  • зниження рейтингу навігації — це зниження рейтингу, застосовуване до сторінок, що демонструють погану навігацію або проблеми з інтерфейсом користувача;
  • зниження доменів із точною відповідністю — домени, які точно відповідають пошуковому запиту користувача;
  • зниження місця розташування — «глобальні» сторінки та «суперглобальні» сторінки можуть бути знижені;
  • зниження в порно — це досить очевидно.

Робимо висновки

Після отриманої інформації стає очевидним, що SEO має бути більшим за просто оптимізацію. Ми не можемо стверджувати прямо, що Google застосовує показник E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness), але побачені сигнали та метрики можуть на це вказувати.

Нові сайти будуть знижуватися у видачі, доки не побудують бренд, не здобудуть репутацію та свою аудиторію. Стратегії SEO можуть виявитися для них малоефективними.

Для підвищення сайту в рейтингу потрібно працювати над органічним та природним розвитком бренду

Що сюди відноситься?

Релевантність. Тематика сайту та сторінок у ньому має бути релевантною до запитів користувачів. Критерію релевантності мають відповідати всі внутрішні та зовнішні посилання, заголовки, описи, навігація та гео.

Актуальність. Контент на сайті повинен постійно оновлюватися відповідно до потреб користувачів. Не забувайте вказувати свіжі дати в структурі сайту.

Зручність інтерфейсу. Щоб сайт підіймався у видачі, недостатньо лише клікати на сторінку з пошукової видачі. Оскільки система враховує всі кліки користувача на сторінці, їх якість і час проведеного сеансу, потрібно зробити сайт зручним для користувача.

Унікальність. Знову ж таки, щоб утримати користувача на своєму сайті, ви повинні надати йому унікальну інформацію та користувацький досвід, яких немає у конкурентів.