Jaką rolę odgrywa data publikacji w pozycjonowaniu stron internetowych?

Patent Google

Written by:

Ocena dokumentu po przez datę jego uruchomienia

Document scoring based on document inception date

Patent opisuje w jaki sposób Google rozpoznaje datę utworzenia dokumentu oraz w jaki sposób wykorzystuje ją w rankingu. Intencją Google jest by dostarczać użytkownikom najbardziej relewantne treści. Rozwiązanie zapisane w patencie ma zapewnić, że „nieświeże treści” nie zepsują rankingu.

Patent zaznacza, że czas utworzenia dokumentu wcześniejszy, bądź późniejszy względem innych jest wykorzystywany do nadania mu punktacji. W pewnych okolicznościach starsza data da więcej punktów, w innych młodszy dokument otrzyma więcej punktów. Data może zarówno pogarszać jak i poprawiać pozycje.

Proces oceniana daty w rankingu Google

Jak google rozpoznaje date dokumentu

Data uruchomienia dokumentu (Document Inception Date) – Google przypisuje datę do konkretnego dokumentu. Możliwe metody pomiaru tej daty:

  • pierwsza indeksacja dokumentu,
  • data pierwszego odkrycia linku prowadzącego do dokumentu,
  • data rejestracji domeny na której jest dokument,
  • data pojawienia się pierwszego odwołania do dokumentu w grupie innych dokumentów np. newsów na stronie,
  • wykorzystanie daty znajdującej się w dokumencie, jeśli przekroczy pewną ilość stron. *to ciekawe, być może odnosi się to do np. raportów w pdfie, które mogą być opublikowane dopiero po jakimś długim czasie publicznie
  • Data przypisania dokumentowi na serwerze (time stamp associated with the document by the server hosting the document.).

Google nadaje punktacje za datę pojedynczym dokumentom w danym zbiorze wyodrębnionym ze względu na frazę. Następnie tworzy sobie z nich reprezentatywną datę dla zbioru dokumentów, a dokładniej reprezentatywną ocenę punktową daty dla danego zbioru. Następnie porównuje konkretne wyniki punktowe z wynikiem reprezentatywnym. Odchylenie od tego wyniku decyduje o poprawieniu bądź pogorszeniu pozycji dokumentu w SERPie.

Cała ta teoria jest oparta o jedno długie zdanie w patencie:

„According to another aspect, a method may include receiving a search query; performing a search based, at least in part, on the search query to identify a group of search result documents; determining a document inception date for each of the search result documents in a set of the search result documents in the group; determining a representative document inception date for the search result documents in the set of search result documents; generating a score for a search result document in the set of search result documents based, at least in part, on a difference between the document inception date associated with the search result document and the representative document inception date for the search result documents in the set of search result documents; and ranking the search result document with regard to at least one other document based, at least in part, on the score.”

Mechanizm jest wskazany jako jedna z możliwości, ale w mojej ocenie jest to najsensowniejsza z prezentowanych opcji.

Dodatkowe informacje z patentu US 20110029542 A1

Znaczenie linków

Dokument, który posiada dużo wartościowych odnośników może być wyżej pomimo starej daty  uruchomienia dokumentu.  Dla wyszukiwarki w kontekście daty liczy się przede wszystkim tempo przyrostu ilości odnośników. Dokument z wczoraj, który zyskał 10 odnośników będzie wyżej niż dokument sprzed 10 lat, który ma 100 odnośników. Z drugiej strony pada zastrzeżenie, że zbyt duże tempo przyrostu odnośników dla świeżego dokumentu jest sygnałem, świadczącym o tym, że dokument może być SPAMem i zasługuje na karę. Najlepiej wypadną dokumenty mające stały przyrost linków w czasie.

Pojawia się wzór:

H=L/log (F+2),

  • H – punktacja
  • L – ilość odnośników
  • F – czas uruchomienia dokumentu

Podkładając przykład pod ten wzór:

H = 10 Linków / (wczoraj +2) > H= 100 Linków/(10 lat+2)

~5 > ~0,027

+ 2 we wzorze ma zapewne zniwelować ogromny wynik na korzyść młodych dokumentów względem starych. Jeśli wynik jest zbyt korzystny to zapewne pada podejrzenie o SPAM i rozpoczynają się inne procedury.

Pamiętać należy, że ta punktacja nie jest zestawiana w szeregu pomiędzy stronami, ona jest porównywana do średniej w grupie dokumentów odpowiadających danemu zapytaniu. Czyli wysoki/niski wynik jest dobry w zależności od tego jak odchyla się od średniej dla innych dokumentów pasujących do zapytania.

Punkty za aktualizacje

Dokumenty, które są często aktualizowane zyskują w oczach wyszukiwarki:

U=f(UF, UA)

U = punktacja za aktualizacje

UF – jak często się zmieniał

UA – jak bardzo zmieniał się dokument

Google oceniając aktualizacje ocenia zarówno jaki procent tekstu się zmienił jak i jak często miało to miejsce. Zmiana zmianie nierówna, Google nadaję im wagi i tak np. zmiany w JS czy komentarzach będą inaczej oceniane niż zmiany w głównej treści tekstu. Podobnie jak w przypadku oceny daty dokumentów, Google odnosi się również do średniej punktów za aktualizacje w szerszej grupie dokumentów. Więc jeśli konkurencja aktualizuje a my nie, to będziemy tracić.

Związek między datą a frazą

  • CTR dokumentu może podnieść dokument z gorszą datą
  • Dla tematów „gorących” data nabiera znacząco większego znaczenia. Pada stwierdzenie, że Google wie, że temat jest gorący jeśli, w krótkim czasie przybywa na niego wyników wyszukiwania.
  • Wyszukiwarka posiada specjalny indeks Frequently Asked Questions (FAQ) gromadzący frazy wymagające najświeższych informacji, dla nich aktualna data ma większe znaczenie.

Związek między linkami a datą

  • Trend w przyroście odnośników może wpływać na pozycje
  • Zmniejszający się przyrost linków do artykułu w czasie może sygnalizować, że dokument jest stary i nieaktualizowany.
  • Wyszukiwarka bada daty odnalezionych linków względem daty uruchomienia dokumentu
  • Przyrost linków w czasie może wskazywać na SPAM lub fenomen tematyczny 😉
  • Utrata dużej ilości odnośników przez dokument może wskazywać, że jest on przestarzały

Związek między anchorami linków a datą

  • Zmiana anchorów może świadczyć o aktualizacji artykułu
  • W anchorze może znajdować się data, która będzie świadczyć o świeżości artykułu

Związek między ruchem a datą

  • Spadek ruchu na dokumencie może świadczyć o jej nieaktualności. Google wedle patentu potrafi porównywać ze sobą różne okresy czasu pod kątem ruchu na stronie.
  • Google potrafi wykrywać trendy w ruchu na stronie i stosownie do nich w pewnych miesiącach poprawiać stronie wynik, a w innych zmniejszać punktacje.

Związek między zachowaniem użytkowników a datą

Jeśli użytkownicy spędzali na stronie 30 sekund, a w innym czasie spędzają już 5 to może świadczyć o tym, że artykuł jest nieaktualny.

W patencie pada jeszcze ogromna ilość kolejnych przykładów co może sygnalizować, że dany artykuł jest przestarzały, aż po tak ciekawe pomysły jak dodawanie/usuwanie z ulubionych w przeglądarce. Na pewno z pokorą trzeba spojrzeć na założenie, że Google wie o dacie artykułu z daty, która się w nim znajduję.

Sugerowane Testy

  1. Podałem wiele możliwości zdobywania przez Google wiedzy na temat daty strony. Prostym testem dającym jakieś wyobrażenie na ten temat mogłoby być badanie jak wygląda częstotliwość wizyt robota indeksującego w zależności od zmian: w anchorze linka, w ilości linków, zmianie daty na serwerze, ilości odwiedzin itp.
  2. Warto zbadać temat aktualizacji. Czy regularne zmienianie opisów tagów i evergreenów przyniosłoby pozytywne efekty? Prowadziłem takie testy i wyszły pozytywnie. Innym wnioskiem jest, że na niektóre frazy nie warto budować evergreenów, bo Google czasem dyskwalifikuje statyczną treść.
  3. Jak będzie postrzegany artykuł bez żadnej daty? Możemy zidentyfikować łatwo temat, który wymaga aktualności np. kurs walut i puścić artykuł bez daty. Obserwując jego zachowanie możemy wybadać skąd Google przypisał do niego datę.
  4. Ciekawy byłby tez test z oszukanym artykułem zawierającym błędną datę np. datę z przyszłości lub też zupełnie nowa treść z datą sprzed 10 lat. Podobnie jak wyżej trzeba by obserwować jak taka treść będzie się zachowywać.

 

Źródła:

https://www.google.ch/patents/US20110029542

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *