Ocena dokumentu po przez datę jego uruchomienia
Document scoring based on document inception date
Patent opisuje w jaki sposób Google rozpoznaje datę utworzenia dokumentu oraz w jaki sposób wykorzystuje ją w rankingu. Intencją Google jest by dostarczać użytkownikom najbardziej relewantne treści. Rozwiązanie zapisane w patencie ma zapewnić, że „nieświeże treści” nie zepsują rankingu.
Patent zaznacza, że czas utworzenia dokumentu wcześniejszy, bądź późniejszy względem innych jest wykorzystywany do nadania mu punktacji. W pewnych okolicznościach starsza data da więcej punktów, w innych młodszy dokument otrzyma więcej punktów. Data może zarówno pogarszać jak i poprawiać pozycje.
Proces oceniana daty w rankingu Google
Data uruchomienia dokumentu (Document Inception Date) – Google przypisuje datę do konkretnego dokumentu. Możliwe metody pomiaru tej daty:
- pierwsza indeksacja dokumentu,
- data pierwszego odkrycia linku prowadzącego do dokumentu,
- data rejestracji domeny na której jest dokument,
- data pojawienia się pierwszego odwołania do dokumentu w grupie innych dokumentów np. newsów na stronie,
- wykorzystanie daty znajdującej się w dokumencie, jeśli przekroczy pewną ilość stron. *to ciekawe, być może odnosi się to do np. raportów w pdfie, które mogą być opublikowane dopiero po jakimś długim czasie publicznie
- Data przypisania dokumentowi na serwerze (time stamp associated with the document by the server hosting the document.).
Google nadaje punktacje za datę pojedynczym dokumentom w danym zbiorze wyodrębnionym ze względu na frazę. Następnie tworzy sobie z nich reprezentatywną datę dla zbioru dokumentów, a dokładniej reprezentatywną ocenę punktową daty dla danego zbioru. Następnie porównuje konkretne wyniki punktowe z wynikiem reprezentatywnym. Odchylenie od tego wyniku decyduje o poprawieniu bądź pogorszeniu pozycji dokumentu w SERPie.
Cała ta teoria jest oparta o jedno długie zdanie w patencie:
„According to another aspect, a method may include receiving a search query; performing a search based, at least in part, on the search query to identify a group of search result documents; determining a document inception date for each of the search result documents in a set of the search result documents in the group; determining a representative document inception date for the search result documents in the set of search result documents; generating a score for a search result document in the set of search result documents based, at least in part, on a difference between the document inception date associated with the search result document and the representative document inception date for the search result documents in the set of search result documents; and ranking the search result document with regard to at least one other document based, at least in part, on the score.”
Mechanizm jest wskazany jako jedna z możliwości, ale w mojej ocenie jest to najsensowniejsza z prezentowanych opcji.
Dodatkowe informacje z patentu US 20110029542 A1
Znaczenie linków
Dokument, który posiada dużo wartościowych odnośników może być wyżej pomimo starej daty uruchomienia dokumentu. Dla wyszukiwarki w kontekście daty liczy się przede wszystkim tempo przyrostu ilości odnośników. Dokument z wczoraj, który zyskał 10 odnośników będzie wyżej niż dokument sprzed 10 lat, który ma 100 odnośników. Z drugiej strony pada zastrzeżenie, że zbyt duże tempo przyrostu odnośników dla świeżego dokumentu jest sygnałem, świadczącym o tym, że dokument może być SPAMem i zasługuje na karę. Najlepiej wypadną dokumenty mające stały przyrost linków w czasie.
Pojawia się wzór:
H=L/log (F+2),
- H – punktacja
- L – ilość odnośników
- F – czas uruchomienia dokumentu
Podkładając przykład pod ten wzór:
H = 10 Linków / (wczoraj +2) > H= 100 Linków/(10 lat+2)
~5 > ~0,027
+ 2 we wzorze ma zapewne zniwelować ogromny wynik na korzyść młodych dokumentów względem starych. Jeśli wynik jest zbyt korzystny to zapewne pada podejrzenie o SPAM i rozpoczynają się inne procedury.
Pamiętać należy, że ta punktacja nie jest zestawiana w szeregu pomiędzy stronami, ona jest porównywana do średniej w grupie dokumentów odpowiadających danemu zapytaniu. Czyli wysoki/niski wynik jest dobry w zależności od tego jak odchyla się od średniej dla innych dokumentów pasujących do zapytania.
Punkty za aktualizacje
Dokumenty, które są często aktualizowane zyskują w oczach wyszukiwarki:
U=f(UF, UA)
U = punktacja za aktualizacje
UF – jak często się zmieniał
UA – jak bardzo zmieniał się dokument
Google oceniając aktualizacje ocenia zarówno jaki procent tekstu się zmienił jak i jak często miało to miejsce. Zmiana zmianie nierówna, Google nadaję im wagi i tak np. zmiany w JS czy komentarzach będą inaczej oceniane niż zmiany w głównej treści tekstu. Podobnie jak w przypadku oceny daty dokumentów, Google odnosi się również do średniej punktów za aktualizacje w szerszej grupie dokumentów. Więc jeśli konkurencja aktualizuje a my nie, to będziemy tracić.
Związek między datą a frazą
- CTR dokumentu może podnieść dokument z gorszą datą
- Dla tematów „gorących” data nabiera znacząco większego znaczenia. Pada stwierdzenie, że Google wie, że temat jest gorący jeśli, w krótkim czasie przybywa na niego wyników wyszukiwania.
- Wyszukiwarka posiada specjalny indeks Frequently Asked Questions (FAQ) gromadzący frazy wymagające najświeższych informacji, dla nich aktualna data ma większe znaczenie.
Związek między linkami a datą
- Trend w przyroście odnośników może wpływać na pozycje
- Zmniejszający się przyrost linków do artykułu w czasie może sygnalizować, że dokument jest stary i nieaktualizowany.
- Wyszukiwarka bada daty odnalezionych linków względem daty uruchomienia dokumentu
- Przyrost linków w czasie może wskazywać na SPAM lub fenomen tematyczny 😉
- Utrata dużej ilości odnośników przez dokument może wskazywać, że jest on przestarzały
Związek między anchorami linków a datą
- Zmiana anchorów może świadczyć o aktualizacji artykułu
- W anchorze może znajdować się data, która będzie świadczyć o świeżości artykułu
Związek między ruchem a datą
- Spadek ruchu na dokumencie może świadczyć o jej nieaktualności. Google wedle patentu potrafi porównywać ze sobą różne okresy czasu pod kątem ruchu na stronie.
- Google potrafi wykrywać trendy w ruchu na stronie i stosownie do nich w pewnych miesiącach poprawiać stronie wynik, a w innych zmniejszać punktacje.
Związek między zachowaniem użytkowników a datą
Jeśli użytkownicy spędzali na stronie 30 sekund, a w innym czasie spędzają już 5 to może świadczyć o tym, że artykuł jest nieaktualny.
…
W patencie pada jeszcze ogromna ilość kolejnych przykładów co może sygnalizować, że dany artykuł jest przestarzały, aż po tak ciekawe pomysły jak dodawanie/usuwanie z ulubionych w przeglądarce. Na pewno z pokorą trzeba spojrzeć na założenie, że Google wie o dacie artykułu z daty, która się w nim znajduję.
Sugerowane Testy
- Podałem wiele możliwości zdobywania przez Google wiedzy na temat daty strony. Prostym testem dającym jakieś wyobrażenie na ten temat mogłoby być badanie jak wygląda częstotliwość wizyt robota indeksującego w zależności od zmian: w anchorze linka, w ilości linków, zmianie daty na serwerze, ilości odwiedzin itp.
- Warto zbadać temat aktualizacji. Czy regularne zmienianie opisów tagów i evergreenów przyniosłoby pozytywne efekty? Prowadziłem takie testy i wyszły pozytywnie. Innym wnioskiem jest, że na niektóre frazy nie warto budować evergreenów, bo Google czasem dyskwalifikuje statyczną treść.
- Jak będzie postrzegany artykuł bez żadnej daty? Możemy zidentyfikować łatwo temat, który wymaga aktualności np. kurs walut i puścić artykuł bez daty. Obserwując jego zachowanie możemy wybadać skąd Google przypisał do niego datę.
- Ciekawy byłby tez test z oszukanym artykułem zawierającym błędną datę np. datę z przyszłości lub też zupełnie nowa treść z datą sprzed 10 lat. Podobnie jak wyżej trzeba by obserwować jak taka treść będzie się zachowywać.
Źródła: