Algorytm Panda działa inaczej niż myślisz

Patent Google

Written by:

Algorytm Panda stworzył Navneet Panda, roboczo nazywano go algorytmem Pandy w zespole Google, stąd też jego nazwa. Algorytm zapewne chroni więcej patentów niż ten jeden, który opisuje w dzisiejszym wpisie. Możliwe również, że algorytm opisany tutaj nie jest wcale opisem Pandy odpowiedzialnej za zawirowania w SEPRie oraz że nie jest w użyciu. Google nie precyzuje takich rzeczy. Niewątpliwie jednak opublikował ten dokument w urzędzie patentowym, a jeden z jego autorów ma na nazwisko „Panda”.

W abstrakcie patentu wskazane zostały następujące metody wpływania na ranking:

  • Określenia odpowiedniej liczby niezależnych linków przychodzących dla określonych zasobów

(Determining, for each of a plurality of groups of resources, a respective count of independent incoming links to resources in the group;)

  • Określenia odpowiedniej liczby zapytań dla określonych zasobów

(Determining, for each of the plurality of groups of resources, a respective count of reference queries)

  • Określenie modyfikatora dla zasobów opartego na relacji pomiędzy ilością odnośników a ilością zapytań

(Determining, for each of the plurality of groups of resources, a respective group-specific modification factor, wherein the group-specific modification factor for each group is based on the count of independent links and the count of reference queries for the group;)

  • Dopasowanie odpowiedniego wskaźnika do odpowiedniej grupy zapytań i wprowadzenie tego mechanizmu do rankingu.

 (Associating, with each of the plurality of groups of resources, the respective group-specific modification factor for the group, wherein the respective group-specific modification for the group modifies initial scores generated for resources in the group in response to received search queries.)

(Połączenie z każdą z grup określonych zasobów odpowiedniego modyfikatora grupy, gdzie dany modyfikator zmienia początkowe wyniki generowane dla zasobów w odpowiedzi na otrzymane zapytania.)

Jak działa Panda?

Patent wskazuję, że Panda tworzy ranking w oparciu o dwa elementy. O to jakie linki prowadzą do danej strony, oraz o to jakich zapytań wyszukiwarka oczekuje wobec tej strony. Relację pomiędzy ilością linków a oczekiwaną ilością odpowiednich zapytań tworzy wskaźnik. (The Modification Factor is IL/RQ – The number of Independent Links divided by the number of Searches.

W Patencie pojawia się kilka ciekawych informacji ważnych dla zrozumienia jego mechanizmu:

Link niezależny

Definicja „linka niezależnego„. Jest to link, który:

  • nie należy do tej samej jednostki co treść,
  • nie ma tego samego hosta,
  • nie został stworzony przez ten sam podmiot,
  • nie jest z tej samej treści,
  • nie jest z treści, która ma identyczne obrazki,
  • nie jest z treści identycznie sformatowanej,
  • nie jest z treści o tym samym CSSie.

Ma to służyć wyodrębnieniu innego indeksu linków niż np. PR. Linków zupełnie niepowiązanych z danym podmiotem które do niego kierują.

Link napisany

Pojawia się również pojęcie Implied links – linki, które są „napisane”, nie są aktywnym hipertekstem. Może to być np.:

  • nazwa firmy,
  • adres www strony,
  • nazwa produktu.

Algorytm ma zliczać linki pod tą postacią. Tutaj poszerzany jest powyżej wspomniany indeks linków „niezależnych” o same wzmianki tekstowe na związane z brandem.

Link nawigacyjny

Pojawia się również mowa o zapytaniach „nawigacyjnych”. Są to zapytania na podstawie których ktoś może dotrzeć bezpośrednio do danego zasobu i to jest jego intencją.

„In addition or in the alternative, a query can be categorized as referring to a particular resource when the query has been determined to be a navigational query to the particular resource. From the user point of view, a navigational query is a query that is submitted in order to get to a single, particular web site or web page of a particular entity. The system can determine whether a query is navigational to a resource by accessing data that identifies queries that are classified as navigational to each of a number of resources.”

Proces Pandy

Wgłębiając się w sam patent i komentarze na jego temat udało mi się stworzyć następujący opis działania algorytmu:

Algorytym najpierw poszukuje linków „niezależnych”, nie  powiązanych z linkowaną stroną. Następnie stara się określić jakiej liczbie potencjalnych zapytań odpowiada dana strona. Powstaje stosunek liczby potencjalnie pasujących zapytań do liczby niezależnych linków, który przyjmuje wartości poniżej 1 lub powyżej 1. Ten wynik jest przemnażany przez % w jakim frazy dzięki którym strona jest wyszukiwana stanowią frazy „nawigacyjne”. To znaczy im więcej fraz stanowią frazy związane z brandem, nazwą produktu, stroną www, tym większy jest mnożnik. Przemnożenie rankingu przez ten mnożnik sprawia, że jedne strony spadają, drugie rosną w rankingu.

Zatem algorytm PANDY to premia za posiadanie brandu, nie ma elementu kary.

Wydaje się to nieźle pasować do objawów Pandy i tego jak przemieliła wyniki wyszukiwania:

https://sprawnymarketing.pl/pierwsze-efekty-wdrozenia-pandy-kto-zyskal-kto-stracil/

http://mojafirma.infor.pl/raport-dnia/213954,Czy-firmy-powinny-uwazac-na-Pande.html

„Wyniki badań firmy SearchMetrics.com potwierdzają badania niemieckich ekspertów. Wiele witryn i firm straciło pozycje, wiele zyskało. Wśród firm, które najwięcej zyskały to głównie uznane marki jak ebay.co.uk, national-lottery.co.uk, itv.com, mozilla.org, youtube.com.”

Najlepszy komentarz do tematu jaki znalazłem:

„Which makes sense in the content of sites that were targeting “highly commercial queries and multiple variations of those queries.” What one would typically find on content farms were what might be described as “target query page clusters” which, ironically, exposed themselves for classification as low quality by virtue of the nature of their targeting. Pretty clever of Google to leverage this particular signal.”

Czyli Google znalazł sposób aby dowalić serwisom, które miały ogromną ilość stron docelowych na dane hasła a znikomą ilość zapytań związanych z brandem. W ten sposób dopadł farmy treści i jednocześnie podpromował mniejsze serwisy, które miały wartościową treść. Najbardziej zyskały duże serwisy ze znanym brandem

Algortym Pandy w skrócie:

  • Ogromna ilość zapytań bez odnośników – spadek
  • Ogromna ilość zapytań i ogromna ilość odnośników – brak reakcji
  • Ogromna ilość zapytań i ogromna ilość odnośników i brak zapytań brandowych – brak reakcji
  • Niewielka ilość zapytań a dużo linków – wzrost
  • Niewielka ilość zapytań, dużo odnośników i duża ilość zapytań o brand – duży wzrost
  • Ogromna ilość zapytań, Ogromna ilość odnośników i duża ilość zapytań brandowych – wielki wzorst

Źródła:

 

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *