Algorytm Autora – Czy reputacja piszącego ma znaczenie dla wyszukiwarki?

Patent Google

Written by:

Alogrytm autora wszystkim jest znany z czasów kiedy Google pozwoliło połączyć profilowy obrazek z Google Plus ze stopką  autora tekstu. Odpowiednie oznaczenie tego elementu pozwalało dostać w SERPie buźkę autora.

Miniaturka autora w SERPie Google

Po chwilowym szale na obrazki, które znacznie podnosiły CTR (wiem, bo sam z tym szalałem), Google uznał, że zjechały mu kliki na adwrodsie i obrazki skasował. Czy jednak sam algorytm autora przestał działać? Wszystko wskazuje na to, że nie.

Autorzy o dobrej reputacji w wynikach wyszukiwania

Showing prominent users for information retrieval requests

https://www.google.tl/patents/US9165030

Implementations of the present disclosure include actions of receiving a search query from a searching user, in response to the search query matching a trigger query, receiving a first set of authoritative users, processing the first set of authoritative users to define a second set of authoritative users, and transmitting instructions to display data associated with authoritative users of the second set of authoritative users with search results responsive to the search query.                 

Wpisanie odpowiedniego zapytania do wyszukiwarki spowoduje proces w wyniku którego w wynikach pojawią się wyniki związane z autorami, którzy posiadają autorytet.

Odpowiednie zapytanie, wskazuję, że algorytm jest używany tylko przy niektórych rodzajach zapytań, patent mówi, że są one przechowywane w specjalnej bazie danych.

Algorytm autorytetu działa niejako „obok” głównego algorytmu wyszukiwarki:

The authoritative user engine can access the trigger queries database to determine whether one or more authoritative users are to be displayed with the search results

Przy pewnych zapytaniach, URL związany z autorem wyświetli się razem z normalnym SERPem. Co do głównej zasady powinien wyświetlić się autor, o największym autorytecie ale jest on wyłaniany spośród większego zbioru, w którym wielu autorów może mieć identyczny wynik. W takiej sytuacji autor, który się wyświetli zostanie wybrany losowo.

Niestety, po przeczytaniu całego patentu nie odnalazłem w nim kluczowej informacji – na jakiej podstawie przydzielane są punkty do autorów. Zaprowadziło mnie to do kolejnego patentu.

Patent Agent Rank

http://www.google.ch/patents/US8224826

Abstrakt:

The present invention provides methods and apparatus, including computer program products, implementing techniques for searching and ranking linked information sources. The techniques include receiving multiple content items from a corpus of content items; receiving digital signatures each made by one of multiple agents, each digital signature associating one of the agents with one or more of the content items; and assigning a score to a first agent of the multiple agents, wherein the score is based upon the content items associated with the first agent by the digital signatures.

Patent opisuje jak z całej strony wyciągnąć elementy, które pozwalają zidentyfikować treść i jej autora, a następnie dać mu za jego dzieło punkty.

Pojawia się ciekawy obrazek przedstawiający podział strony na elementy:

Google rozpoznaje elementy strony

wynika z niego, że Google potrafi zidentyfikować główny tekst, komentarze, reklamy i inne części strony www. Najważniejszym elementem w kontekście opisywanego patentu, którego poszukuje robot jest sygnatura autora którą Google będzie chciał powiązać z odnalezioną treścią.

” Any suitable protocol for creating and validating digital signatures can be used, e.g., XML Digital Signatures. Additional information about XML Digital Signatures may be found in the XML-Signature Syntax and Processing Recommendation of Feb. 12, 2002, available from the World Wide Web Consortium (W3C) at http://www.w3.org/TR/xmldsig-core/ and incorporated here by reference.”

Sugerowanym sposobem wstawienia sygnatury jest XML Digital Signatures, który powinien odpowiadać Schemie. https://en.wikipedia.org/wiki/XML_Signature, ale definicja jest bardzo szeroka:

sygnatura autora

Teoretycznie wszystkie powyższe technologie powinny działać.

Na tej podstawie google potrafi określić, za który element jest odpowiedzialny autor i wystawić mu punktacje tylko za to co stworzył.

proces rozpoznawania autora przez Google

Po połączeniu treści i sygnatury  Google tworzy sobie własną bazę sygnatur, czyli autorów, którym przydziela punkty.

In another example, an agent that is responsible for an entertainment magazine could have a high reputation score for content related to celebrity news, but a low reputation score for content related to professional medical advice.”

Punkty są przydzielane w kontekście konkretnych tematyk. Autor mający autorytet w modzie może go nie mieć w medycynie.

the reputation of a particular agent is a function of the reputation of the content and agents which refer to it

W patencie jest powiedziane, że algorytm autora może działać jak PR, tyle że jego przedmiotem nie są strony, a zidentyfikowane treści danego autora. To bardzo logiczny mechanizm. Najlepszy jest ten autor do którego odwołuję się w publikacjach więcej autorów, na których powołują się inni autorzy.

Czyli ponownie mechanizm sprowadza się do odpowiedniego linkowania pomiędzy tekstami. Kolejną możliwością jest mechanizm algorytmu sędziów – dobry autor to ten, do którego linkują zweryfikowani ręcznie dobrzy autorzy. A najpewniej zastosowali mechanizm łączący oba rozwiązania, o którym pisałem w kontekście nowego sposobu działania PR.

Źródła

  • https://www.google.tl/patents/US9165030
  • https://www.w3.org/TR/xmldsig-core/
  • http://www.google.ch/patents/US8224826
  • http://www.seobythesea.com/2015/10/move-over-google-author-rank-make-way-for-google-authoritative-rank/
  • http://www.seobythesea.com/2014/09/google-decided-authoritative-query/

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *