Home
» Wiki
»
Documentație publicată accidental de Google despre cum funcționează căutarea
Documentație publicată accidental de Google despre cum funcționează căutarea
Luni, s-au scurs documente interne care descriu factorii pe care Căutarea Google ia în considerare atunci când clasifică și afișează rezultatele web.
Google dezvăluie din greșeală cum funcționează Căutarea
Aceste documente au fost făcute publice de Rand Fishkin de la SparkToro, o companie de software. Fiskin a lucrat anterior în industria de optimizare a motoarelor de căutare (SEO).
Acest „Document de conținut Google API” conține documentație internă API care explică angajaților cum funcționează diferitele componente care generează rezultatele căutării. Sunt peste 2.500 de pagini în total. Unele descriu sisteme mai vechi, dar alte documente par a fi actualizate.
Pe baza a ceea ce a fost publicat, Google pare să fi pus la dispoziție publică - poate din întâmplare - prin GitHub începând cu 27 martie. Documentele explicative au fost apoi lansate pe 7 mai. Cu toate acestea, deoarece a fost indexată de un serviciu terță parte în acea perioadă, o copie a acesteia a rămas disponibilă chiar și după ce Google a eliminat-o.
Deși aceste date arată ce factori poate lua în considerare Căutarea Google atunci când clasifică rezultatele căutării, nu dezvăluie cât de important este fiecare factor pentru clasarea finală.
Cei din comunitatea SEO care încearcă să se adapteze la schimbările în clasamentul Căutării Google și apar mai sus pe pagină pot găsi aceste date utile. După ce au examinat acest document, au descoperit că contrazice ceea ce a spus public Google despre modul în care funcționează Căutarea.
Google încă nu a comentat public despre scurgere. Compania a anunțat cea mai recentă actualizare majoră a Căutării în martie, cu scopul de a afișa conținut mai autentic și „util”. Sistemul său de clasare de bază a fost actualizat pentru a determina dacă o pagină este „creată mai degrabă pentru motoarele de căutare decât pentru oameni ” .
Cele mai mari constatări în scurgere
Un lucru este clar: algoritmul de căutare Google nu a fost scurs și experții SEO nu au dintr-o dată toate răspunsurile. Dar informațiile scurse într-un tez de mii de documente interne Google sunt încă uriașe. Este o privire fără precedent asupra funcționalității interioare de obicei atent supravegheate ale Google.
Site-urile web depind de traficul de căutare pentru a supraviețui, iar mulți vor face eforturi mari – și cheltuieli mari – pentru a-și învinge concurenții și a ajunge în topul rezultatelor. O clasare mai bună înseamnă mai mult trafic pe site, ceea ce înseamnă mai mulți bani. Drept urmare, operatorii de site-uri web monitorizează îndeaproape fiecare cuvânt pe care Google îl publică, precum și fiecare postare pe rețelele sociale, în ceea ce privește clasamentul căutărilor.
De-a lungul anilor, purtătorii de cuvânt al Google au negat în mod repetat că clicurile utilizatorilor influențează modul în care sunt clasate site-urile web – dar documentele scurse de informații au remarcat că anumite tipuri de clicuri ale utilizatorilor sunt implicate în clasamentele de căutare. Mărturia dintr-un caz antitrust al Departamentului de Justiție al SUA a dezvăluit un factor de clasare numit Navboost care folosește clicurile utilizatorilor pentru a crește conținutul în căutare.
„Pentru mine, cea mai mare concluzie este că multe dintre declarațiile publice ale Google despre ceea ce colectează și cum funcționează motorul lor de căutare sunt în contradicție cu realitatea”, a declarat Rand Fishkin, expert în industria de optimizare a motoarelor de căutare (SEO), The Verge prin e-mail .
Scurgerea a devenit virală pentru prima dată după ce experții SEO Fishkin și Mike King au publicat o parte din conținutul documentului confidențial la începutul acestei săptămâni, împreună cu analiza însoțitoare. Documentele API divulgate includ depozite pline cu informații și definiții despre datele colectate de Google, dintre care unele pot informa modul în care site-urile web sunt clasate în rezultatele căutării. Google a evitat inițial întrebările despre autenticitatea documentelor scurse înainte de a le confirma oficial miercurea trecută.
„Atenționăm să nu facem presupuneri inexacte despre Căutare bazate pe informații în afara contextului, învechite sau incomplete”, a declarat purtătorul de cuvânt al Google, Davis Thompson, pentru The Verge, într-un e-mail de miercuri. „Am împărtășit informații extinse despre modul în care funcționează Căutarea și tipurile de factori pe care sistemele noastre iau în considerare și lucrăm pentru a proteja integritatea rezultatelor noastre împotriva manipulării . ”
Nu există niciun loc în documentație care să vorbească despre cum să ponderăm diferitele atribute. De asemenea, este posibil ca unele dintre proprietățile denumite în documentație, cum ar fi un identificator pentru un „site personal mic” sau un downgrade pentru recenzii de produse, să fi fost implementate la un moment dat, dar apoi eliminate. De asemenea, este posibil să nu fi fost niciodată folosite pentru a clasifica site-urile web.
"Nu știm neapărat cum sunt utilizate [elementele], în afară de diferitele descrieri ale acestora. Deși nu este foarte bogat, este încă o mulțime de informații pentru noi", a spus King. „La ce aspecte ar trebui să ne gândim mai precis atunci când creăm un site web sau optimizăm un site?”.
Ideea că cea mai mare platformă de căutare din lume nu clasifică rezultatele căutării în funcție de modul în care utilizatorii interacționează cu conținutul pare absurdă. Dar negările repetate, răspunsurile formulate cu atenție și publicațiile din industrie le fac un subiect controversat.
Un alt punct important pe care l-au subliniat Fishkin și King se referă la modul în care Google poate folosi datele Chrome în clasamentele sale de căutare. Reprezentanții Căutării Google au spus că nu folosesc nimic din Chrome pentru clasamente, dar documentele scurse sugerează că ar putea să nu fie adevărat. De exemplu, o secțiune listează „chrome_trans_clicks” pentru a indica ce linkuri dintr-un domeniu apar sub site-ul principal în rezultatele căutării. Fishkin explică că aceasta înseamnă că Google „preia numărul de clicuri pe pagini din browserul Chrome și folosește acel număr pentru a determina cele mai populare/importante adrese URL de pe un site, care sunt apoi calculate pentru a fi incluse în funcția de sitelinkuri ” .
Există peste 14.000 de proprietăți menționate în document, iar cercetătorii ar trebui să sape săptămâni întregi pentru a găsi indicii conținute în pagini. „Twiddlers” sau ajustările de clasare sunt implementate în afara actualizărilor majore ale sistemului pentru a clasifica conținutul în sus sau în jos în funcție de anumite criterii. Elementele site-ului, cum ar fi cine este autorul, sunt acoperite, precum și măsurile de „autoritate” a site-ului. Fishkin subliniază că există multe care nu sunt reprezentate în documente, cum ar fi informații despre rezultatele căutării generate de AI.
Deci, ce înseamnă toate acestea? În primul rând, poate că oricine conduce un site web va citi despre această scurgere și va încerca să o înțeleagă. Editorii, companiile de comerț electronic și companiile vor proiecta probabil diverse experimente pentru a încerca să testeze unele dintre lucrurile sugerate în document. Când se întâmplă acest lucru, site-urile web pot începe să se simtă puțin diferite - totul în timp ce încearcă să dea sens acestui val de informații nou, dar încă ambiguu.
„Jurnaliştii şi editorii care acoperă SEO şi Căutarea Google trebuie să înceteze să mai repete declaraţiile publice ale Google şi să arunce o privire mult mai atentă şi mai contradictorie asupra retoricii gigantului căutării”, a spus Fishkin . „Publicațiile care repetă afirmațiile Google ca și cum ar fi doar fapte îl ajută pe Google să creeze o narațiune care este utilă companiei, nu utilă pentru practicieni, utilizatori sau public.”