Wrong email or password! Try one more time.

Forgot password?

Username should only contain alpha-numeric characters.

An account with this email already exists.

Password should contain at least 6 characters.

An email with a confirmation link has been sent to you.

Did you forget your password? Don't panic. Enter your email address,
and we will email you a link where you may create a new password.

If this address exists, we will send you an email with further instructions.

Back to authentication

Cum ştie Google cine e autorul conţinutului?

Cum ştie Google cine e autorul conţinutului? - răspuns de Matt Cutts

Rezumat:

Ar fi câteva lucruri de făcut pentru a trata această situaţie. Aţi putea folosi reţelele de socializare cu gândul că oamenii vor aprecia, distribui sau plasa legături către pagina web, iar Google ar prelua-o mai întâi pe ea. De asemenea aţi putea implementa protocoale precum PubSubHubbub, care ar trimite notificări către diverse locaţii. Trimiterea unei cereri DMCA sau a unui raport de spam ar putea prinde bine. În mod sigur Google încearcă să afle cine este autorul original, însă ideea de a scana tot Internetul pentru a avea mereu o copie fidelă a fiecărui moment este puţin depăşită, pentru că Google poate vizita doar un număr finit de pagini web...

 

Răspunsul lui Matt:

Să zicem că Google scanează site-ul A o dată pe oră şi site-ul B o dată pe zi. Site-ul B scrie un articol, site-ul A îl copiază, modificând marcajul temporar. Googlebot vizitează mai întâi site-ul A. Conţinutul cărui site este original pentru Google şi cine va avea un poziţionare mai bună? Dacă A – nu este aceasta nedrept faţă de B?   Pot să încep să vă spun tot felul de lucruri interesante despre scanarea paginilor web. Dacă vrei să analizezi un semnal, rata Nyquist spune că trebuie să-l eşantionezi la o frecvenţă de două ori mai mare. Dar adevărul este că poţi oricând schimba o pagină web. Deci ideea de a putea scana tot Internetul pentru a obţine o copie perfectă în orice moment este puţin eronată, pentru că, în orice moment, poţi prelua numai un număr finit de pagini. Dacă am încerca să le preluăm pe toate, şi arhitectura noastră aproape că ar suporta asta, Internetul ar putea cădea de la toate aceste solicitări. Iar noi încercăm să scanăm într-un mod relativ politicos.  

Prioritizăm după PageRank-ul unei pagini sau al unui site web

Întrebarea esenţială este: dacă A este scanată mai des, dar articolul original porneşte de la B, A fură de la B?   Ei bine, există metode de a preveni acest lucru. De exemplu, dacă postezi pe Twitter, oamenii văd, ar putea chiar să plaseze legături către articol, iar noi am putea urmări acele link-uri mai repede decât am descoperi articolul pe celălalt site.   Un alt lucru pe care îl poţi face este să publici prin PubSubHubbub, notificând prin aceasta diverse locaţii. Nu folosim încă foarte intens PubSubHubbub pentru a ne îmbunătăţi scanarea, dar asta s-ar putea schimba cu timpul. E un mod excelent de a spune asincron: „hei, s-a publicat un nou articol sau o nouă postare pe blog”.   Să mergem mai departe şi să ne jucăm cu acest scenariu ipotetic. Dacă A copiază articolul tău şi schimbă ora publicării, asta seamănă cu o înşelătorie: e ca şi cum ar susţine că ei l-au scris. Poţi recurge la câteva măsuri. În primul rând, dacă eşti autorul articolului respectiv, poţi recurge la notificarea Digital Millennium Copyright Act, trimiţându-le o cerere; mai multe informaţii găsiţi pe google.com/DMCA.html. Practic, tu spui că „acest site m-a copiat, dar eu sunt autorul original”. Site-ul respectiv fie trimite o contra-notificare, adică o contestaţie, spunând „de fapt noi am scris pagina asta” şi riscă penalizări dacă nu este adevărat, sau nu o pot contesta şi postarea dispare de pe celălalt site. Deci dacă cineva te fură, poţi oricând trimite o notificare DMCA.   Dacă este vorba un site generat automat, care fură şi copiază de la mulţi oameni – poţi trimite un raport de spam, pentru că nu e un site de calitate; nu e genul de site pe care l-am dori în indexul nostru.   Dar să mergem cu ipoteza până la capăt. În teorie, este posibil să găsim un articol pe un site înainte de a-l găsi pe alt site. Dar ne străduim din răsputeri să aflăm cine e autorul original al unui anumit conţinut, deşi nu susţin că am fi perfecţi. Facem tot posibilul să aflăm în ce mod ne pot oamenii indica faptul că ei sunt autorii conţinutul respectiv. De fapt, în Google News, tocmai am introdus nişte etichete noi – un fel de experiment pentru a vedea cum funcţionează – ca să puteţi spune „iată, acesta e autorul original al acestui conţinut”. Aşadar explorăm diverse abordări pentru a afla dacă există şi alte modalităţi la care să apelăm.

de Matt Cutts - Directorul Departamentului de Calitate a Căutării, Google

 

Videoclipul original: