Eksperiment angående duplikat innhold

bjornfix

Bjørn Are Solstad, CEO, Devenia Ltd.
semb: Vi diskuterer (jeg og du i hvertfall) det samme. Og det er nettopp dette jeg driver og tester. Slik jeg ser det er duplikatinnhold et tema med lite håndfaste fakta og mange meninger. Det er nettopp derfor jeg kjører testen på dette - for å få avklart nøyaktig hva som er hva og hva det betyr for resultatene.

Eksempelet du viser til illustrerer godt poenget her syns jeg.

Det som gjenstår er å få rede på er: nøyaktig hva er det som trigger dette filteret.
 

semb

Medlem
Det må jo være summen av en rekke ulike kriterier i forhold til hvor unik en side viser seg å være i forhold til en annen. Jeg tror det er snakk om ikke bare brødteksten, men også de omkringliggende elementene på siden, lenkemønsteret osv.

Det finnes sikkert en eller annen "threshold" der det vipper over. Siden er for lik, og vipper over i supplemental index.
 

bjornfix

Bjørn Are Solstad, CEO, Devenia Ltd.
I testen jeg kjører er jo alle sider helt prikklike. Jeg syns det er rett sted å begynne med det helt åpenbare. Når det åpenbare er etablert som et faktum kan vi se videre på hvilken vei testen må ta for å være verifiserbar.
 

semb

Medlem
Ser nå at den nye bloggen, derhardudetigjen.com, rangerer over ITbloggen for eksempelsøket mitt:
synlig på google for enhver pris - Google-søk

Men jeg ser jo også at bloggen til ITavisen er håpløst optimalisert. Den mangler til og med titler, og sånn sett er det jo logisk at derhardudetigjen utkonkurrerer den.

Samtidig er jo noen av prinsippene innen duplikat-innhold at Google gjennom lenkemønstre, alder osv klarer å identifisere hvilken tekst som er originalen (i dette tilfellet itbloggen).

Det blir spennende å se om Googlebot bare trenger noen flere indekseringsrunder før en av bloggene vinner og en evt blir filtrert bort.
 

picxx

WF 09
Utifra 'gammel lærdom' skulle vel derhardudetigjen vært 'straffet' ettersom det samme innholdet brukes, uavhengig av andre seo metoder (ellers er det jo bare å lete opp sider som mangler titler, og scrape som faen).
 

picxx

WF 09
Så cluet er å lete opp sider uten title tag, se hva de ranker på, scrape dem, og sette inn en title tag... næææhhhh... :p
 

semb

Medlem
Jeg tror vi er nødt til å vente å se, Google trenger ofte flere indekseringsrunder før de virkelige rangeringene for en side stabiliserer seg. Men det er kult å ha et så clean cut eksempel som irgens sitt, da er det lett å se hva som evt er grunnen for en straff.

Ellers har du vel ikke bevist noe ennå Kenneth? Faktum er jo at originalsiden utkonkurreres av duplikatinnholdet, som vel er stikk i strid med hva du hevdet tidligere i tråden?
 

bjornfix

Bjørn Are Solstad, CEO, Devenia Ltd.
Sånn bare for å ha sagt det: Meningen min da jeg satte opp eksperimentet på Labs var å kunne se dette uten utenforsående faktorer. www.derhardudetigjen.com har jo inngående lenker, på lik linje med IT-bloggen. For å kunne si noe sikkert angående dette trenger man å jobbe med identiske scenarioer angående alle eksterne faktorer. Eksterne faktorer for en side er jo andre sider som linker til den på sitet samt eksterne lenker fra andre sites.

Skal dere bedømme ut ifra det dere ser i forhold til disse to nettstedene må alle faktorer telles med. Siden dere ikke VET hvor mange ekterne linker som går inn til sidene er det ikke mulig å fastslå hva som egentlig bestemmer hvilken av de som straffes eller ikke basert på duplikat innhold.
 

picxx

WF 09
Om man bruker 'link:' variablen i google vil man komme opp med null treff både på derhardudenigjen.com og bloggen hos ITavisen.
derhardudenigjen har 36 sider indeksert i google mot ITbloggens 692.
derhardudenigjen har 17 linkdomains i yahoo mot ITbloggens 1945
derhardudenigjen har 0 sider indeksert i msn mot ITbloggens 2220

'synlig på google for enhver pris' har flere innlenker på derhardudenigjen enn på ITbloggen, og rangerer over ITbloggen i søkemotorer fordi man ikke blir straffet for duplikatinnhold i søkemotorer. Personlig trodde jeg orginalinnhold ble 'belønnet' bedre enn dette, men verdien av innkommende linker er tydeligvis større enn hva jeg har trodd.
 

bjornfix

Bjørn Are Solstad, CEO, Devenia Ltd.
Om man bruker 'link:' variablen i google vil man komme opp med null treff både på derhardudenigjen.com og bloggen hos ITavisen.
derhardudenigjen har 36 sider indeksert i google mot ITbloggens 692.
derhardudenigjen har 17 linkdomains i yahoo mot ITbloggens 1945
derhardudenigjen har 0 sider indeksert i msn mot ITbloggens 2220

'synlig på google for enhver pris' har flere innlenker på derhardudenigjen enn på ITbloggen, og rangerer over ITbloggen i søkemotorer fordi man ikke blir straffet for duplikatinnhold i søkemotorer. Personlig trodde jeg orginalinnhold ble 'belønnet' bedre enn dette, men verdien av innkommende linker er tydeligvis større enn hva jeg har trodd.
Om jeg skal være med på gjettingen angående disse to så gjetter jeg på at derhardudenigjen ranker over ITbloggen for øyeblikket på grunn av ferskhetsfilteret. Dette vil jo selvsagt vise seg over tid.
 

picxx

WF 09
Så i teorien vil da derhardudenigjen bli lagt i supplemental index på søkeordene 'synlig på google for enhver pris' når effekten av ferskhetsfilteret (er det noe det samme som kullfilter ;) ) er borte og google har fått summet seg til å innsett at dette er duplisert innhold fra ITbloggen.

Skal bli litt morsomt å se om det faktisk hender, noe jeg ikke tror. (Tro kan man gjøre i kirka o.s.v. jada, har hørt det før :p )
 

Kenneth Dreyer

Well-Known Member
Ellers har du vel ikke bevist noe ennå Kenneth? Faktum er jo at originalsiden utkonkurreres av duplikatinnholdet, som vel er stikk i strid med hva du hevdet tidligere i tråden?

Jeg har da ikke hevded at den ikke vil slå orginalinnholdet, jeg har bare hevded at den ikke vil bli sendt tilbake til side 60 av Google..
 

bjornfix

Bjørn Are Solstad, CEO, Devenia Ltd.
Så i teorien vil da derhardudenigjen bli lagt i supplemental index på søkeordene 'synlig på google for enhver pris' når effekten av ferskhetsfilteret (er det noe det samme som kullfilter ;) ) er borte og google har fått summet seg til å innsett at dette er duplisert innhold fra ITbloggen.

Skal bli litt morsomt å se om det faktisk hender, noe jeg ikke tror. (Tro kan man gjøre i kirka o.s.v. jada, har hørt det før :p )
For min del så tror jeg ikke vi vil kunne se noe definitivt hverken den ene eller andre veien siden alt for mange faktorer er ulike.
 

picxx

WF 09
For min del så tror jeg ikke vi vil kunne se noe definitivt hverken den ene eller andre veien siden alt for mange faktorer er ulike.

Eneste faktoren jeg egentlig synes er intressant m.t.p. bloggene til Irgens er om det faktisk skjer at en ny blogspot blogg danker ut en blogg som er hostet på et såpass etablert domene som bloggen.itavisen.no med duplikatinnhold.
Det vil jo isåfall åpne en ganske enkel vei for mange blackhat seo'ere.
 
Topp