Eksperiment angående duplikat innhold

bjornfix · 19 Mai 2008

semb: Vi diskuterer (jeg og du i hvertfall) det samme. Og det er nettopp dette jeg driver og tester. Slik jeg ser det er duplikatinnhold et tema med lite håndfaste fakta og mange meninger. Det er nettopp derfor jeg kjører testen på dette - for å få avklart nøyaktig hva som er hva og hva det betyr for resultatene.

Eksempelet du viser til illustrerer godt poenget her syns jeg.

Det som gjenstår er å få rede på er: nøyaktig hva er det som trigger dette filteret.

semb · 19 Mai 2008

Det må jo være summen av en rekke ulike kriterier i forhold til hvor unik en side viser seg å være i forhold til en annen. Jeg tror det er snakk om ikke bare brødteksten, men også de omkringliggende elementene på siden, lenkemønsteret osv.

Det finnes sikkert en eller annen "threshold" der det vipper over. Siden er for lik, og vipper over i supplemental index.

bjornfix · 19 Mai 2008

I testen jeg kjører er jo alle sider helt prikklike. Jeg syns det er rett sted å begynne med det helt åpenbare. Når det åpenbare er etablert som et faktum kan vi se videre på hvilken vei testen må ta for å være verifiserbar.

semb · 20 Mai 2008

Ser nå at den nye bloggen, derhardudetigjen.com, rangerer over ITbloggen for eksempelsøket mitt:
synlig på google for enhver pris - Google-søk

Men jeg ser jo også at bloggen til ITavisen er håpløst optimalisert. Den mangler til og med titler, og sånn sett er det jo logisk at derhardudetigjen utkonkurrerer den.

Samtidig er jo noen av prinsippene innen duplikat-innhold at Google gjennom lenkemønstre, alder osv klarer å identifisere hvilken tekst som er originalen (i dette tilfellet itbloggen).

Det blir spennende å se om Googlebot bare trenger noen flere indekseringsrunder før en av bloggene vinner og en evt blir filtrert bort.

picxx · 20 Mai 2008

Utifra 'gammel lærdom' skulle vel derhardudetigjen vært 'straffet' ettersom det samme innholdet brukes, uavhengig av andre seo metoder (ellers er det jo bare å lete opp sider som mangler titler, og scrape som faen).

Kenneth Dreyer · 20 Mai 2008

Har vi nå lært at vi ikke skal tvile på min visdom?

picxx · 20 Mai 2008

Så cluet er å lete opp sider uten title tag, se hva de ranker på, scrape dem, og sette inn en title tag... næææhhhh...

semb · 20 Mai 2008

Jeg tror vi er nødt til å vente å se, Google trenger ofte flere indekseringsrunder før de virkelige rangeringene for en side stabiliserer seg. Men det er kult å ha et så clean cut eksempel som irgens sitt, da er det lett å se hva som evt er grunnen for en straff.

Ellers har du vel ikke bevist noe ennå Kenneth? Faktum er jo at originalsiden utkonkurreres av duplikatinnholdet, som vel er stikk i strid med hva du hevdet tidligere i tråden?

bjornfix · 20 Mai 2008

Sånn bare for å ha sagt det: Meningen min da jeg satte opp eksperimentet på Labs var å kunne se dette uten utenforsående faktorer. www.derhardudetigjen.com har jo inngående lenker, på lik linje med IT-bloggen. For å kunne si noe sikkert angående dette trenger man å jobbe med identiske scenarioer angående alle eksterne faktorer. Eksterne faktorer for en side er jo andre sider som linker til den på sitet samt eksterne lenker fra andre sites.

Skal dere bedømme ut ifra det dere ser i forhold til disse to nettstedene må alle faktorer telles med. Siden dere ikke VET hvor mange ekterne linker som går inn til sidene er det ikke mulig å fastslå hva som egentlig bestemmer hvilken av de som straffes eller ikke basert på duplikat innhold.

picxx · 21 Mai 2008

Om man bruker 'link:' variablen i google vil man komme opp med null treff både på derhardudenigjen.com og bloggen hos ITavisen.
derhardudenigjen har 36 sider indeksert i google mot ITbloggens 692.
derhardudenigjen har 17 linkdomains i yahoo mot ITbloggens 1945
derhardudenigjen har 0 sider indeksert i msn mot ITbloggens 2220

'synlig på google for enhver pris' har flere innlenker på derhardudenigjen enn på ITbloggen, og rangerer over ITbloggen i søkemotorer fordi man ikke blir straffet for duplikatinnhold i søkemotorer. Personlig trodde jeg orginalinnhold ble 'belønnet' bedre enn dette, men verdien av innkommende linker er tydeligvis større enn hva jeg har trodd.

bjornfix · 21 Mai 2008

picxx skrev:
Om man bruker 'link:' variablen i google vil man komme opp med null treff både på derhardudenigjen.com og bloggen hos ITavisen.
derhardudenigjen har 36 sider indeksert i google mot ITbloggens 692.
derhardudenigjen har 17 linkdomains i yahoo mot ITbloggens 1945
derhardudenigjen har 0 sider indeksert i msn mot ITbloggens 2220

'synlig på google for enhver pris' har flere innlenker på derhardudenigjen enn på ITbloggen, og rangerer over ITbloggen i søkemotorer fordi man ikke blir straffet for duplikatinnhold i søkemotorer. Personlig trodde jeg orginalinnhold ble 'belønnet' bedre enn dette, men verdien av innkommende linker er tydeligvis større enn hva jeg har trodd.

Om jeg skal være med på gjettingen angående disse to så gjetter jeg på at derhardudenigjen ranker over ITbloggen for øyeblikket på grunn av ferskhetsfilteret. Dette vil jo selvsagt vise seg over tid.

picxx · 21 Mai 2008

Så i teorien vil da derhardudenigjen bli lagt i supplemental index på søkeordene 'synlig på google for enhver pris' når effekten av ferskhetsfilteret (er det noe det samme som kullfilter

) er borte og google har fått summet seg til å innsett at dette er duplisert innhold fra ITbloggen.

Skal bli litt morsomt å se om det faktisk hender, noe jeg ikke tror. (Tro kan man gjøre i kirka o.s.v. jada, har hørt det før

)

Kenneth Dreyer · 21 Mai 2008

semb skrev:
Ellers har du vel ikke bevist noe ennå Kenneth? Faktum er jo at originalsiden utkonkurreres av duplikatinnholdet, som vel er stikk i strid med hva du hevdet tidligere i tråden?

Jeg har da ikke hevded at den ikke vil slå orginalinnholdet, jeg har bare hevded at den ikke vil bli sendt tilbake til side 60 av Google..

bjornfix · 21 Mai 2008

picxx skrev:
Så i teorien vil da derhardudenigjen bli lagt i supplemental index på søkeordene 'synlig på google for enhver pris' når effekten av ferskhetsfilteret (er det noe det samme som kullfilter ) er borte og google har fått summet seg til å innsett at dette er duplisert innhold fra ITbloggen.

Skal bli litt morsomt å se om det faktisk hender, noe jeg ikke tror. (Tro kan man gjøre i kirka o.s.v. jada, har hørt det før )

For min del så tror jeg ikke vi vil kunne se noe definitivt hverken den ene eller andre veien siden alt for mange faktorer er ulike.

picxx · 21 Mai 2008

basicus skrev:
For min del så tror jeg ikke vi vil kunne se noe definitivt hverken den ene eller andre veien siden alt for mange faktorer er ulike.

Eneste faktoren jeg egentlig synes er intressant m.t.p. bloggene til Irgens er om det faktisk skjer at en ny blogspot blogg danker ut en blogg som er hostet på et såpass etablert domene som bloggen.itavisen.no med duplikatinnhold.
Det vil jo isåfall åpne en ganske enkel vei for mange blackhat seo'ere.

Eksperiment angående duplikat innhold

bjornfix

Bjørn Are Solstad, CEO, Devenia Ltd.

semb

Medlem

bjornfix

Bjørn Are Solstad, CEO, Devenia Ltd.

semb

Medlem

picxx

WF 09

Kenneth Dreyer

Well-Known Member

picxx

WF 09

semb

Medlem

bjornfix

Bjørn Are Solstad, CEO, Devenia Ltd.

picxx

WF 09

bjornfix

Bjørn Are Solstad, CEO, Devenia Ltd.

picxx

WF 09

Kenneth Dreyer

Well-Known Member

bjornfix

Bjørn Are Solstad, CEO, Devenia Ltd.

picxx

WF 09