Google und die originelle Original Erkennung

Es gibt Leute, die halten mich für ein Original. Und es gibt eine Suchmaschine, die tut das nicht. Google hat sich im Laufe der Jahre bemüht, doppelte Inhalte zu erkennen und auszufiltern. Leider funktioniert das mit dem (An)Erkennen der Urheberschaft nicht immer so wie erhofft. Oder wie muss ich das folgende videografierte Verhalten sonst verstehen? Es geht hier um keinen Einzelfall, Google bevorzugt hier eindeutig nicht das Original, sondern gewährt dem sozialmedialen Content-Mashup Virato den Vorrang.

An dieser Stelle habe ich weniger ein Problem mit dem Inhalteentlehner, der benutzt nicht einmal den RSS-Textauszug, es kommen lediglich Überschrift und Kommentarauszüge zum Einsatz. Zudem honoriert er das Ganze auch noch mit einem echten Follow-Link. Man sieht im Video auch sehr schön, dass Google meinen Artikel vor Viratos Beitrag in der Robot-Hand hatte – vor 11 Stunden versus vor 12 Stunden ist in den SERPs zu lesen. Und dennoch reicht es nicht aus den Originalartikel gegenüber dem Klon zu bevorzugen. Noch krasser, auch Autorenschaft und Google+ Seite sind nicht stark genug das zu unterbinden. Wie arm ist das denn?

Und was sagt Matt Cutts dazu? Hier ein Video zum Thema Content Original erkennen:

Matt sagt, es ist schwer und Google bemüht sich. Danke. So sehe ich das auch.

9 Gedanken zu “Google und die originelle Original Erkennung”

  1. Krass! Vor allem, dass du wirklich erst noch -virato eingeben musst. Da muss doch irgendwas dahinterstecken. Wobei du ja sagst, dass es ausdrücklich kein Einzelfall ist. Logisch erscheint mir das nicht.

  2. OT: Google erkennt nicht mal, dass ich selbst es bin, wenn ich eine Suchanfrage mache. In letzter Zeit werde ich immer öfter um das Ausfüllen eines Captchas gebeten, weil angeblich zu viele Suchanfragen von meiner IP kommen und Google das für automatisierte abfragen oder Schadsoftware hält. Ich habe einen Mac, Virensoftware und eine extra Firewall (so viel dazu). Fazit: das Gegenteil von Googles Werbesprüchen stimmt: sie erkennen weder Original Content, noch echte Menschen. Und die Suchergebnissen sind weiterhin mies (statt guter Seiten mit nützlichem Inhalt oftmals nur Aggregatoren- oder Verzeichnisseiten).

  3. Mir kommt das sehr komisch vor! Kann es sein, das dein Text noch nicht richtig von google indexiert ist? Eine Info welche Crawler seit Veröffentlichung die Seite besucht haben wäre da hilfreich! Ich denke in ein paar Tagen hat sich das geändert! Wenn nicht, bedarf es auf jeden Fall einer genaueren Analyse :-)

  4. Evtl. solltest Du mal mit Firebug oder so prüfen, was die Webseiten auf denen Du Dich so rumtreibst im Hintergrund so für AJAX Requests machen. Denn der Captcha Code kommt nur, wenn wirklich zu viele Anfragen von Deiner IP an Google gesendet werden und ich kenne einige SEO Webseiten, die den Browser des Nutzers dazu missbrauchen, um ihre eigenen Datenbanken mit Google Daten zu füttern.

    PS: Habe das auch mal probiert und es hat wunderbar funktioniert. Ist aber nicht fair und führt zu dem oben beschrieben Captcha (wenn man es ungeschickt macht).

    • Hi Michael,
      danke für den Tipp. Die Captcha-Anfrage erscheint auch, wenn ich vorher nicht auf Webseiten war, sondern sofort nach Starten des Browsers (Safari oder Firefox) im browsereigenen Suchfeld eine Google-Suche starte. SEO-Tools und Black Hat-Techniken nutze ich nicht. Möglicherweise ist die IP-Adresse, die mir ja dynamisch vom Provider (Telekom) immer mal wieder neu zugewiesen wird, von vorherigen Usern missbraucht worden? Aber so häufige Zufälle gibt es eigentlich nicht. Oder ich bin einfach ein totaler Search-Poweruser, der Google überfordert (*grins*). Auf jeden Fall ist das sehr ärgerlich und triebt mich bei Suchanfragen bald zu Bing …
      LG (und Sorry für das Off Topic)

  5. Also entgegen den Serps von Jonas muss ich dir leider mitteilen das du mit dem “Vernetzungswahn”-Artikel erst auf Seite 2 (Platz 13) auftauchst. Und das auch nur mit dem “Guten Rutsch ins neue Jahr”-Artikel. Virato ist weiterhin auf Platz 1.

    Mit deinem aktuellen Artikel verhält es sich ähnlich, Virato auf Platz 1 und du mit dem “Google Blog Suche”-Artikel auf Platz 4 …

    Gesucht wurde ohne G-Acc in einem frischen Browser – Jedenfalls so frisch, wie der FF es mir erlaubt…

    Einen schönen Start in die Woche : )

    • Interessant, hatte mit einem bereinigten Chrome und ohne Login gesucht und eben auch nochmal mit dem IE (den ich sonst wirklich NIEMALS NIE verwende) …gleiches Ergebnis: Platz 1 inkl. Autoren-Pic

  6. Ich bin es nochmal,

    jetzt mal abgesehen davon, dass /blog/ und die Startseite den gleichen Inhalt haben und noch einige Links zur alten .info-Domain gehen (Im Impressum geht übrigens ein Link zur /index.html und der Parking-Instanz von 1&1), hilft es vielleicht, wenn du meta name robots wieder aktivierst? Jedenfalls sind deine drei letzten Artikel allesamt nicht im Index …

Schreibe einen Kommentar