Dec 4 2008

Ο αλγόριθμος του Google Blog Search θα βελτιωθεί περισσότερο προσεχώς

Πριν από αρκετούς μήνες είχαν αντικαταστήσει στην πλατφόρμα του WordPress τον τρόπο με τον οποίο λάμβαναν τα trackbacks και αντί για το Technorati άρχισαν να χρησιμοποιούν το Google Blog Search. Αυτό είχε ως αποτέλεσμα να χάνουμε αρκετά από τα trackbacks αλλά το συνηθίσαμε με τον καιρό.

Πριν λίγες ημέρες όμως άρχισε να δημιουργείται ένας πανικός. Οι σύνδεσμοι που βλέπαμε καμία σχέση δεν είχαν με αυτό που έπρεπε. Ήταν απλώς τα incoming links και κάπου εκεί άρχισε να χάνει η μάνα το παιδί και το παιδί τη μάνα μέχρι που σταματήσαμε να τα ελέγχουμε γιατί κάθε φορά που κάποιος που μας είχε στο blogroll του έκανε μια άσχετη προς εμάς δημοσίευση λαμβάναμε το σύνδεσμο στη λίστα.

Το ίδιο συνέβαινε και στο ίδιο Google Blog Search. Προσπαθούσες να κάνεις μια αναζήτηση και σου έβγαζε άσχετα αποτελέσματα. Φυσικά αυτό άρχισε να ενοχλεί αρκετό κόσμο οπότε δημιουργήθηκε ένα σχετικό σούσουρο στη μπλογκόσφαιρα.

O Jeremy Hylton από την ομάδα του Google BlogSearch εξήγησε τελικά τι ακριβώς έχει γίνει. Μέχρι ενός σημείου έκαναν index τα feed μας. Αυτό όμως δημιουργούσε ένα μικρό πρόβλημα στα blogs που πρόσφεραν partial feed (δηλαδή κομμένο feed) μια και το Google BlogSearch δε μπορούσε να δει ολόκληρο το κείμενο. Έτσι αποφάσισαν να αρχίσουν να κάνουν index τις κανονικές σελίδες μας.

Αυτό φυσικά είχε ως αποτέλεσμα να μην περιλαμβάνονται μόνο οι δημοσιεύσεις μας αλλά και ότι άλλο είχαμε τοποθετήσει στo header, sto footer και φυσικά στη sidebar των blogs μας. Και όπως πολύ καλά γνωρίζετε στις sidebar μας γίνεται συνήθως πανικός από links.

Φυσικά το γνωρίζουν στην ομάδα του Google Blog Search και όπως λένε προσπαθούν να βελτιώσουν τον αλγόριθμο τους ώστε να περιλαμβάνονται μόνο οι δημοσιεύσεις μας αν και δεν είναι σίγουροι πως θα καταφέρουν να διορθώσουν το πρόβλημα ως το τέλος του έτους.

photo by

Leave a Comment