El algoritmo de Google

Water Day 2005Pues sí, no era ningun secreto, pero como decian en una novela, el mejor sitio para ocultar algo es entre medio de otras cosas iguales o parecidas. ¿Qué mejor sitio que la BBDD de documentación universitaria para poner el algoritmo de Google?.

Vale, algunos diran que no descubro nada nuevo, que es la tesis de los creadores de Google, pero… ¿no sabias como funciona el buscador? Al menos así es como se lo explican a la Comisión Europea, para zanjar el posible caso de monopolio que se les cae encima.

El algoritmo de Google

http://infolab.stanford.edu/~backrub/google.html

The Anatomy of a Large-Scale Hypertextual Web Search Engine

Sergey Brin and Lawrence Page {sergey, page}@cs.stanford.edu Computer Science Department, Stanford University, Stanford, CA 94305

Abstract

In this paper, we present Google, a prototype of a large-scale search engine which makes heavy use of the structure present in hypertext. Google is designed to crawl and index the Web efficiently and produce much more satisfying search results than existing systems. The prototype with a full text and hyperlink database of at least 24 million pages is available at http://google.stanford.edu/
To engineer a search engine is a challenging task. Search engines index tens to hundreds of millions of web pages involving a comparable number of distinct terms. They answer tens of millions of queries every day. Despite the importance of large-scale search engines on the web, very little academic research has been done on them. Furthermore, due to rapid advance in technology and web proliferation, creating a web search engine today is very different from three years ago. This paper provides an in-depth description of our large-scale web search engine — the first such detailed public description we know of to date.

Los documentos que completan la tarta

No todo está ahí, hay que añadir otros documentos igual de importantes, o más si cabe:

MapReduce: Simplified Data Processing on Large Clusters

The Google File System

Protocol Buffers: Google’s Data Interchange Format

y la pila de papeles (imprescindible, pero te llevaría media vida leerlos)

Matt Cutts Surrounded By CuttlettsLa verdad sobre el asunto del monopolio

¿Y por qué Matt Cutts (no te pierdas su blog), el jefe de búsquedas de Google, tiene que escribir este post Google, transparency and our not-so-secret formula?

Pues porque el mercado europeo de búsquedas está dominado, para bien o para mal, por San Google Bendito. Y eso es algo que mucha gente no puede permitir/aguantar/tragar/asumir. Cuando el modelo de negocio de muchas empresas consiste en la generación de tráfico e impresiones de anuncios, cuando ese tráfico depende en un 80% de Google, ¿a quién le gusta que las visitas dependan de un sistema automático, sin garantias, ni control alguno?

A ver, el SEO en Google es una merienda de negro, nadie te puede garantizar la posición, a no ser que pagues el Enlace Patrocinado, pero eso es SEM. Y Google no tiene ningún interés en mostrar un resultado u otro, es más, le trae sin cuidado, le importa un carajo, no perdería ni un centimo de dolar intentando controlar esas posiciones manualmente (a no ser que sean claramente perjudiciales, que esto ya lo hace).

Mama, que Google no me quiere

Básicamente se puede decir que Google es el dueño del ring, donde las empresas se pelean por el posicionamiento orgánico, en el que no pagan por visitas, pero ahora quieren que Google además haga de árbitro. Ah, no. Por ahí si que no pasan. Es más, como se pongan muy idiotas, ¿sabes que podrian cancelar el uso de su servicio filtrando las IP’s? ¿acaso crees que estan obligados a ofrecer su servicio a todo el mundo?

Dos casos curiosos, para que veas a qué punto llega la tontería del personal, independientemente de su nivel técnico:

– el que dijo, cuando paso lo del Doodle Source, que (cito) ‘los resultados de Google son un derecho de todos los internautas’. Jijijiji.. me gustaría ver en qué punto de la Constitución pone eso.

– el cliente (por suerte no lo fue al final) que quería demandar a Google por el ‘lucro cesante’ al haberlo sacado de la primera página y haber perdido una cantidad considerable de visitas y dinero.

¿Dónde vamos a llegar?

None found.

2 comentarios



Los comentarios están cerrados.