Sistemas operativos modernos

Esta situación puede mejorarse observando que algunas películas son más populares que otras, y tomando en cuenta la popularidad al colocar las películas en el disco. Aunque no hay mucho que pueda decirse acerca de la popularidad de películas específicas en general (fuera de señalar que la participación de una estrella famosa parece ayudar), sí puede decirse algo acer­ ca de la popularidad relativa de las películas en general. En muchos tipos de concursos de popularidad, como películas que se alquilan, libros que se sacan de la biblioteca, páginas Web visitadas e incluso palabras empleadas en una novela, o la población de las ciudades más grandes, una aproximación razonable de la popularidad relativa sigue un patrón sorprendentemente predecible. Este patrón fue descubierto por un profesor de lingüística de Harvard, George Zipf (1902-1950), y ahora se conoce como ley de Zipf. Lo que dice esta ley es que si las películas, libros, páginas Web o palabras se ordenan en rangos según su popularidad, la probabilidad de que el siguiente cliente escoja el artículo que está en ¿-ésimo lugar en la lista es d k , donde C es la constante de normalización. Por tanto, la fracción de aciertos para las tres películas más solicitadas es C/1, C/2 y C/3, respectivamente, donde C se calcula de modo que la suma de todos los términos sea L En otras palabras, si hay N películas, entonces C /l+ C /2 + C/3 + C/4 + "* + C//V=l C puede calcularse a partir de esta ecuación. Los valores de C para poblaciones con 10, 100, 1000 y 10,000 elementos son 0.341, 0.193, 0.134 y 0.102, respectivamente. Por ejemplo, en el caso de 1000 películas, las probabilidades para las cinco películas más solicitadas son 0.134, 0.067, 0.045, 0.034 y 0.027, respectivamente. La ley de Zipf se ilustra en la figura 7-20. Nada más como diversión, se ha aplicado a las poblaciones de las 20 ciudades más grandes de Estados Unidos. La ley de Zipf predice que la segunda ciudad más grande deberá tener la mitad de habitantes que la ciudad más grande, y que la tercera ciudad más grande deberá ser la tercera parte de la ciudad más grande, y así en forma sucesiva. Aunque dista mucho de ser perfecto, el ajuste es sorprendentemente bueno. En el caso de películas en un servidor de vídeo, la ley de Zipf dice que la película más po­ pular se escoge dos veces más a menudo que la segunda película más popular, tres veces más a menudo que la tercera película más popular, y así en forma sucesiva. A pesar del hecho de que la distribución decae con relativa rapidez al principio, tiene una cola muy larga. Por ejemplo, la película 50 tiene una popularidad de C/50 y la película 51 tiene una popularidad de C/51, de mo­ do que la popularidad de la pehcula 51 es 50/51 la de la película 50, una diferencia de sólo 2%. A medida que avanzamos por la cola, la diferencia porcentual entre películas consecutivas se vuelve cada vez menor. Una conclusión es que el servidor necesita muchas películas porque exis­ te una demanda considerable de películas que no están entre las 10 más populares. Al conocerse las popularidades relativas de las diferentes películas, es posible modelar el desempeño de un servidor de vídeo y utilizar esa información para colocar los archivos. Cier­ tos estudios han demostrado que la mejor estrategia es sorprendentemente sencilla e indepen­ diente de la distribución. Se conoce como algoritmo de órgano de tubos (Grossman y Silverman, 1973; Wong, 1983) y consiste en colocar la pehcula más popular en la parte media del disco, con las segunda y tercera películas más populares a ambos lados. Afuera de éstas vie-

RkJQdWJsaXNoZXIy MjI4NDcx