¿Cuánto tiempo le tomaría a un buen equipo hacer un clon de Dropbox?

Creo que a lo sumo 3-4 meses (con un poco de outsourcing juicioso / uso de múltiples equipos y compra de varios componentes listos para usar)

¿Cuánto tiempo llevará la prueba beta? ¿Cuánto tiempo llevará al mercado y conseguir suficientes clientes para ser un verdadero clon? Ni idea. ¿Quizás otros 2-3 meses?

Interfaz web

Una imitación barata probablemente se puede hacer en 3-4 días.

Me gusta la demostración de ServiceStack de un navegador de archivos similar a GitHub; obviamente necesita alguna forma de mostrar archivos eliminados, pero de lo contrario es bueno ir. Hay muchos componentes de explorador de archivos para el backend php / asp.net / java con una interfaz HTML5 / JavaScript. Siempre que la interfaz del servidor esté bien definida (y probablemente pueda simplemente arrancar la interfaz S3 de Amazon) este bit puede continuar en paralelo con los otros bits.

Aplicación de escritorio para Windows / Mac / Linux (Nautilus)

No hay razón por la que no puedan desarrollarse en paralelo. A menos que alguien intente salvar al desarrollador. esfuerzo (y costos de mantenimiento / prueba) mediante el desarrollo de una biblioteca común y luego la codificación de interfaces individuales que aprovechan la biblioteca común.
3-4 semanas para hacer una primera iteración

Aplicación móvil (iPad / iPhone / Android / Blackberry)

Nuevamente, no hay razón por la que no puedan ser paralelos y subcontratados. Hay un montón de empresas de desarrollo de aplicaciones móviles altamente talentosas en sitios como vworker.com que le quitan una especificación y desarrollan las aplicaciones …
3-4 semanas para hacer una primera iteración

Lógica del servidor

La verdadera carne del asunto … Creo que una combinación de rsync / git lo haría. Esencialmente SparkleShare a la inversa (hecho a la derecha). El cliente solo tiene una biblioteca como rsync. El servidor realiza un git commit justo antes de iniciar una sincronización para que tenga versiones, etc. Se puede hacer de forma económica si no desea una dedup / diff / compresión sólida como una roca. Pero el disco es barato hoy en día.
3-4 semanas para hacer una primera iteración

Sistema de gestión de almacenamiento

Creo que ZFS con dedup lo haría. Las versiones de cada archivo se deducirán por usted. Una forma muy rápida de comenzar es comprar Oracle (nee Sun) Thumpers que tienen muchas de las cosas de almacenamiento / incursión horneadas. ¡Y sería muchísimo más barato que S3! Podrías pasar unas semanas probando BSD con una versión de código abierto de ZFS o Suse 12.1 con su ‘BTRFS nativo si realmente quieres … y una vez que se realiza el desarrollo inicial, probablemente puedas probar Ceph o alguna de esas capas de almacenamiento distribuido … ( que funciona bien con btrfs que he escuchado …)

Tenga en cuenta que Dropbox hace un uso extensivo de Amazon S3 / EC2, lo que hace que la capa de almacenamiento sea más fácil de desarrollar, ¡pero el costo de almacenamiento y ancho de banda es enorme! Compare esto con algo como Backblaze, que tiene un costo muy bajo de almacenamiento y transferencia de datos, pero mucho más esfuerzo de desarrollo … (Probablemente cuesta una décima parte de lo que cuesta Amazon). Diría que los Thumpers estarían en el medio en términos de costo, pero están probados en batalla y la gente inteligente los ama. Por supuesto, podría ir a toda la empresa y comprar una solución EMC.