|
|
Nuevas Tecnologías II
José Camilo Daccach T.
Con todas las tecnologías que constantemente surgen y se desarrollan en las universidades y las empresas en todo el mundo, es difícil determinar cuales tendrán el impacto suficiente para transformar nuestro futuro.
Con todas las tecnologías que constantemente surgen y se desarrollan en las universidades y las empresas en todo el mundo, es difícil determinar cuales tendrán el impacto suficiente para transformar nuestro futuro. Ya se describieron la Traducción Universal y los Nanoalambres; concluimos en esta entrega analizando el aprendizaje con método bayesiano y almacenamiento distribuido.
Aprender con método Bayesiano
Utilizando una rama de la teoría probabilística conocida como estadística Bayesiana se han creado programas que, a la vez que resuelven inquietudes sobre el funcionamiento de los genes, también están revelando verdades profundas sobre una incertidumbre que por años ha rondado a los especialistas en computadores: patrones de aprendizaje, encontrar relaciones de causa efecto, y efectuar predicciones basados en información inevitablemente incompleta sobre el mundo real.
Contrario a la forma anterior de abordar el razonamiento de una máquina, en el cual siempre había que enseñar la relación causa efecto, como por ejemplo "la lluvia hace que el pasto esté mojado", los programas basados en procesos probabilísticos como la matemática bayesiana puede tomar un gran cuerpo de datos (está lloviendo, el pasto está mojado) y deducir relaciones probables o dependencias por su propia cuenta. Esto es importante porque muchas decisiones que un programador quisiera automatizar, como personalizar los resultados de un motor de búsqueda con base en consultas anteriores, no se puede planear con anticipación, y requiere que el computador sopese combinaciones no previstas de evidencia y efectuar su mejor estimado.
Estas técnicas van a impactar todo lo que se hace con los computadores, desde la interfaz del usuario, hasta la minería de datos, pasando por el procesamiento de datos de sensores. La información que se produce hoy en día de las investigaciones es tan abultada que es difícil para un científico poder sacar sus propias conclusiones para descifrar las interacciones entre los diferentes componentes. La demora en la obtención de las interacciones es lo que retrasa la investigación de nuevas medicinas para combatir males como el cáncer o la diabetes. El sistema Bayesiano aplicado ha detectado relaciones que se conocían luego de años de investigación, y también ha identificado funciones de algunos reguladores misteriosos.
Los investigadores están adaptando estos métodos para un buen número de aplicaciones prácticas, dentro de las cuales se encuentran robots capaces de descifrar en forma autónoma y encontrar minas abandonadas. En Google hay también especialistas en éstas técnicas explotando patrones en el vasto mundo de datos interconectados en la Web. Microsoft Office 2003 ya incluye asistentes que utilizan estas técnicas y la empresa británica Agena ha creado software Bayesiano que recomienda programas de TV a suscriptores de cable con base en sus hábitos de entretenimiento.
Almacenamiento Distribuido
Organizar documentos, hojas de calculo, música, fotos y videos, o hacer las copias de respaldo rutinarias en caso de un robo o daño en los equipos, mantener la información es uno de las tareas más difíciles que enfrenta cualquier usuario de computador. Bajo la premisa que sería mejor almacenar esta información en la Internet, a unos cuantos clic de distancia, se está trabajando en un concepto tecnológico conocido como almacenamiento distribuido. Esta tecnología, podría transformar el almacenamiento para las personas y las empresas haciendo que los archivos digitales sean más fáciles de mantener y acceder, a la vez que se elimina el riesgo de que una catástrofe que elimine la información, desde la ida de la energía, hasta daños en los discos duros.
En el esquema de almacenamiento distribuido, los archivos se "distribuyen" por la red, al igual que las tablas que indican su ubicación. Cada tabla apunta a otras tablas, de tal manera que si la búsqueda no está en la primera tabla, apuntará a otras, que eventualmente, en milisegundos, encontrará la tabla que indica la ubicación del archivo buscado. El truco está en desarrollar formas eficientes de enrutar los datos a través de la red, y mantener las tablas actualizadas.
Primera parte
|