La selección de fuentes de datos es uno de los procesos más críticos en los sistemas de mediación en contextos de gran escala, como los que se encuentran en las grandes organizaciones virtuales. En tales contextos, el alto volumen de fuentes de datos estructurados, la distribución, la heterogeneidad, la fragmentación y replicación de datos dificultan la identificación de las fuentes de datos relevantes que deben evaluar una consulta. Esta tesis provee un análisis exhaustivo de las propuestas actuales de mediación y de selección de fuentes de datos desde el punto de vista de las exigencias de los contextos a gran escala. Aporta una estrategia de selección de fuentes de datos llamada OptiSource que combina técnicas de recuperación de información, optimización combinatoria y tecnologías semánticas para guiar la selección de las fuentes a aquellas más relevantes en un contexto de gran escala. OptiSource es parte de un sistema de mediación adaptable creado para organizaciones virtuales que elige dinámicamente la estrategia de selección de fuentes más apropiada de acuerdo con el contexto. Esta tesis provee un análisis exhaustivo de las propuestas actuales de mediación y de selección de fuentes de datos desde el punto de vista de las exigencias de los contextos a gran escala. Aporta una estrategia de selección de fuentes de datos llamada OptiSource que combina técnicas de recuperación de información, optimización combinatoria y tecnologías semánticas para guiar la selección de las fuentes a aquellas más relevantes en un contexto de gran escala. OptiSource es parte de un sistema de mediación adaptable creado para organizaciones virtuales que elige dinámicamente la estrategia de selección de fuentes más apropiada de acuerdo con el contexto.