Expuesta cadena de suministro a ataques de envenenamiento por fallo de TensorFlow CI/CD

Investigadores de Praetorian descubrieron un error de configuración en el marco de aprendizaje automático de TensorFlow, una plataforma de código abierto para la integración y entrega continua (CI/CD), que podría haber sido explotado para un ataque de la cadena de suministro. Según el informe publicado esta semana, los atacantes podrían haber comprometido los agentes de compilación de TensorFlow a través de una solicitud de extracción maliciosa, lo que les permitiría subir versiones maliciosas al repositorio de GitHub y ejecutar código remoto.

Los investigadores señalan que esta falta de seguridad es una tendencia en el aumento de los procesos de automatización de la CI/CD, y las compañías de IA/ML son especialmente vulnerables. La plataforma TensorFlow utiliza GitHub Actions para construir, probar e implementar el software, y los corredores autónomos son particularmente peligrosos para los repositorios públicos. Praetorian identificó flujos de trabajo de TensorFlow que se ejecutaron en corredores autónomos y encontró bifurcaciones en las solicitudes de extracción de contribuyentes anteriores que activaron automáticamente los flujos de trabajo CI/CD sin aprobación.

Los investigadores pudieron identificar y solucionar problemas de seguridad en la plataforma al requerir la aprobación de cada solicitud de extracción de bifurcaciones a partir del 1 de agosto de 2023. Asimismo, se cambiaron los permisos de GITHUB_TOKEN a solo lectura para los flujos de trabajo que se ejecutaron en corredores autónomos. Se recomienda el uso de corredores auto-alojados con repositorios privados, ya que los corredores alojados por GitHub son efímeros y están aislados, lo que reduce significativamente la posibilidad de ejecutar código malicioso.

Este problema de seguridad se ha observado en varios repositorios públicos de GitHub, incluidos los asociados con Chia Networks, Microsoft DeepSpeed y PyTorch. Es importante que las empresas tengan medidas de seguridad sólidas en su plataforma de aprendizaje automático para evitar posibles ataques de la cadena de suministro.