De ayer Facebook interrupción, que eliminó Facebook Messenger, Instagram, y Whatsapp así como el servicio principal, resultado de un error de los propios ingenieros de red de la empresa.

El error llevó a que todos los servicios de Facebook fueran inaccesibles, y una analogía lo comparó con una falla en los servicios de «control de tráfico aéreo» para el tráfico de la red …

Informamos ayer sobre el fracaso masivo.

No eres solo tú: Facebook, Instagram y WhatsApp están actualmente inactivos para usuarios de todo el mundo. Estamos viendo mensajes de error en los tres servicios en las aplicaciones de iOS y en la web. Los usuarios reciben mensajes de error como: «Lo siento, algo salió mal», «Error del servidor 5xx» y más.

La interrupción está afectando a todas las plataformas propiedad de Facebook, según los datos de Detector de bajada y Twitter. Esto incluye Instagram, Facebook, WhatsApp y Facebook Messenger. […] Si bien algunas interrupciones de Facebook, Instagram y WhatsApp solo afectan ciertas regiones geográficas, los servicios están caídos en todo el mundo hoy.

Poco a poco fue apareciendo que el problema podría estar relacionado con el DNS, los servidores de nombres de dominio que le dicen a los dispositivos qué direcciones IP usar para acceder a los servicios, pero no estaba claro qué había sucedido exactamente, y si se trataba de un ataque externo, una acción maliciosa de un interno, o un error catastrófico.

Facebook ahora ha admitido en una publicación de blog que fue un error.

Nuestros equipos de ingeniería han aprendido que los cambios de configuración en los enrutadores troncales que coordinan el tráfico de red entre nuestros centros de datos causaron problemas que interrumpieron esta comunicación. Esta interrupción del tráfico de la red tuvo un efecto en cascada en la forma en que se comunican nuestros centros de datos, lo que paralizó nuestros servicios.

Tomó mucho tiempo resolver el problema porque los sistemas inaccesibles incluían los servidores y las herramientas que los ingenieros normalmente usarían para resolver el problema de forma remota. Los informes sugieren que los empleados de nivel inferior tenían que obtener acceso físico a los centros de datos y luego confiar en las instrucciones paso a paso de los ingenieros más experimentados para corregir el error. Para complicar esto, las redes que no estaban disponibles significaban que los sistemas de acceso a las puertas de Facebook también estaban fuera de línea, lo que impedía físicamente el acceso.

Cómo entender la interrupción de Facebook

Sin duda, obtendremos la historia completa a tiempo, pero la opinión de consenso que surgió es que el problema era una combinación de configuración del servidor de nombres de dominio (DNS) y del protocolo de puerta de enlace fronteriza (BGP).

La mejor analogía que he visto es pensar en el tráfico de la red como si fuera un avión. Su dispositivo quiere volar a facebook.com. Su avión primero necesita conocer las coordenadas GPS del aeropuerto de destino, es decir, la dirección IP a la que debe conectarse. Obtiene esa información preguntando a un DNS, que le dice que facebook.com se encuentra en (por ejemplo) 66.220.144.0.

Pero llegar al destino final, el servidor real que puede realizar la tarea que desea hacer, depende de una especie de sistema de control de tráfico aéreo para el tráfico de red, y ese es el BGP. El BGP le dice a su dispositivo qué ruta volar a través de los distintos servidores en ruta hacia su destino final.

Parece que Facebook perdió por completo sus sistemas BGP, por lo que no había forma de que Facebook le dijera a los dispositivos cómo llegar a su destino. Y eso incluyó a los propios ingenieros de Facebook llegando a los sistemas que necesitaban para deshacer el error.

La interrupción tiene enormes implicaciones

Si se tratara solo de personas que no pueden publicar videos de gatos durante unas horas, eso sería una cosa (aunque, vamos, ¿qué es la vida sin videos de gatos?). Pero WhatsApp es efectivamente una pieza fundamental de la infraestructura de comunicaciones en muchos países, que se utiliza de forma rutinaria para la comunicación entre pacientes y médicos, por ejemplo, y que muchos utilizan para realizar pagos.

La interrupción prolongada ha llamado la atención sobre lo vulnerable que es el mundo entero a fallas de esta naturaleza.

Por ejemplo, millones de personas confían en los servidores DNS de Google para llegar a todos los servidores del planeta. Imagínese que esos servidores no funcionan durante un período prolongado. Eso no solo afectaría a los consumidores, sino que interrumpiría el comercio y la infraestructura crítica. Producción en fábrica, transporte de flotas, retail… las obras.

El mundo entero depende críticamente de una cantidad relativamente pequeña de servidores, todos los cuales podrían desconectarse por un error como el que ocurrió aquí. Se debe pensar mucho en cómo evitar una interrupción de Internet mucho más significativa en el futuro.

Foto: NASA

FTC: Utilizamos enlaces de afiliados de automóviles que generan ingresos. Más.

fundas dbrand Grip para iPhone 13


Consulte 9to5Mac en YouTube para obtener más noticias de Apple:





Fuente de la Publicacion AQUI

Por admin

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *