{"id":57734,"date":"2024-03-05T10:45:33","date_gmt":"2024-03-05T09:45:33","guid":{"rendered":"https:\/\/www.teldat.com\/?p=57734"},"modified":"2026-03-24T11:27:57","modified_gmt":"2026-03-24T10:27:57","slug":"mtbf-fit-equipos-fiables-disponibilidad-de-servicio","status":"publish","type":"post","link":"https:\/\/www.teldat.com\/es\/blog\/mtbf-fit-equipos-fiables-disponibilidad-de-servicio\/","title":{"rendered":"Mejorando la fiabilidad de los equipos y su redundancia"},"content":{"rendered":"<p><img decoding=\"async\" class=\"wp-image-57770 size-full alignleft\" src=\"\/wp-content\/uploads\/2024\/03\/Improving-device-reliability-and-redundancy.jpg\" alt=\"Improving device reliability and redundancy\" width=\"300\" height=\"188\" title=\"\">En un <a href=\"https:\/\/www.teldat.com\/es\/blog\/la-evau-y-la-fiabilidad-del-hardware\/\">art\u00edculo anterior<\/a> \u00a0vimos c\u00f3mo caracterizar matem\u00e1ticamente la fiabilidad de un equipo electr\u00f3nico. Es decir, la probabilidad de que funcione correctamente durante un tiempo. Se resume en el <strong><em>Mean Time Between Failure<\/em> (MTBF)<\/strong>, o su inverso, <strong><em>Failure In Time<\/em> (FIT)<\/strong>. Es t\u00edpico encontrar valores de MTBF del orden de cientos de miles de horas para equipos electr\u00f3nicos.<!--more--><\/p>\n<p><img decoding=\"async\" class=\"size-full wp-image-57706 aligncenter\" src=\"\/wp-content\/uploads\/2024\/03\/Cummulative-probability.jpg\" alt=\"Cummulative probability\" width=\"537\" height=\"367\" title=\"\" srcset=\"\/wp-content\/uploads\/2024\/03\/Cummulative-probability.jpg 537w, \/wp-content\/uploads\/2024\/03\/Cummulative-probability-480x328.jpg 480w\" sizes=\"(min-width: 0px) and (max-width: 480px) 480px, (min-width: 481px) 537px, 100vw\" \/><\/p>\n<p style=\"text-align: center;\"><strong>Fuente: Ricardo Saiz<\/strong><\/p>\n<p style=\"text-align: left;\">La probabilidad de que suceda un fallo durante un tiempo <em>t<\/em> sigue una funci\u00f3n exponencial, aproximada a una recta para intervalos peque\u00f1os.<\/p>\n<p>&nbsp;<\/p>\n<h2>\u00bfDe d\u00f3nde se obtiene el MTBF de un equipo?<\/h2>\n<p>La <strong>fiabilidad de un equipo<\/strong> est\u00e1 determinada por la de sus elementos constitutivos (componentes electr\u00f3nicos soldables, m\u00f3dulos, cableado, etc). El MTBF del conjunto es la suma del inverso del MTBF de cada parte, de forma an\u00e1loga a las resistencias en paralelo. Si en un circuito el\u00e9ctrico se suman las admitancias, el FIT de un equipo con muchos componentes (caminos en paralelo que conducen a un fallo) es la suma de todos esos FIT. Por eso resulta m\u00e1s sencillo operar con el FIT que con MTBF.<\/p>\n<h2>\u00bfC\u00f3mo hacer que un equipo sea m\u00e1s fiable?<\/h2>\n<p>A su vez el <strong>FIT<\/strong> de un componente. No es un valor inmutable, sino que depende del ambiente y principalmente de la temperatura. El calor guarda una relaci\u00f3n directa con la tasa de fallos, y de hecho con la velocidad de numerosos procesos f\u00edsicos y reacciones qu\u00edmicos. El cient\u00edfico sueco Svante Arrhenius (1859 \u2013 1927) fue el primero en modelar esa relaci\u00f3n, en el a\u00f1o 1889, con la ecuaci\u00f3n que lleva su nombre:<\/p>\n<p><img decoding=\"async\" class=\"size-full wp-image-57709 aligncenter\" src=\"\/wp-content\/uploads\/2024\/03\/Formula.jpg\" alt=\"Formula\" width=\"114\" height=\"60\" title=\"\"><\/p>\n<p>Esa ecuaci\u00f3n dice que cerca del cero absoluto se paran las reacciones y que aceleran fuertemente al aumentar la temperatura.<\/p>\n<p>&nbsp;<\/p>\n<h2>Elevada disponibilidad de servicio<\/h2>\n<p>Nuestro equipo ser\u00e1 menos fiable conforme <strong>aumenta la temperatura<\/strong> pero, \u00bfc\u00f3mo hacer que sea m\u00e1s fiable? No podemos luchar contra las leyes de la f\u00edsica, pero s\u00ed podemos tomar las mejores decisiones de ingenier\u00eda contando con ellas. Adem\u00e1s de hacer caso a los manuales cuando indican \u201cno cubra las ranuras de ventilaci\u00f3n\u201d o \u201cinstale el equipo en un lugar alejado de fuentes de calor\u201d, podemos mejorar la fiabilidad del sistema y entonces hablamos de <strong>disponibilidad del servicio (<em>service availability<\/em>)<\/strong>, que es en definitiva lo que importa.<\/p>\n<p>&nbsp;<\/p>\n<h2>Redundancia de los equipos<\/h2>\n<p>En un router o switch podemos <strong>duplicar <\/strong>uno de los elementos que tiene mayor tasa de fallo, como es la <strong>fuente de alimentaci\u00f3n<\/strong>. La probabilidad de que falle una fuente en un intervalo <em>t<\/em> es:<\/p>\n<p><img decoding=\"async\" class=\"size-full wp-image-57712 aligncenter\" src=\"\/wp-content\/uploads\/2024\/03\/power-supply.jpg\" alt=\"power supply\" width=\"120\" height=\"54\" title=\"\"><\/p>\n<p>Esta funci\u00f3n vale 0 en t=0 pero su derivada vale<\/p>\n<p style=\"text-align: left;\"><img decoding=\"async\" class=\"size-full wp-image-57715 aligncenter\" src=\"\/wp-content\/uploads\/2024\/03\/Other-formula.jpg\" alt=\"Other formula\" width=\"53\" height=\"38\" title=\"\"><\/p>\n<p>El equipo dejar\u00e1 de funcionar si fallan ambas fuentes. La probabilidad de que esto suceda ser\u00e1 el cuadrado de la expresi\u00f3n anterior:<\/p>\n<p><img decoding=\"async\" class=\"size-full wp-image-57718 aligncenter\" src=\"\/wp-content\/uploads\/2024\/03\/Source-formula.jpg\" alt=\"Source formula\" width=\"288\" height=\"54\" title=\"\"><\/p>\n<p>Como en el caso anterior, esta funci\u00f3n vale 0 en t=0. Pero, sin embargo, su derivada tambi\u00e9n vale 0 en el origen.<\/p>\n<p><img decoding=\"async\" class=\"size-full wp-image-57721 aligncenter\" src=\"\/wp-content\/uploads\/2024\/03\/Formula-2.jpg\" alt=\"Formula 2\" width=\"535\" height=\"368\" title=\"\" srcset=\"\/wp-content\/uploads\/2024\/03\/Formula-2.jpg 535w, \/wp-content\/uploads\/2024\/03\/Formula-2-480x330.jpg 480w\" sizes=\"(min-width: 0px) and (max-width: 480px) 480px, (min-width: 481px) 535px, 100vw\" \/><\/p>\n<p style=\"text-align: center;\"><strong>Fuente: Ricardo Saiz<\/strong><\/p>\n<p>Con dos unidades trabajando en paralelo, pero s\u00f3lo una imprescindible, la tasa de fallos sigue una curva muy diferente. Sobre todo en plazos de tiempo cortos en comparaci\u00f3n con el MTBF. Ve\u00e1moslo con un sencillo ejemplo.<\/p>\n<p>Tenemos una fuente de alimentaci\u00f3n con un MTBF de 200.000 horas. \u00bfCu\u00e1l es la probabilidad de que se aver\u00ede a lo largo de un a\u00f1o?<\/p>\n<p><img decoding=\"async\" class=\"size-full wp-image-57724 aligncenter\" src=\"\/wp-content\/uploads\/2024\/03\/MTBF.jpg\" alt=\"MTBF\" width=\"237\" height=\"45\" title=\"\"><\/p>\n<p>200.000 horas pueden parecer mucho tiempo pero con un 4,3% de probabilidad se averiar\u00e1 en el primer a\u00f1o de uso. Si tenemos un parque de 23 equipos sufriremos en promedio una aver\u00eda por a\u00f1o, con el consecuente corte del servicio.<\/p>\n<p>Si montamos <strong>dos fuentes trabajando de manera redundante<\/strong> la probabilidad de un fallo cr\u00edtico a lo largo de un a\u00f1o es:<\/p>\n<p><img decoding=\"async\" class=\"size-full wp-image-57727 aligncenter\" src=\"\/wp-content\/uploads\/2024\/03\/formula-3.jpg\" alt=\"formula 3\" width=\"248\" height=\"51\" title=\"\"><\/p>\n<p>Ahora la probabilidad ser\u00e1 de solamente el 0,18%.<\/p>\n<p>Si adem\u00e1s conectamos cada fuente a un <strong>circuito el\u00e9ctrico independiente<\/strong>, por ejemplo de UPS, obtenemos otra ventaja porque ser\u00e1 mucho m\u00e1s improbable que un corte de luz nos deje temporalmente sin servicio.<\/p>\n<p>Si nuestro equipo env\u00eda un aviso al administrador de la red cuando detecta un fallo, se podr\u00e1 sustituir el dispositivo averiado en un plazo corto. Idealmente antes de que surja un segundo fallo que ya s\u00ed ser\u00eda cr\u00edtico.<\/p>\n<p>La disponibilidad del servicio <strong>combinando redundancia con una diligente detecci\u00f3n<\/strong> y subsanaci\u00f3n de fallos es alt\u00edsima. Esto es por lo improbable que resulta, despu\u00e9s de que surja un fallo, tener otro durante el periodo, presumiblemente del orden de horas o pocos d\u00edas, en que se tarde en reparar el equipo. Podemos entenderlo gr\u00e1ficamente porque nos movemos en la zona plana de la l\u00ednea de color gris, o como ve\u00edamos antes, donde la derivada es casi cero.<\/p>\n<p><img decoding=\"async\" class=\" wp-image-57730 aligncenter\" src=\"\/wp-content\/uploads\/2024\/03\/formula-4.jpg\" alt=\"formula 4\" width=\"512\" height=\"367\" title=\"\" srcset=\"https:\/\/www.teldat.com\/wp-content\/uploads\/2024\/03\/formula-4.jpg 413w, https:\/\/www.teldat.com\/wp-content\/uploads\/2024\/03\/formula-4-300x215.jpg 300w\" sizes=\"(max-width: 512px) 100vw, 512px\" \/><\/p>\n<p style=\"text-align: center;\"><strong>Fuente: Ricardo Saiz<\/strong><\/p>\n<p>&nbsp;<\/p>\n<h2>Conclusi\u00f3n de MTBF y m\u00e1s<\/h2>\n<p>Equipos Teldat como la nueva generaci\u00f3n de <a href=\"https:\/\/www.teldat.com\/es\/producto\/windbit-esw2l3-switch-series-de-acceso-vxlan-ethernet-vsu-para-entornos-criticos\/\" target=\"_blank\" rel=\"noopener\">switches<\/a>, algunos de ellos dotados de fuentes de <strong>alimentaci\u00f3n redundantes<\/strong> para los casos m\u00e1s exigentes, ofrecen cifras de MTBF de entre 500.000 y un mill\u00f3n de horas. As\u00ed mismo, con los equipos destinados a escenarios especiales como los ferroviarios, realizamos un riguroso an\u00e1lisis <em>de <strong>Reliability, Availability, Maintainability and Safety<\/strong><\/em><strong> (RAMS)<\/strong>. Mediante el <strong><em>Fault Tree Analysis<\/em><\/strong> (FTA) podemos identificar los posibles fallos, asegurar modos de funcionamiento alternativos en caso de fallos simples. Y de ese modo, obtener unas cifras de disponibilidad de servicio cercanas al 100%.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>En un art\u00edculo anterior \u00a0vimos c\u00f3mo caracterizar matem\u00e1ticamente la fiabilidad de un equipo electr\u00f3nico. Es decir, la probabilidad de que funcione correctamente durante un tiempo. Se resume en el Mean Time Between Failure (MTBF), o su inverso, Failure In Time (FIT). Es t\u00edpico encontrar valores de MTBF del orden de cientos de miles de horas [&hellip;]<\/p>\n","protected":false},"author":166,"featured_media":57773,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","footnotes":""},"categories":[1160],"tags":[1087,1051,1320,1636],"class_list":["post-57734","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-equipos-hardware","tag-tecnologia-de-comunicaciones","tag-tecnologia-de-routers","tag-tecnologia-de-telecomunicaciones-es","tag-telecommunication-technology"],"acf":[],"wpml_current_locale":"es_ES","wpml_translations":[{"locale":"en_US","id":57703,"slug":"mtbf-fit-device-reliability-service-availability","post_title":"Improving device reliability and redundancy","href":"https:\/\/www.teldat.com\/mtbf-fit-device-reliability-service-availability\/"}],"_links":{"self":[{"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/posts\/57734","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/users\/166"}],"replies":[{"embeddable":true,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/comments?post=57734"}],"version-history":[{"count":2,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/posts\/57734\/revisions"}],"predecessor-version":[{"id":76909,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/posts\/57734\/revisions\/76909"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/media\/57773"}],"wp:attachment":[{"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/media?parent=57734"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/categories?post=57734"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/tags?post=57734"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}