{"id":20877,"date":"2018-05-23T08:31:50","date_gmt":"2018-05-23T06:31:50","guid":{"rendered":"https:\/\/www.teldat.com\/sin-categorizar\/20877\/procesado-de-big-data-base-de-datos-de-big-data-clusters-nosql-mapreduce\/"},"modified":"2022-12-22T18:01:15","modified_gmt":"2022-12-22T16:01:15","slug":"procesado-de-big-data-base-de-datos-de-big-data-clusters-nosql-mapreduce","status":"publish","type":"post","link":"https:\/\/www.teldat.com\/es\/blog\/procesado-de-big-data-base-de-datos-de-big-data-clusters-nosql-mapreduce\/","title":{"rendered":"Las tecnolog\u00edas Big Data"},"content":{"rendered":"<p><img decoding=\"async\" class=\"alignleft size-medium wp-image-5122\" src=\"https:\/\/www.teldat.com\/wp-content\/uploads\/2022\/06\/Juan-Jose-Luna-Mayo-2018-Post-300x200-1.jpg\" alt=\"big data\" width=\"300\" height=\"200\" title=\"\">En la actualidad, cualquier corporaci\u00f3n genera una gran cantidad de datos a trav\u00e9s de los productos y servicios que ofrece a sus clientes. Analizarlos de forma adecuada proporciona informaci\u00f3n muy \u00fatil que permite <strong>optimizar y mejorar, e incluso generar nuevos productos y servicios.<\/strong> En definitiva, un buen an\u00e1lisis de los datos puede aportar ventajas competitivas a una corporaci\u00f3n.<\/p>\n<p><!--more--><\/p>\n<p>El problema surge cuando los datos crecen de forma exponencial, como ocurre en la actualidad en las <strong>empresas tecnol\u00f3gicas<\/strong>, donde <strong>cualquier producto o servicio permite medir una cantidad enorme de par\u00e1metros,<\/strong> lo que genera una gran cantidad de datos constantemente.<\/p>\n<p>Adem\u00e1s, habitualmente esos datos proceden de fuentes heterog\u00e9neas, con estructuras diferentes o incluso <strong>sin estructurar,<\/strong> y se generan a gran velocidad. Cuando esto ocurre, las tecnolog\u00edas de procesamiento, almacenamiento y visualizaci\u00f3n de datos convencionales dejan de ser v\u00e1lidas, ya sea por limitaciones en la capacidad o en el tiempo de procesado. O quiz\u00e1 tambi\u00e9n por limitaciones en el volumen de almacenamiento de datos.<\/p>\n<p>En este contexto entran en juego las tecnolog\u00edas Big Data, un conjunto de tecnolog\u00edas que proporcionan<strong> herramientas de procesamiento y almacenamiento de datos,<\/strong> espec\u00edficamente dise\u00f1adas para solventar las particularidades que presentan este tipo de entornos.<\/p>\n<h2>Tecnolog\u00edas de procesamiento Big Data<\/h2>\n<p>Las<strong> tecnolog\u00edas Big Data<\/strong> resuelven los problemas de procesado de forma diferente, aplicando t\u00e9cnicas como el <strong>MapReduce<\/strong> son capaces de fraccionar el procesado de un set de datos y distribuirlo en un cl\u00faster de m\u00e1quinas.<\/p>\n<p>Los cl\u00fasteres pueden tener tama\u00f1os muy grandes, algunas corporaciones tienen<strong> cl\u00fasteres de m\u00e1s de mil m\u00e1quinas,<\/strong> con lo cual, tienen disponibles varios miles de microprocesadores para realizar tareas de procesado de datos.<\/p>\n<p>Estas tecnolog\u00edas, combinadas con las plataformas ofrecidas por los<strong> proveedores de servicios en la nube,<\/strong> permiten adaptar el <strong>tama\u00f1o del cl\u00faster<\/strong> en tiempo real, en funci\u00f3n de las necesidades puntuales de procesamiento. De este modo es posible adaptar los <strong>sistemas a flujos de datos variables<\/strong>, lo que permite aumentar el tama\u00f1o del cl\u00faster para absorber picos de datos elevados en momentos puntuales, y disminuirlo cuando las necesidades de procesado disminuyan. La flexibilidad es enorme y permite <strong>optimizar los costes de uso<\/strong> de estas tecnolog\u00edas haci\u00e9ndolas accesibles a cualquier corporaci\u00f3n.<\/p>\n<p>Algunas de las tecnolog\u00edas de procesado de datos m\u00e1s utilizadas en la actualidad son <strong>Hadoop MapReduce, Apache Spark o Apache Lynx.<\/strong><\/p>\n<h2>Tecnolog\u00edas de almacenamiento Big Data<\/h2>\n<p>Para este tipo de entornos de datos masivos no son v\u00e1lidas las bases de datos relacionales tradicionales. Por eso se crearon las<strong> bases de datos NoSQL<\/strong> (<em>not only SQL<\/em>). En realidad existen muchos tipos diferentes, cada uno orientado a resolver un escenario espec\u00edfico de forma \u00f3ptima. Los m\u00e1s habituales son:<\/p>\n<p>\u2022 Bases de <strong>datos columnares.<\/strong><br \/>\n\u2022 Bases de <strong>datos key-value.<\/strong><br \/>\n\u2022 Bases de<strong> datos documentales.<\/strong><\/p>\n<p>Algunas de las<strong> tecnolog\u00edas de bases de datos Big Data<\/strong> m\u00e1s utilizadas en la actualidad son <strong>Apache Cassandra, Hbase, Amazon DynamoDB o Google BigTable.<\/strong><\/p>\n<p>En <strong>Teldat<\/strong> utilizamos<strong> tecnolog\u00edas Big Data<\/strong> para la prestaci\u00f3n de ciertos servicios que ofrecemos a nuestros clientes.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>En la actualidad, cualquier corporaci\u00f3n genera una gran cantidad de datos a trav\u00e9s de los productos y servicios que ofrece a sus clientes. Analizarlos de forma adecuada proporciona informaci\u00f3n muy \u00fatil que permite optimizar y mejorar, e incluso generar nuevos productos y servicios. En definitiva, un buen an\u00e1lisis de los datos puede aportar ventajas competitivas [&hellip;]<\/p>\n","protected":false},"author":178,"featured_media":19282,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","footnotes":""},"categories":[1152],"tags":[1090],"class_list":["post-20877","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-transformacion-digital","tag-analisis-de-datos"],"acf":[],"wpml_current_locale":"es_ES","wpml_translations":[{"locale":"en_US","id":19275,"slug":"big-data-processing-big-data-database-clusters-nosql-mapreduce","post_title":"Big Data Technologies","href":"https:\/\/www.teldat.com\/big-data-processing-big-data-database-clusters-nosql-mapreduce\/"}],"_links":{"self":[{"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/posts\/20877","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/users\/178"}],"replies":[{"embeddable":true,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/comments?post=20877"}],"version-history":[{"count":0,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/posts\/20877\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/media\/19282"}],"wp:attachment":[{"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/media?parent=20877"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/categories?post=20877"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.teldat.com\/es\/wp-json\/wp\/v2\/tags?post=20877"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}