{"id":96644,"date":"2018-07-31T17:43:29","date_gmt":"2018-07-31T20:43:29","guid":{"rendered":"https:\/\/duploexpresso.com\/?p=96644"},"modified":"2018-07-31T17:43:29","modified_gmt":"2018-07-31T20:43:29","slug":"big-data-e-os-algoritmos","status":"publish","type":"post","link":"https:\/\/duploexpresso.com\/?p=96644","title":{"rendered":"Big Data e os algoritmos"},"content":{"rendered":"<p><strong>Por Patr\u00edcia Vauquier, para o Duplo Expresso <\/strong><\/p>\n<p>Dava at\u00e9 pra ser nome de banda de rock dos anos 1980, mas <em>Big Data<\/em> e algoritmos fazem parte do mais novo vocabul\u00e1rio de inform\u00e1tica ou TI (Tecnologia da Informa\u00e7\u00e3o) dos \u00faltimos tempos. \u00c9 a \u00faltima moda das grandes empresas.<\/p>\n<p>O que \u00e9 <em>Big Data<\/em>? \u00c9 o equivalente ao petr\u00f3leo do novo mil\u00eanio. Seria a capacidade de explorar economicamente a an\u00e1lise quantitativa dos dados dispon\u00edveis. A evolu\u00e7\u00e3o do sistema de informa\u00e7\u00e3o, o aumento da pot\u00eancia dos microprocessadores, a diminui\u00e7\u00e3o dos custos de armazenamento de dados e a velocidade das redes proporcionou esse salto.<\/p>\n<p>O capitalismo do s\u00e9culo XXI desvinculou-se da produ\u00e7\u00e3o, dirigindo-se aos servi\u00e7os (o Gustavo Galv\u00e3o pode explicar isso bem melhor do que eu). E, no que diz respeito aos servi\u00e7os, as informa\u00e7\u00f5es s\u00e3o um bem precios\u00edssimo. Para se ter uma ideia do volume existente nas trocas de informa\u00e7\u00f5es, se 1 <em>byte<\/em> = 8 <em>bits<\/em> (combina\u00e7\u00e3o de 0s e de 1s) fosse equivalente a um gr\u00e3o de areia poder\u00edamos considerar o <em>Big Data<\/em> como todo o volume de areia existente nas praias do nordeste brasileiro.<\/p>\n<p>E de onde v\u00eam esses dados? Das redes sociais, dos sistemas de geolocaliza\u00e7\u00e3o dos celulares, ou de outros objetos conectados, de cadastros de empresas, etc. Em 2009, foi criada a W3C: World Wide Web Consortium, uma comunidade internacional que tem por objetivo o desenvolvimento de pr\u00e1ticas, para garantir o crescimento da <em>web<\/em>. Ali, h\u00e1 um bom conte\u00fado para programadores, usu\u00e1rios e curiosos.<\/p>\n<p>A variedade e o volume de dados s\u00e3o t\u00e3o grandes, que as ferramentas existentes para tratar e explorar essa enorme quantidade de informa\u00e7\u00f5es s\u00e3o obsoletas. \u00c9 quase como tentar cavar um t\u00fanel de metr\u00f4 com uma p\u00e1 de brinquedo. H\u00e1 ainda a incompatibilidade de programas e tecnologias. A fim de armazenar e explorar essa gigantesca quantidade de dados, \u00e9 preciso dispor de equipamentos adequados.<\/p>\n<p>A principal import\u00e2ncia do <em>Big Data<\/em> n\u00e3o est\u00e1 centrada apenas na variedade e no volume dos dados, ou, ainda, na velocidade com que s\u00e3o analisados, mas sim em sua capacidade de permitir a correla\u00e7\u00e3o dos mesmos. \u00c9 o que a ind\u00fastria da inform\u00e1tica chama de <em>data mining<\/em> (em portugu\u00eas, minera\u00e7\u00e3o de dados).<\/p>\n<p>Eis a defini\u00e7\u00e3o do termo na Wikipedia:<\/p>\n<p><em>\u201cA minera\u00e7\u00e3o de dados \u00e9 formada por um conjunto de ferramentas e t\u00e9cnicas que, atrav\u00e9s do uso de algoritmos de aprendizagem ou classifica\u00e7\u00e3o baseados em redes neurais e estat\u00edstica, s\u00e3o capazes de explorar um conjunto de dados, extraindo ou ajudando a evidenciar padr\u00f5es nestes dados e auxiliando na descoberta de conhecimento. Esse conhecimento pode ser apresentado por essas ferramentas de diversas formas: agrupamentos, hip\u00f3teses, regras, \u00e1rvores de decis\u00e3o, grafos, ou dendrogramas.\u201d<\/em><\/p>\n<p>E \u00e9 nos algoritmos que encontramos o cerne do <em>Big Data<\/em>: os dados s\u00e3o armazenados num <em>data lake<\/em> (pense num lago enorme, cheio de informa\u00e7\u00f5es armazenadas em formato bruto). A forma como estas informa\u00e7\u00f5es s\u00e3o pesquisadas nesse lago s\u00e3o os algoritmos. Quem elabora os algoritmos s\u00e3o profissionais especializados em programa\u00e7\u00e3o, que traduzem a necessidade do \u201ccliente\u201d de obter informa\u00e7\u00f5es especificas a partir da pesquisa realizada pelos algoritmos nesses <em>data lakes<\/em>. Os algoritmos podem fazer rela\u00e7\u00f5es entre os mais diversos dados: a quantidade de brasileiros que viaja constantemente ao exterior, domicilio e h\u00e1bitos de lazer.<\/p>\n<p>Ou ainda, eles podem ordenar os resultados de pesquisas em ferramentas de busca. Por exemplo, vamos supor que uma empresa disponha de uma determinada ferramenta de pesquisa na internet. Imagine que essa empresa considere artigos disseminando ideias socialistas como sendo nocivos a seus usu\u00e1rios. Assim, ela pode determinar que pesquisas feitas na sua ferramenta n\u00e3o resultem em artigos de natureza socialista ou, ent\u00e3o, pode fazer com que a ferramenta selecione artigos contr\u00e1rios ao socialismo, relegando os favor\u00e1veis para o \u00faltimo lugar na fila da pesquisa (final da p\u00e1gina 1000, por exemplo).<\/p>\n<p>Um outro uso dos algoritmos \u00e9 na \u00e1rea de \u201cseguran\u00e7a\u201d. Usam-se algoritmos, para identificar padr\u00f5es e usu\u00e1rios da internet a partir do uso de certos termos. \u00c9 a \u201cpesca\u201d das palavras-chave que vai monitorar as trocas na rede, entre e-mails, rede sociais, mensagens de telefone. Mas o fil\u00e9 mignon no uso dos algoritmos est\u00e1 no tratamento do \u201cproduto&#8221; das m\u00eddias sociais: os dados de seus usu\u00e1rios, que s\u00e3o vendidos \u00e0s empresas interessadas (que os usam para ofertar produtos espec\u00edficos, dirigindo a esses usu\u00e1rios mensagens publicit\u00e1rias correspondentes \u00e0s necessidades destes).<\/p>\n<p>No dia 25 de maio de 2018, a Europa implementou o Regulamento Geral sobre a Prote\u00e7\u00e3o de Dados,\u00a0que aborda a privacidade e a prote\u00e7\u00e3o de dados pessoais \u2013 aplic\u00e1vel a todos os indiv\u00edduos da Uni\u00e3o Europeia e do Espa\u00e7o Econ\u00f4mico Europeu \u2013, como uma forma de proteger as pessoas da explora\u00e7\u00e3o de seus dados pessoais. O Brasil seguiu a mesma linha, mas a lei brasileira ainda est\u00e1 em processo de aprova\u00e7\u00e3o.<\/p>\n<p>Na Europa, a aprova\u00e7\u00e3o desse tipo de legisla\u00e7\u00e3o \u00e9 uma primeira medida contra a explora\u00e7\u00e3o da vida privada, mas ainda falta tratar do monitoramento da rede e da indu\u00e7\u00e3o de comportamentos ditada pelos algoritmos, al\u00e9m de um outro tema em discuss\u00e3o nas comiss\u00f5es de \u00e9tica: o uso da intelig\u00eancia artificial, por exemplo, em ve\u00edculos aut\u00f4nomos. A pauta gira em torno das escolhas que um algoritmo deve fazer em caso de acidentes: Ele deve salvar um pedestre, desviando o ve\u00edculo, mas, no processo, matar o passageiro? Ou deve salvar o passageiro, por\u00e9m, como resultado, atropelar o pedestre? E quanto \u00e0s responsabilidades? Quem \u00e9 o culpado? O programador do algoritmo? O fabricante do carro? O passageiro (que optou por usar um ve\u00edculo aut\u00f4nomo)?<\/p>\n<p>Nosso amigo Carlos Krebs levantou uma quest\u00e3o essencial: a qual rainha servimos nessa colmeia\/formigueiro de dados? A resposta \u00e9: \u00e0 rainha GAFA (Google, Amazon, Facebook e Apple).<\/p>\n<p>O Google lidera nas ferramentas de pesquisa e j\u00e1 diversificou sua gama de investimentos, que v\u00e3o da rob\u00f3tica a investimentos em startups.<\/p>\n<p>O maior neg\u00f3cio da Amazon, disparado, \u00e9 o Amazon Web Services (AWS), seu bra\u00e7o voltado \u00e0 computa\u00e7\u00e3o na nuvem. Basicamente, s\u00e3o enormes centros de armazenamento, processamento e distribui\u00e7\u00e3o de dados espalhados pelo mundo (<a href=\"https:\/\/aws.amazon.com\/about-aws\/global-infrastructure\/\">https:\/\/aws.amazon.com\/about-aws\/global-infrastructure\/<\/a>). S\u00e3o Paulo hospeda o \u00fanico desses centros na Am\u00e9rica Latina.<\/p>\n<p>O Facebook \u00e9 o gigante das redes sociais, com dados suficientes para identificar o sabor do sorvete preferido de uma cidade inteira (para dizer o m\u00ednimo).<\/p>\n<p>J\u00e1 a Apple \u2013 a maior empresa de capital aberto do mundo \u2013 \u00e9 presen\u00e7a marcante no mercado de dispositivos eletr\u00f4nicos de uso pessoal (computadores, tablets, celulares e aparelhos de <em>streaming<\/em>), por meio dos quais transitam diariamente dados de milh\u00f5es e milh\u00f5es de pessoas. Al\u00e9m disso, outros investimentos importantes da empresa s\u00e3o nas \u00e1reas de ve\u00edculos el\u00e9tricos (que, possivelmente, tamb\u00e9m vir\u00e3o a ser aut\u00f4nomos) e de fornecimento de energia el\u00e9trica (a Apple Energy, especializada em energia solar).<\/p>\n<p>De uma forma ou de outra, essas quatro grande empresas revolucionaram a maneira de tratar dados e informa\u00e7\u00f5es, o que criou novas demandas e permitiu a emerg\u00eancia de outras empresas entre as grandes, que desenvolvem os aplicativos, os programas e softwares que s\u00e3o utilizados no processamento desses <em>exabytes<\/em> de dados. Ali\u00e1s, a tend\u00eancia de uniformiza\u00e7\u00e3o do setor de inform\u00e1tica acabou levando \u00e0 consolida\u00e7\u00e3o e ao monop\u00f3lio do mercado por grandes empresas, com direito a muita terceiriza\u00e7\u00e3o em v\u00e1rios n\u00edveis.<\/p>\n<p>O <em>Big Data<\/em> orienta o capitalismo num outro sentido, mais agressivo e ainda mais abstrato, no qual a financeiriza\u00e7\u00e3o do sistema econ\u00f4mico se eleva exponencialmente, sistema esse que ainda n\u00e3o se recuperou da \u00faltima crise financeira h\u00e1 dez anos. Infelizmente, as tecnologias evoluem, mas o ser humano continua o mesmo.<\/p>\n<p>Obs.: Obrigada a Ana Tomazini, Yorkshire Tea e Carlos Krebs.<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Dava at\u00e9 pra ser nome de banda de rock dos anos 1980, mas Big Data e algoritmos fazem parte do mais novo vocabul\u00e1rio de inform\u00e1tica ou TI (Tecnologia da Informa\u00e7\u00e3o) dos \u00faltimos tempos. \u00c9 a \u00faltima moda das grandes empresas.<br \/>\nO que \u00e9 Big Data? \u00c9 o equivalente ao petr\u00f3leo do novo mil\u00eanio. Seria a capacidade de explorar economicamente a an\u00e1lise quantitativa dos dados dispon\u00edveis. A evolu\u00e7\u00e3o do sistema de informa\u00e7\u00e3o, o aumento da pot\u00eancia dos microprocessadores, a diminui\u00e7\u00e3o dos custos de armazenamento de dados e a velocidade das redes proporcionou esse salto.<\/p>\n","protected":false},"author":30,"featured_media":96645,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[772,592,612,774],"tags":[1460,1458,1461,68,70,1459,42],"class_list":["post-96644","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ciencia","category-comentaristas","category-patricia-vauquier","category-tecnologia","tag-algoritmos","tag-big-data","tag-capitalismo","tag-facebook","tag-google","tag-manipulacao-de-dados","tag-redes-sociais"],"_links":{"self":[{"href":"https:\/\/duploexpresso.com\/index.php?rest_route=\/wp\/v2\/posts\/96644","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/duploexpresso.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/duploexpresso.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/duploexpresso.com\/index.php?rest_route=\/wp\/v2\/users\/30"}],"replies":[{"embeddable":true,"href":"https:\/\/duploexpresso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=96644"}],"version-history":[{"count":0,"href":"https:\/\/duploexpresso.com\/index.php?rest_route=\/wp\/v2\/posts\/96644\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/duploexpresso.com\/index.php?rest_route=\/wp\/v2\/media\/96645"}],"wp:attachment":[{"href":"https:\/\/duploexpresso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=96644"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/duploexpresso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=96644"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/duploexpresso.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=96644"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}