O que é R e por que você deve domina-lo em 2018?

05 de março de 2018
Última modificação: 05 de março de 2018

Autor: Virgilio F. M. dos Santos
Categorias: Análise de dados, Blog, Carreira

O que é?

Ferramenta estatística RR é linguagem de programação gratuita e poderosa para computação estatística e visualização de dados.

  1. R pode ser usado para calcular uma grande variedade de testes estatísticos clássicos, incluindo:
  • Teste t de Student comparando os meios de dois grupos de amostras
  • Teste de Wilcoxon , uma alternativa não paramétrica do teste t
  • Análise de variância (ANOVA) comparando os meios de mais de dois grupos
  • Teste de qui-quadrado comparando proporções / distribuições
  • Análise de correlação para avaliar a relação entre duas ou mais variáveis

2. Também é possível usar R para realizar análises de classificação como:

  • Análise do componente principal
  • Agrupamento

3. Muitos tipos de gráficos podem ser desenhados usando R, incluindo: gráfico de caixa, histograma, curva de densidade, gráfico de dispersão, gráfico de linha, gráfico de barras, …

R também é uma ferramenta excelente caso queira utilizar no lugar do Minitab para analisar seus dados e implementar a metodologia Six Sigma. Por ser uma ferramenta gratuita, diferente do minitab, talvez seja interessante caso queira implementar os conceitos de melhoria de processos mas não tenha uma assinatura, ou tenha expirado a licença de 30 dias do minitab.

Por que devo aprender?

big data

A cada dia que se passa são criados incríveis 2,5 EXABYTES de dados! O que é equivalente a 90 anos de vídeo HD ou 530 milhões de músicas de dados produzidos (lembrando, isso todos os dias!). Esta enorme onda de dados levou as empresas de todo o mundo a investir grandes dólares em ferramentas e tecnologias para aproveitar o poder de todos esses dados.

À medida que a tecnologia melhora, os dados coletados também estão se tornando mais complexos. As empresas agora têm milhões de gigabytes de dados em tudo, desde as preferências dos usuários até dados sobre consumo de energia. As empresas mais do que nunca precisam de pessoas com as habilidades que podem ajudá-los a extrair o valor desses dados.

Nunca houve um momento melhor para entrar na análise de dados!

Dito isto, está claro a importância destas análises de dados, então você pode estar se perguntando: quais habilidades eu preciso aprender?

Neste artigo, vamos analisar os benefícios de aprender uma das tecnologias mais utilizadas e faladas sobre a análise de dados – a linguagem de programação R.

Então, por que você deveria aprender R em 2018?

  1. É uma das ferramentas mais populares para análise de dados.

R é cada vez mais a língua franca para limpar, analisar e contar uma história com dados, e há muitos estudos e pesquisas que respaldaram isso:

  • O índice TIOBE mensal mede a popularidade de várias linguagens de programação, com base no número de resultados dos mecanismos de pesquisa para consultas contendo cada idioma. Nos últimos dois anos, a R flutuou no top 20 da TIOBEe entrou no número 16 no índice TIOBE de maio de 2016.
  • Nos últimos dois anos, a revista IEEE, de engenharia e ciências aplicadas, combinou dados de várias fontes, incluindo GitHub e CareerBuilder, para criar sua própria lista das 10 principais línguas de programação mais populares para esse ano. Em 2015, R entrou no número 6, subindo da 9ª posição na lista IEEE de 2014. Esse aumento de popularidade levou o IEEE a se referir a R como o “grande motor” de 2015.
  • Todos os anos, o KDNuggests (um site dedicado ao Business Analytics, Big Data, Data Mining e Data Science) pergunta a seus leitores quais as linguagens de programação ou estatísticas que usaram para análise, mineração de dados e / ou ciência dos dados nos últimos 12 meses . R saiu no topo em 2011 , 2012 , 2013 , 2014 2015 .
  • As editoras de livros de tecnologia Packt pesquisaram mais de 3.800 cientistas de dados em 2015, como parte de seus ” Dados grandes e BI: relatório de salários e habilidades“. Quando os entrevistados foram questionados sobre as ferramentas que usavam diariamente, R chegou em terceiro lugar, com Python marcando o primeiro lugar. Embora a R não tenha abordado esta parte específica da pesquisa, quando a Packt perguntou a esses usuários do Python quais outras ferramentas com as quais eles trabalhavam no dia-a-dia, R foi a resposta mais popular, sugerindo que muitos cientistas de dados usam o Python e R simultaneamente.
  1. Comanda um salário alto

altos salários big data RSe só de utilizar e entender bem uma nova tecnologia é divertido, imagine sua nova habilidade se traduz em um salário grande, melhor ainda, não!? Então, que tipo de salários você pode esperar, se você investir algum tempo em aprender R?

O Inquérito Salarial de Tecnologia Dice 2013-2014 de mais de 17.000 profissionais de tecnologia denominados R como a habilidade de melhor remuneração, com uma expectativa salarial média de US $ 115.531. No momento em que a Enquete de Salário de Tecnologia de Dados de 2016 rolou, esse número subiu para US $ 126.249. Enquanto isso, uma consulta recente de listagens de emprego com a habilidade R por especilistas em análise de mercado de trabalho Burning Glass Technologies sugere que os programadores R podem esperar ganhar mais de US $ 75.000.

E se você hospeda sonhos de trabalhar para uma indústria gigante, então R pode ajudar a tornar este sonho realidade, já que a lista de empresas que atualmente estão usando o R inclui muitos nomes familiares, como Google, Facebook, Mozilla, Microsoft e Twitter.

  1. Tem uma comunidade grande

Quando você está discutindo se deve aprender uma nova tecnologia, sempre vale a pena examinar as pessoas que estão usando essa tecnologia. De um modo geral, quanto maior e mais ativa a comunidade, mais apoio você provavelmente irá obter através de coisas como listas de endereços, documentação contribuída pelos usuários, tutoriais on-line e grupos de usuários. Esses recursos são cruciais quando você está enfrentando uma nova tecnologia, mas eles também são importantes quando você está pronto para aprender mais recursos avançados.

Com uma rede global de mais de 2 milhões de usuários, R possui uma comunidade grande com muitos recursos on-line que podem ajudá-lo a dominar R. E se você não consegue encontrar a informação que precisa através dos recursos existentes, você pode chegar ao R comunidade diretamente, por exemplo, postando seu problema no Stackoverflow ou em um fórum R dedicado ou grupo de usuários. Com milhões de usuários R lá fora, seu grito por ajuda tem boas chances de ser respondido!

  1. É de código aberto

R é gratuito para download e livre para uso, e como um projeto de código aberto, qualquer pessoa pode acessar e modificar o código-fonte do R. Inúmeros especialistas em R e entusiastas já contribuíram para o projeto R, e essa abordagem “muitos olhos” para o desenvolvimento da R criou uma linguagem de programação de alta qualidade, madura e profissional.

Muitas pessoas também criaram suas próprias extensões R e as publicaram on-line como pacotes adicionais, por isso, mesmo que o idioma base R não atenda às suas necessidades exatas, é provável que haja um pacote R lá fora. O melhor lugar para encontrar pacotes adicionais é o repositório CRAN (” Roteamento abrangente de rede R)”, que contém mais de 8.300 pacotes que cobrem tudo, desde a identificação de tartarugas ( IDTurtle ) até a determinação da radiação solar ( solaR ).

  1. É plataforma independente

Com R, você realiza análise de dados escrevendo funções e scripts. Isso pode parecer assustador, especialmente se você não tem experiência de programação anterior, mas, uma vez que você dominou R, você pode realizar análises de dados com poucas linhas de código.

Como linguagem de programação, a R também promove a experimentação muito mais do que o software de apontar e clicar, o que pode levar você a descobertas que de outra forma você não teria feito.

Se você estiver trabalhando em um projeto como parte de uma equipe, a abordagem baseada em código de R torna muito mais fácil colaborar, pois é rápido e fácil compartilhar seu código R com outras pessoas. R também é independente da plataforma, de modo que as pessoas com quem compartilha o código nem precisam estar executando o mesmo sistema operacional que você.

  1. Pode gerar saídas gráficas detalhadas e variadas

gráficos ROs dados são mais fáceis de entender quando representados visualmente, em vez de serem apresentados como números brutos, particularmente quando você está lidando com grandes conjuntos de dados ou está comunicando suas descobertas para outras pessoas.

R possui potentes recursos gráficos que permitem gerar gráficos de alta qualidade, como gráficos de barras, histogramas, diagramas de dispersão, árvores, gráficos dinâmicos, símbolos matemáticos e até mesmo novos gráficos de sua própria concepção, muitas vezes com poucas linhas de código.

Se você está trabalhando com dados particularmente complexos, então há muitos pacotes adicionais que ampliam as habilidades gráficas já impressionantes de R. Alguns pacotes de visualização de R populares que você deseja verificar incluem googleVis , ggplot2 e rCharts.

Resumo

Como você pode ver, R é uma ferramenta poderosa e bem estabelecida no mundo dos dados. Não só R é uma habilidade em demanda que pode ter um impacto positivo em seu pacote de pagamento, mas tem uma comunidade vibrante e ativa, o que significa uma abundância de recursos e pacotes adicionais para ajudá-lo a aproveitar ao máximo a linguagem de programação R.

Então, este ano é o ano em que você deve aprende R? A maneira mais eficaz de descobrir se R é ideal para você é tentar por você mesmo! Você pode baixar R gratuitamente do repositório CRAN.

Deixe seu comentário

um comentário

  • Raimundo Junior disse:

    Olá, tudo bem ?

    Eu agradeço a FM2S por compartilhar esse conhecimento, essa ferramenta de programação irá permitir que eu possa desenvolver meus conhecimentos em análise de dados com maior autonomia.

    Cordialmente,
    Raimundo Junior

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *