Quando se busca sobre tratamento de dados estatísticos, há uma ampla oferta de recursos associados a esta demanda em escala mundial. Podem ser citadas como exemplo as linguagens de programação (C, C++, Java, Python, etc.) e também softwares (SAS, R, MATLAB, Orange, etc.), com cada um possuindo pontos fortes e fracos dependendo da aplicação. Particularmente, entre esses, há um destaque para o Python e o R, que tem apresentado um grande aumento em popularidade e aplicações nos últimos anos. O intuito deste texto é mostrar uma visão geral sobre o potencial de ambos os recursos, justificando o crescimento visualizado e servindo como motivação para a exploração dos mesmos independente do ambiente de trabalho.
R se trata de um software com um ambiente de trabalho feito para lidar com estatística computacional e com linguagens de programação gráficas. Ele possui licença aberta sobre os termos GNU (General Public License) e é amplamente utilizado nos mais diversos setores, seja no âmbito empresarial, acadêmico ou científico. (ALKARKHI; ALQARAGHULI, 2020). Além disso, existe ainda uma série de pontos que o tornam atrativo, dentre os quais:
A seguir, é mostrado algumas figuras que ilustram um pouco do que foi tratado, no caso a interface com acesso a ajuda e um início de experimentação. Todos esses recursos dão um suporte sólido para os iniciantes, em paralelo a um ambiente que tem ficado cada vez mais robusto para os usuários avançados, instigando aos usuários que estão começando o aprendizado a explorar o software.
As interações foram feitas de forma natural, a soma foi realizada diretamente, a função logarítmica foi escrita da forma que vemos nos livros, a plotagem do gráfico foi rápida com o auxílio de uma das funções built-in do R e quando houve erro no argumento o programa avisou e por último, a matriz construída também foi com auxílio de outra função built-in, tudo muito intuitivo.
Agora, apresenta-se o Python, que se trata de uma linguagem de programação focada na eficiência e produtividade no desenvolvimento e resolução de problemas de interesse. Em vários rankings, se aponta essa como uma das 5 mais populares do mundo (MUELLER, 2018). Também há diversos recursos que a fazem se destacar comparada às demais, entre esses estão:
Também será mostrado logo a frente um pouco da interface, de forma a explicitar para novos usuários como os primeiros comandos são intuitivos assim como o acesso a ajuda do ambiente.
Nessa figura, foram feitas apenas 3 interações iniciais e já se pode observar alguns detalhes didáticos da ferramenta, por exemplo:
Após o exposto, conclui-se que mesmo com uma apresentação de visão geral, já há motivos que de fato tornam as ferramentas atraentes para as mais diversas aplicações, mostrando que faz sentido que elas tenham crescido em popularidade nos últimos anos. Fica como consideração final a reflexão sobre o quanto poderia ser explorado caso houvesse domínio das duas ferramentas simultaneamente, visto o potencial de ambas.
Referências:
ALKARKHI, A. F. M.; ALQARAGHULI, W. A. A. Applied Statistics For Environmental Science With R. 1. ed. Amsterdam: Joe Hayton, 2020.
MUELLER, J. P. Beginning Programming with Python ® For Dummies ®. 2. ed. New Jersey: John Wiley & Sons, Inc., 2018.
SANDER, C. TOP 7 ferramentas para análise de dados empresariais. [s.l]. 7 Dez, 2018. Disponível em: https://caetreinamentos.com.br/blog/ferramentas/ferramentas-para-analise-dados/. Acesso em: 09 Jan, 2021.
Autor: Messias Gutemberg.