Instalação Ambiente Python para Aprendizagem de Máquina

Instalação do Python, TensorFlow e Jupyter

Postado em 10/07/2018

Conteúdo

  1. Requisitos
  2. Instalando Python
  3. Instalando TensorFlow
  4. Instalando Git
  5. Testando
  6. Considerações Finais

Requisitos computacionais

A configuração recomendável para este tutorial de instalação é um computador com Windows 64 bits e pelo menos 4 GB de RAM. Dependendo do tipo de uso e estudos que serão realizado em seu ambiente, recomendo pelo menos 8 GB de RAM e um processador como um Intel Core i5 ou semelhante com pelo menos quatro núcleos.

Instalando Python

python

Python é atualmente a linguagem de programação preferida pelos cientistas de dados, especialmente para aprendizado de máquina. Tendo uma sintaxe extremamente simples e legível, permite que o foco seja no conteúdo do seu programa e não em como escrevê-lo. Aqui, vamos ensinar como instalar a distribuição Anaconda, um pacote de programas que inclui o Python mais uma série de extensões utilizadas em ciência de dados e aprendizado de máquina (como Numpy, Pandas, Jupyter Notebooks e Scikit Learn).

Primeiro, confirme se o seu sistema operacional Windows é 64 bits. Este tutorial só funciona na versão 64 bits do Windows. Uma vez que você tenha confirmado essa versão, podemos prosseguir com a instalação.

Em seguida, acesse https://www.continuum.io/downloads e baixe o Anaconda para Windows, versão 64-bits. Ao clicar no botão do download, um arquivo executável será baixado.

Clique no arquivo executável para inicializar a instalação. Prossiga com as opções padrões, mas certifique-se de que a caixa com a opção Add Anaconda to PATH esteja selecionada. Esse processo de instalação pode demorar um pouco. Quando a instalação concluir, podemos testar se tudo deu certo.

Abra o prompt de comando. Antes de prosseguir, vamos nos familiarizar com essa interface de linhas de comando. A propt de comando é uma forma alternativa de interagir com o seu computador. Da mesma forma que você navega pelas pastas e arquivos clicando com o mouse, você pode fazer isso na linha de comando. Por padrão, a linha de comando abre no seu Home, o local onde ficam suas pastas de imagens, documentos, downloads, etc. Após abrir o prompt de comando, digite dir para ver o que está na sua pasta, naquele local. O comando dir lista o que está na sua pasta (ou diretório) corrente.

Agora, digite cd Desktop para navegar ao Desktop do seu computador. Se quiser, digite dir para mostrar quais arquivos estão no seu Desktop. O comando cd (change directory) troca o diretório (ou pasta) corrente. O comando cd .. sobe um nível nas pastas do seu computador. Se você digitar isso na prompt de comando enquanto estiver no Desktop, ele te levará de volta ao Home, que é a o diretório um nível acima do Desktop. Volte para o HOME.

No HOME, digite python na prompt de comando. Isso iniciará o modo interativa do Python. Execute algumas operações matemáticas como 2+2 e veja o resultado sendo calculado pelo Python. Quando terminar, digite quit() para sair da versão interativa do Python.

Para finalizar, digite jupyter notebook na linha de comando. Isso inicializará o Jupyter, um programa que executa códigos em Python. Uma nova aba será aberta no seu navegador padrão e nela você verá a interface do Jupyter. Caso essa aba não abra, na prompt de comando, procure um link com uma sequencia de caracteres que compõe o token do primeiro acesso, algo parecido com isso: http://localhost:8888/?token=78f6f86f7a769ceead2bd3b288c178a693e2b87ecf2b79aa. Copie e cole esse link em uma nova aba do seu browser para abrir a interface do Jupyter. Nessa interface, você poderá escrever notebooks que intercalam código em Python intercalado com comentários. Para sair do notebook, feche a aba no seu browser, volte a prompt de comando e aperte CTRL+C, seguido de y e enter. CTRL+C é um comando para fechar programas que estão rodando na sua prompt de comando; você terá que confirmar o fechamento com y seguido de enter.

Para aprender mais sobre a linha de comando, sugiro este link. Para aprender mais sobre o Jupyter, sugiro este link.

Instalando TensorFlow

python

O TensorFlow é um programa de computação numérica, que tem sua versão principal em Python. O TensorFlow é utilizado em algoritmos de deep learning, devido a sua eficiência computacional e abundância de comandos facilitadores para construção e treinamento de redes neurais. Antes de instalar o TensorFlow, vamos criar um ambiente Python. Nesse ambiente, todas as extensões (ou pacotes) que vem no Anaconda estarão presentes, mas o que instalarmos nele não será acessível de fora dele. Isso evita que a instalação de um pacote novo possa prejudicar o funcionamento dos pacotes já instalados.

Para criar um ambiente novo, digite conda create -n tensorflow na linha de comando. Confirme a criação do ambiente digitando y, seguido de enter. Agora, digite activate tensorflow para entrar nesse ambiente. Note que a sua linha de comando mudará para incluir (tensorflow) antes do nome do seu diretório corrente. Para sair do ambiente, basta digitar deactivate.

Finalmente, para instalar o TensorFlow, entre no ambiente recém criado e digite:

pip install --ignore-installed --upgrade tensorflow

Dica: CTRL+C e CTRL+V não funciona na linha de comando, mas você pode copiar e colar comandos clicando com o botão direito do mouse. Em alguns computadores, na linha de comando, podemos usar CTRL+SHIFT+C para copiar e CTRL+SHITF+V para colar.

Na instalação do TensorFlow, usaremos pip, que é o gerenciador de pacotes do Python, para instalar o TensorFlow para Windows, com suporte para CPU apenas. A instalação com suporte para GPU é mais complicada e varia muito. Caso queira instalá-la, siga as instruções no site do TensorFlow. Teste agora sua instalação. Na linha de comando, digite python para iniciar o modo iterativo do Python. Digite import tensorflow as tf. Se tudo ocorreu bem até aqui, você não ocorrerá nenhum erro.

Testando

  1. Baixe este arquivo e salve no seu computador.
  2. Abra a linha de comando e digite jupyter notebook.
  3. Localize a pasta onde você salvou o arquivo baixado.
  4. Clique no nome do arquivo e ele abrirá em uma nova aba em seu navegador, conforme a imagem abaixo: tela do jupyter
  5. Execute cada das células com o comando SHIFT+enter ou clicando com o mouse em Run. Isso irá treinar a Regressão Linear e levará alguns segundos.
  6. Após o término, a imagem abaixo é apresentada: tela do jupyter

Considerações Finais

Os passos de execução deste tutorial foram testados com Python 3 e tudo ocorreu sem problemas. No entanto, é possível que alguém encontre alguma dificuldade ou erro no meio do caminho. Se for o caso, por favor comente a sua dificuldade ou erro neste post.