Eu vejo as seguintes diferenças apresentadas abaixo. Entretanto, é apenas um ponto de vista. Talvez ao longo do tempo as diferenças diminuam.
Escopo: Aprendizagem de máquina usa modelos estatísticos, mas também usa outros modelos, como programação dinâmica, aprendizagem por reforço e técnicas que vieram da inteligência artificial (algoritmos de busca, deep learning que é muito mais sobre representação de conhecimento que estatística) e otimização. Estatística também cobre áreas que não estão relacionadas diretamente com aprendizagem de máquinas como planejamento de experimentos e amostragem.
Ponto de vista: A estatística é geralmente preocupada com as propriedades dos estimadores (comportamento de viés, assintótica) e aprendizado de máquina está preocupado principalmente com a solução dos problemas do mundo real e, particularmente, previsão e reconhecimento de padrões.
Área de pesquisa: Enquanto estatística pode ser vista como uma subárea da Matemática Aplicada, Aprendizagem de Máquinas pode ser vista como uma subárea da ciência da computação. Isso é uma diferença relevante, pois implica em interesses e habilidades diferentes. Por exemplo, trabalhos importantes e seminais de estatística em geral são mais formais, enquanto trabalhos de aprendizagem de máquinas geralmente preocupam-se em explorar a escalabilidade ou a melhor representação de dados do problema lidando com temas básicos da ciência da computação que incluem complexidade computacional, estruturas abstratas de dados e memória necessária para rodar o problema.
Tratamento de dados: Estatística usualmente assume que existe uma distribuição por detrás dos dados (isso é necessário para formular testes de hipóteses), aprendizagem de máquinas assume que os dados estão apenas "lá" (disponíveis) e usam algoritmos para estudar relações entre as variáveis
Programação computacional: Enquanto as pessoas que trabalham com estatística geralmente tem uma preferência por R (ou SAS, Stata, EVIEWS), as pessoas que trabalham com a aprendizagem de máquina geralmente escolhem Python (ou outra linguagem de programação estruturada)
Apresentação dos resultados: Estatísticos normalmente divulgam resultados importantes em jornais e a comunidade de aprendizagem de máquinas divulga muitas vezes em eventos científicos.
Observações finais
Obviamente, como o Alexandre Ywata (meu amigo e co-autor) menciona em outra resposta a essa pergunta, existem áreas da estatística que se aproximam mais de machine learning e uma delas é aquela conhecida como statistical learning. Uma forma de confirmar essa opinião é dar uma olhada nas principais referências da área e compara-las:
Machine learning:
Pattern Recognition and Machine Learning - Christopher Bishop
Deep Learning book - Ian Goodfellow, Yoshua Bengio and Aaron Courville
Statistical Learning:
The Elements of Statistical Learning: Data Mining, Inference, and Prediction - Trevor Hastie and Robert Tibshirani
An Introduction to Statistical Learning: with Applications in R - Gareth James, Daniela Witten, Trevor Hastie e Robert Tibshirani