Como fazer o MP3 ser reconhecido para criar movimento de boca?

Eu estou com um projeto que quero fazer uma cabeça tosca de robo reconhecer o mp3 para simular o movimento da mandibula apenas, que peças preciso? O que devo fazer? preciso muito de ajuda