Ajit R Patil*, Kamlesh Patil et Sonal Patil
Au cours des dernières décennies, avec l'avènement d'Internet et des médias sociaux, une communauté mondiale s'est formée et son application directe pour une communauté sous-développée. L'apprentissage cognitif est l'un des domaines de recherche les plus recherchés qui cherche à améliorer l'interaction homme-machine. Cet article présente une application pour la traduction de la parole à la parole en utilisant une combinaison de services cloud et de modèles d'apprentissage automatique de pointe. Pour la traduction de la parole à la parole, une architecture en trois phases est étudiée qui contient la parole en texte basée sur le cloud, la traduction de la parole, l'extraction de jetons, le modèle de synthèse de la parole basé sur des réseaux neuronaux profonds et un vocodeur également basé sur des réseaux neuronaux profonds. Notre objectif principal dans cette étude est de créer un système robuste pour la traduction de la parole à la parole et l'application de ce système.