A DeepL, empresa reconhecida pelas ferramentas de tradução de texto, apresentou nesta quinta-feira (16) um conjunto de soluções de voz-a-voz que pretende atender reuniões virtuais, conversas em dispositivos móveis e web, além de interações em grupo, como treinamentos e workshops.
O novo pacote inclui complementos para plataformas como Zoom e Microsoft Teams. Nessas integrações, participantes podem ouvir a fala traduzida em tempo real ou acompanhar a transcrição traduzida na tela. O programa está em fase de acesso antecipado, e organizações interessadas podem entrar em uma lista de espera.
API e personalização
Além das aplicações prontas, a companhia disponibilizou uma API que permite a desenvolvedores e empresas incorporar a tecnologia da DeepL em casos específicos, como centrais de atendimento. Segundo o diretor-executivo Jarek Kutylowski, o sistema aprende e adapta vocabulários personalizados, contemplando termos de setores específicos, nomes de empresas e de colaboradores.
Desafios técnicos
Kutylowski explicou que o principal obstáculo na tradução de voz em tempo real é equilibrar latência — o intervalo entre a fala original e o áudio traduzido — e precisão. Atualmente, o processo envolve converter a fala em texto, realizar a tradução textual e, em seguida, transformar novamente em fala. A meta futura é criar um modelo ponta a ponta que elimine a etapa textual para reduzir ainda mais o atraso.
Uso em conversas presenciais e remotas
Para diálogos presenciais ou online via navegador, a DeepL lançou aplicativos móveis e web que oferecem tradução instantânea. Em ambientes de treinamento, os participantes podem ingressar na conversa por meio de um código QR e receber o conteúdo no idioma escolhido.

Imagem: Internet
Cenário competitivo
O mercado de tradução de voz já conta com concorrentes financiados. A Sanas captou US$ 65 milhões no ano passado para uma tecnologia que ajusta o sotaque de atendentes em tempo real. A Dubai-based Camb.AI foca em síntese e tradução de voz para mídias e entretenimento, enquanto a Palabra, apoiada pela Seven Seven Six de Alexis Ohanian, desenvolve um motor de tradução que busca preservar o timbre original do locutor.
Para Kutylowski, a inteligência artificial deve redefinir o atendimento ao cliente nos próximos anos, e uma camada de tradução eficiente permitirá que empresas ofereçam suporte em idiomas onde é difícil e caro encontrar profissionais qualificados.
Com informações de TechCrunch







