5g nova chamada não é simples: não só pode ouvir, mas também entender

Em 12 de abril, a China Mobile realizou uma conferência de produtos "5g nova chamada, prever o novo futuro" no Salão de patinação de velocidade do Centro Nacional de Treinamento de Inverno Shougang Park, lançou oficialmente 5g novos produtos de chamada e anunciou que alguns terminais apoiaram 5g vonr ultra clear call business em todo o país para criar uma nova mídia com visualização, multimídia, alta percepção e interação completa.

cobrirá todos os novos modelos

Na conferência de imprensa, Shou Jianguo, gerente geral do Departamento de operação do mercado móvel da China, introduziu que, em comparação com chamadas de voz e vídeo na Internet, 5g novas chamadas podem realizar chamadas de vídeo de alta definição baseadas na rede China Mobile 5g, com qualidade de chamada estável, quase nenhum atraso e chamadas recebidas ininterruptas. Ao mesmo tempo, combinado com a tecnologia AI, 5g nova chamada pode realizar as funções de tradução em tempo real chinês e inglês, voz para texto e assim por diante. Além disso, também fornece compartilhamento de tela, cooperação remota e outras funções características. Shoujianguo também disse que, atualmente, as novas funções de chamada de 5g estão sendo adaptadas nos principais terminais móveis.

A partir da função da chamada nova de 5g, espera-se que se torne uma "aplicação assassina de 5g". Por trás deste negócio amplamente favorecido pela indústria, a rede 5g é a base central, a interação de mídia é uma expansão importante da função, e o suporte do terminal é a garantia.

não só ouvir, mas também entender

5g nova chamada permite que ambos os lados da chamada realizem voz para texto, e também pode ser traduzida em tempo real na tela, para que o chamador possa "entender" o conteúdo da chamada enquanto ouve. Por trás de tecnologias aparentemente compreensíveis, há um grande número de tecnologias negras, como reconhecimento de fala, compreensão oral, interpretação simultânea de fala, etc., que não podem ser alcançadas sem o acúmulo profundo da tecnologia de fala AI.

A tecnologia negra por trás destes vem principalmente da empresa principal Iflytek Co.Ltd(002230) de voz inteligente e inteligência artificial. Portanto, Iflytek Co.Ltd(002230) também se tornou o parceiro oficial da nova chamada 5g da China Mobile.

É relatado que Iflytek Co.Ltd(002230) é o fornecedor exclusivo de conversão e tradução automática de voz oficial para os Jogos Olímpicos de Inverno de Pequim 2022 e Jogos Paralímpicos de Inverno. As estatísticas mostram que a plataforma multilíngue de serviços de voz e idiomas para o cenário dos Jogos Olímpicos de Inverno adota a tecnologia de "conversão automática de voz e tradução" do Iflytek Co.Ltd(002230) , e suporta 60 síntese de fala de idiomas, 69 reconhecimento de fala de idiomas, 168 tradução automática de idiomas e 6 compreensão interativa de idiomas. Entre eles, a precisão da tradução de idiomas chave atingiu 95% e o tempo médio de resposta de cada tradução de frase não é superior a 0,5 segundos.

experiência oral é mais suave

Há um grande número de expressões coloquiais na cena da chamada. A expressão coloquial é diferente do texto escrito padrão. Geralmente, a expressão de conteúdo não atende às normas gramaticais, as partículas modais são muito pesadas e a repetição é redundante, o que faz com que a tradução literal apareça traços óbvios de "tradução automática", e impõe requisitos mais elevados para a aplicação da tradução automática na cena da chamada.

De acordo com o diretor técnico de Iflytek Co.Ltd(002230) , três medidas foram tomadas para otimizar a cena oral de 5g novas chamadas: primeiro, a cooperação humano-computador marca dados orais comuns e complementa treinamento bilíngue oral; Em segundo lugar, utiliza-se sistematicamente o método de formação não supervisionada/fracamente supervisionada, com base num grande número de dados monolíngues da língua de origem e de destino da expressão oral, os algoritmos de auto-treino e retrotradução são utilizados para reforçar o modelo de tradução e o modelo de linguagem, de modo a realizar o treino melhorado das características da expressão oral; Em terceiro lugar, para a fase de pós-processamento de reconhecimento de fala, os módulos de partículas modais suaves e regulares são projetados para tornar a expressão falada escrita tanto quanto possível, de modo a reduzir os "traços" de torneamento da máquina e ajudar os usuários a entender melhor.

A tecnologia de IA por trás da nova chamada de 5g da China Mobile vem da profunda acumulação de aderir à inovação independente da tecnologia de origem no passado Iflytek Co.Ltd(002230) 23 anos Iflytek Co.Ltd(002230) é líder internacional em reconhecimento de fala de inteligência artificial, tradução automática, compreensão semântica e outros campos técnicos, e ganhou o campeonato em muitas competições técnicas internacionais.

- Advertisment -