A Linux Foundation faz parceria com a Microsoft e a Target para criar padrões para tecnologia de voz. Além dessas, a parceria se extende à Veritone. O objetivo é criar a Open Voice Network, uma iniciativa projetada para “priorizar confiança e padrões” em tecnologia focada em voz.
Jon Stine, diretor executivo da Open Voice Network, disse que o rápido crescimento da disponibilidade e adoção da assistência de voz em todo o mundo – e o futuro potencial da voz como interface e fonte de dados em um mundo movido por inteligência artificial – torna importante que certos padrões sejam desenvolvidos comunitariamente.
Dispositivos e aplicativos estão cada vez mais incorporando ativação de voz e funções de navegação, e Mike Dolan, vice-presidente sênior da Linux Foundation, disse que a rede era uma “resposta proativa para combater falsificações profundas em tecnologia de voz baseada em IA”.
Espera-se que a voz seja uma interface primária para o mundo digital, conectando usuários a bilhões de sites, ambientes inteligentes e bots de IA. Ela já está cada vez mais sendo usada além de alto-falantes inteligentes para incluir aplicativos em automóveis, smartphones e dispositivos eletrônicos domésticos de todos os tipos . A chave para permitir a adoção corporativa desses recursos e do conforto e familiaridade do consumidor é a implementação de padrões abertos, disse Dolan, acrescentando que a organização estava entusiasmada em trazê-lo sob o modelo de governança aberta da Linux Foundation para expandir a comunidade e pavimentar um caminho a seguir.
A organização sem fins lucrativos disse que a associação de código aberto se dedicará a promover padrões abertos que apóiem a adoção de sistemas de assistência por voz habilitados para IA.
Linux Foundation faz parceria com a Microsoft e a Target para criar padrões para tecnologia de voz
Além da Target, Microsoft e Veritone, a Linux Foundation disse que está trabalhando com o Schwarz Gruppe, Wegmans Food Markets e Deutsche Telekom.
Ryan Steelberg, presidente e cofundador da Veritone, disse que a autorregulamentação da criação e uso de conteúdo de voz sintética, para proteger o proprietário da voz e também estabelecer a confiança do consumidor, é “fundamental”.
“Ter uma rede aberta por meio da Open Voice Network para educação e padrões globais é a única maneira de acompanhar o ritmo de inovação e a demanda por marketing de influência”, disse Steelberg.
Milhares de empresas e organizações criaram sistemas de assistente de voz independentes das plataformas de voz de uso geral atuais como uma forma de agilizar os serviços e melhorar a experiência do usuário.
Representantes da Linux Foundation disseram que a Open Voice Network apoiará as plataformas “fornecendo padrões e diretrizes de uso para sistemas de assistente de voz que sejam confiáveis, inclusivos e abertos”. A organização também fornecerá orientação sobre proteção específica de voz da privacidade do usuário e segurança de dados, bem como maneiras de tornar os assistentes de voz interoperáveis entre plataformas.
“Falar é humano, e a voz está se tornando rapidamente a principal modalidade de interação entre os usuários e seus dispositivos e serviços em casa e no trabalho”, disse Ali Dalloul, gerente geral do Microsoft Azure.
Mais tecnologia empregada
A Linux Foundation comparou o esforço aos padrões abertos que foram introduzidos nos primeiros dias da Internet, observando que essas iniciativas ajudaram a criar maneiras uniformes para os sites se conectarem e trocarem informações.
Os assistentes de voz agora dependem de uma variedade de tecnologias, incluindo reconhecimento automático de fala, processamento de linguagem natural, gerenciamento de diálogo avançado e aprendizado de máquina.
Steelberg acrescentou que, em cinco anos, as tecnologias e interfaces de voz serão totalmente integradas à maioria dos aplicativos, dispositivos e fluxos de trabalho digitais. À medida que essa proliferação e adoção de voz aumentam, ele observou que é imperativo que organizações como a Open Voice Network e outros provedores e desenvolvedores de tecnologia de voz participantes continuem a se manter diligentes na proteção dos dados e do consumidor, bem como proteger a marca registrada, direitos autorais e usos de vozes das pessoas.
Surgimento
A tecnologia de voz começou a surgir por volta de 2011 com a introdução do Siri para usuários do iPhone, de acordo com Steelberg. Agora, ele disse que 1 em cada 4 adultos nos EUA possui algum tipo de alto-falante inteligente e estudos mostraram que, nos próximos dois anos, quase todos os usuários de smartphones usarão algum tipo de assistente de voz.
Stine acrescentou que os dados de janeiro mostram que há cerca de 3 bilhões de agentes conversacionais ativos em todo o mundo e o número deve saltar para 8,4 bilhões até 2024.
“O número de dispositivos IoT, como termostatos inteligentes, eletrodomésticos e alto-falantes estão dando aos assistentes de voz mais utilidade na vida de um usuário conectado”, disse Steelberg.
Via ZDNet