Era para ser uma conversa sobre Inteligência Artificial e Experiência do Cliente na América Latina. Mas no meio do papo, a consultora da Casa Branca para Inteligência Artificial e fundadora da Defined.ai, Daniela Braga, simplesmente deu a receita para quem quer construir uma tecnologia de reconhecimento de voz e linguagem natural —mais conhecida por IA conversacional. Pareceu um bom guia para empresas que querem saber por onde começar.
Anote e veja se consegue fazer em casa:
Ingredientes:
– Módulo de reconhecimento de fala
– Módulo de entendimento de linguagem natural
– Módulo de resposta em linguagem natural
– Módulo de síntese de voz
– Base de Dados (segundo Braga, onde moram 80% do esforço e dificuldade para criar uma IA)
Modo de preparo:
1. Comece com um módulo de reconhecimento de fala que entende a voz e a transforma em texto, como a Siri ou o Google Assistant.
2. Em seguida, utilize um módulo de entendimento de linguagem natural que interpreta o texto e entende a intenção do usuário.
3. O terceiro módulo é responsável por gerar uma resposta em linguagem natural, que pode ser uma resposta pré-programada ou gerada de forma dinâmica.
4. Por fim, utilize um módulo de síntese de voz que converte a resposta em linguagem natural em uma voz sintética.
5. Todos esses módulos requerem dados para funcionar, o que é a parte mais difícil do processo.
6. Empresas especializadas em lidar com dados, como a Defined.ai, podem ajudar muito nessa etapa.
7. O resto do trabalho pode ser feito por uma equipe relativamente pequena, de 10 a 20 pessoas, dependendo do domínio de aplicação.
Dica: É importante contar com engenheiros e cientistas especializados em reconhecimento de fala e entendimento de linguagem natural para lidar com as complexidades dessas tecnologias.
Note que, apesar do esforço, não estamos falando de uma equipe de centenas de engenheiros —como as que populam times de bancos digitais ou empresas de comércio eletrônico. Isso me chamou bastante atenção, pois torna o investimento relativamente acessível a empresas de médio porte que vão bem de caixa ou até startups.
Dependência tecnológica
Daniela Braga, pioneira em tecnologia de IA do Fórum Econômico Mundial, falou na WebSummit sobre os desafios da Inteligência Artificial conversacional no Brasil e na América Latina em geral.
Segundo ela, o driver econômico ainda torna os países da América Latina e também da Europa dependentes em demasia de tecnologia americana. O foco na IA conversacional, que é a substituição do antigo sistema de Resposta de Voz Interativa (IVR), é principalmente impulsionado pelo ranking do PIB de um país, com América do Norte e China sendo os principais desenvolvedores.
A IA conversacional é a nova tecnologia que pode interagir com clientes como se estivessem interagindo com seres humanos, sem a necessidade de pressionar botões ou seguir uma árvore de decisão. Braga enfatizou que o dialeto de cada região e país é crucial para a precisão e eficácia da tecnologia. No entanto, o desenvolvimento da IA conversacional para línguas com baixos recursos digitais ainda está atrasado. Braga acredita que cada país deve ser dono do desenvolvimento de tecnologias de IA e se tornar menos dependente da tecnologia americana.
Ética na obtenção de dados
A Defined.ai, a maior plataforma de dados de treinamento para IA, tem como objetivo abordar esse problema fornecendo dados eticamente obtidos e anonimizados para o desenvolvimento de IA. Braga destacou a importância do sourcing ético de dados de treinamento, incluindo consentimento, representação de idade, representação demográfica e preservação de direitos autorais. A empresa vem construindo uma plataforma de dados de treinamento há sete anos e expandiu para incluir dados de voz para texto, imagem, vídeo e tabelas.
A Defined.ai recebeu um investimento de €34,5 milhões do governo português para um consórcio que inclui universidades e empresas. A empresa está construindo IA conversacional para lidar com línguas com baixo recurso digital e bibliotecas no país. Braga acredita que o sourcing ético de dados de treinamento é um aspecto crucial do desenvolvimento de IA que pode ter um impacto significativo na precisão e eficácia da tecnologia.
Em resumo, Braga destacou a importância da IA conversacional, a necessidade de cada país ser dono do desenvolvimento de tecnologias de IA e a importância do sourcing ético de dados de treinamento.