Categorias
Distopia Informática Inteligência artificial Privacidade Sistema operacional Windows

Eles querem ouvir sua voz…

…mas isso não é necessariamente uma boa notícia.

2030

“O mundo de, tipo assim, ficar por aí usando mouse e digitando no teclado se tornará tão estranho [para as pessoas] quanto é hoje, para a geração Z, tipo assim, usar MS-DOS.” (tradução livre)

As palavras acima são de David Weston, vice-presidente corporativo da Microsoft na área de segurança de sistemas. Elas abrem o vídeo “Microsoft Windows 2030 Vision”, no qual ele deseja vender (entre outras coisas) a idéia de que dispositivos dotados de Inteligência Artificial e comandados por voz representam o futuro.

Segundo as estimativas do ChatGPT, entretanto, milhões de pessoas não conseguiriam e bilhões de pessoas não gostariam de usar seus dispositivos por meio de comandos de voz. As limitações seriam fisiológicas (entre 50 e 100 milhões de pessoas), ambientais (atividades em lugares ruidosos), tecnológicas (sotaques ou idiomas sem suporte, dispositivos ou conexão à Internet inadequados) e até sociais (culturas nas quais falar com máquinas não é algo bem visto). Nessa mesma “conversa” o ChatGPT revelou que “pesquisas da Microsoft, Google e Pew Research indicam que 40–60% dos adultos raramente usam comandos de voz, mesmo tendo acesso a eles.”

É claro que o executivo da Microsoft conhece essas pesquisas. Por que, então, ele tenta retratar tecnologias testadas e aprovadas (como teclado e mouse) como algo a ser ultrapassado? Por que ele está tão determinado a vender um futuro que, além de indesejado das gentes, seria tão excludente para tantas pessoas? E por que ele finge não saber que até a geração Z está usando comandos de texto (tipo assim MS-DOS) para obter respostas e gerar imagens nas diversas IAs?

A inautenticidade do argumento é tão patente que me chamou a atenção. Afinal, por que os comandos de voz se tornaram, do dia para a noite, tão importantes para a Microsoft? Fui dormir pensando nisso e acordei com uma hipótese, que fui testar com esta pergunta para o ChatGPT:

Como você compararia o treinamento das Inteligências Artificiais em três áreas distintas: texto, imagem e voz? Qual delas está mais desenvolvida, qual delas é a menos desenvolvida?

Mistério resolvido: a voz é a área menos consolidada das IAs. Elas continuam famintas por textos e imagens, mas a fala humana é sua última fronteira.

É um bom tema para um conto infanto-juvenil: a história de um monstro que se alimenta da voz humana. Que tal escrevê-lo? Só não vale usar o ChatGPT.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *