O Google disponibilizou recentemente, de maneira discreta, uma nova ferramenta voltada para a produtividade de usuários do ecossistema iOS. O aplicativo, nomeado como Google AI Edge Eloquent, chega ao mercado com a proposta de transformar a experiência de captura de áudio e a criação de anotações textuais, utilizando tecnologia de ponta em inteligência artificial para realizar transcrições automáticas sem custo para o consumidor.
O grande diferencial do software reside em sua capacidade de processamento local. Para oferecer um sistema de reconhecimento de voz altamente preciso, a Gigante das Buscas implementou um modelo de inteligência artificial baseado no Gemma. Esta tecnologia é uma derivação direta do Gemini, o modelo de IA mais avançado da empresa, porém otimizada especificamente para tarefas de processamento de linguagem natural que ocorrem diretamente no hardware do dispositivo móvel.
Funcionalidade offline e privacidade no processamento
A arquitetura do Google AI Edge Eloquent permite que ele opere de forma independente de uma conexão ativa com a internet. Essa característica possibilita que o ditado de textos e a transcrição de gravações ocorram mesmo quando o usuário está em locais sem cobertura de Wi-Fi ou dados móveis. No entanto, por questões de configuração inicial, o modo offline vem desabilitado por padrão nas definições do aplicativo, exigindo que o usuário ative a função manualmente para usufruir da independência de rede.
Quando utilizado com uma conexão ativa, o aplicativo amplia sua precisão por meio da integração com os serviços da conta Google. Ao se conectar, a inteligência artificial consegue analisar contextos específicos do usuário, extraindo informações do Gmail para identificar com maior facilidade nomes próprios, termos técnicos ou expressões recorrentes que fazem parte da rotina de quem utiliza a ferramenta.
Imagem: Divulgação
Além da automação, o Google AI Edge Eloquent oferece recursos de personalização manual. Os usuários têm a liberdade de adicionar palavras específicas, nomes de contatos ou vocabulários técnicos diretamente ao banco de dados do aplicativo. Essa função garante que, mesmo em situações de termos muito nichados, a IA consiga transcrever o áudio com a grafia correta, adaptando-se às necessidades profissionais ou pessoais de cada indivíduo.
Até o momento, o lançamento foca exclusivamente no sistema operacional da Apple, trazendo uma solução robusta para quem busca agilidade na transformação de fala em texto de maneira gratuita e segura, mantendo os dados processados sob o controle do usuário através da tecnologia local.
Com informações de Tudocelular



