Pequim, 15 de agosto de 2025 — A startup chinesa de inteligência artificial DeepSeek adiou a apresentação do seu modelo de linguagem R2 depois de enfrentar falhas técnicas ao tentar treiná-lo com unidades gráficas Ascend, fornecidas pela Huawei Technologies.
Impasses no treino do modelo
De acordo com três pessoas familiarizadas com o processo, a DeepSeek foi incentivada a substituir as placas da Nvidia pelos chips Ascend na sequência das restrições impostas pelos Estados Unidos à exportação do processador H20 para a China, em vigor desde abril. O objetivo era reduzir a dependência de tecnologia norte-americana, mas a mudança resultou em instabilidade durante o treino do modelo.
Fontes indicam que, depois de diversas tentativas sem sucesso, a empresa voltou a utilizar o hardware da Nvidia para a fase de treino, mantendo os Ascend apenas para inferência — etapa em que o modelo já construído responde a solicitações de utilizadores ou alimenta aplicações como assistentes virtuais e geradores de imagem.
Calendário afetado e perda de vantagem competitiva
A DeepSeek planeava lançar o R2 em maio, mas o cronograma foi revisto. Enquanto isso, concorrentes norte-americanos apresentaram modelos que superam o desempenho do R1, a versão anterior da empresa chinesa, treinada a um custo declarado de poucos milhões de dólares.
Internamente, o fundador Liang Wenfeng manifestou descontentamento com o ritmo de desenvolvimento e determinou ajustes adicionais para recuperar terreno. Veículos de comunicação locais apontam que o anúncio do R2 pode ocorrer nas próximas semanas, embora não haja data confirmada.

Contexto da indústria chinesa de chips
O episódio evidencia desafios na tentativa da China de alcançar autonomia tecnológica. Mesmo após a celebração de um acordo comercial que permite retomar compras limitadas do H20, as autoridades exigem que cada pedido de chips estrangeiros seja devidamente justificado, mantendo a pressão para adoção de soluções nacionais como as da Huawei e da Cambricon.
No mês passado, a Huawei apresentou o servidor CloudMatrix 384, equipado com 384 GPUs Ascend 910C. A companhia afirma que o sistema ultrapassa o rival NVL72 da Nvidia em petaflops, memória e largura de banda, embora consuma mais energia. Especialistas ocidentais reconhecem avanços, mas apontam problemas de estabilidade e comunicação entre chips, fatores que também afetaram o projeto da DeepSeek.
Engenheiros da Huawei foram deslocados para ajudar na resolução dos obstáculos, conseguindo avanços limitados na inferência. Analistas avaliam que a maturação do ecossistema Ascend é questão de tempo, mas, por ora, a indisponibilidade de uma solução robusta de treino continua a atrasar iniciativas como o R2.