No passado, todos se esforçavam para migrar para a nuvem, mas o custo de poder de computação por unidade durante a fase de inferência fez com que muitas equipes percebessem: a inferência de IA em longo prazo e em grande escala consome dinheiro muito rapidamente na nuvem. Aplicações nativas de IA são mais adequadas para transferir as tarefas críticas de inferência para os data centers locais, o que reduz a latência e economiza largura de banda e custos de aluguel na nuvem.



A competição por memória é uma característica típica do início do treinamento em aprendizado profundo ( quem tem mais memória de vídeo ganha ), mas hoje:

O limite de throughput de dados armazenados na GPU afeta diretamente o QPS de inferência.

A velocidade de interação entre GPU e CPU/cartões de aceleração é o limite do desempenho de pipeline.

O consumo de energia do cluster AI em um único gabinete pode chegar a dezenas de quilowatts, e um design PD inadequado pode travar diretamente a escala de implantação do Poder de computação.

Se o layout do centro de dados ainda estiver preso no paradigma de design tradicional de Web/banco de dados de 2015, ele vai falhar diretamente sob a carga de trabalho de IA.

Veja as nossas percepções:
20 Especialistas em Tecnologia sobre as Tendências Emergentes de Hardware que as Empresas Devem Observar via @forbes
VIA1.78%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)