A onda de redução de preços dos grandes modelos chegou, a Tongyi Qianwen ajusta a estratégia comercial
No dia 21 de maio, a Alibaba Cloud anunciou uma redução significativa nos preços de chamada da API do modelo Tongyi Qwen. O preço de entrada do modelo principal Qwen-Long caiu de 0,02 yuan/k tokens para 0,5 yuan/milhão tokens, uma redução de até 97%. Anteriormente, no dia 9 de maio, a Alibaba Tongyi também lançou um modelo de código aberto com uma escala de parâmetros de 110 bilhões, o Qwen1.5-110B, que se destacou em vários testes de referência.
Esta combinação de "redução de preços + código aberto" tornou-se um consenso entre os fabricantes de grandes modelos globais. Esta medida ajuda a resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: o elevado custo das APIs e a baixa qualidade dos modelos de código aberto, promovendo assim o desenvolvimento abrangente das aplicações de IA.
Na verdade, várias empresas de grandes modelos lançaram recentemente produtos a preços baixos ou medidas de redução de preços. Desde maio, empresas como a Huansheng Quantitative, a Zhipu AI, a OpenAI, a Baidu e a iFlytek reduziram os preços de seus produtos de grandes modelos em diferentes graus ou os tornaram gratuitos. Essa tendência pode ser originada pelos avanços na tecnologia de inferência de grandes modelos e pela redução dos custos de inferência, proporcionando mais opções para os desenvolvedores, o que é benéfico para aumentar o uso e desenvolvimento de grandes modelos de IA.
Além de reduzir preços, a Alibaba Tongyi também lançou vários modelos de diferentes escalas para atender às necessidades de diferentes cenários. Modelos pequenos como 0,5B-14B podem ser implementados em dispositivos de borda, como smartphones e PCs; modelos grandes como 72B-110B suportam aplicações empresariais e de pesquisa; o modelo médio de 32B busca um equilíbrio entre desempenho, eficiência e uso de memória. Além disso, foram disponibilizados modelos em código aberto para campos especializados, como visual, áudio e código. Essas iniciativas oferecem suporte a uma variedade de cenários de aplicação de IA.
Com o rápido desenvolvimento da tecnologia de grandes modelos e a aceleração do processo de comercialização, espera-se que a cadeia industrial relacionada tenha novas oportunidades de desenvolvimento. As áreas a serem observadas incluem: infraestrutura de computação( como comunicação óptica, agendamento de computação, equipamentos de computação, etc.), fatores de dados( como operadores de telecomunicações, visualização de dados, etc.) e novas direções emergentes como computação em borda. No entanto, o processo de comercialização e o desenvolvimento tecnológico dos grandes modelos ainda apresentam incertezas, e esses fatores de risco também precisam de atenção contínua.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
22 Curtidas
Recompensa
22
3
Repostar
Compartilhar
Comentário
0/400
OnChainDetective
· 07-17 13:25
Ngl, esta Gota de preço parece suspeita... manipulação de mercado típica para eliminar a concorrência, a verdade seja dita.
Ver originalResponder0
CryptoAdventurer
· 07-14 18:03
Reduzir o preço vai torná-lo melhor? Ri-me até às lágrimas.
A guerra dos grandes modelos se intensifica: o modelo Código aberto de 110 bilhões de parâmetros da Tongyi Qianwen tem uma grande redução de preço.
A onda de redução de preços dos grandes modelos chegou, a Tongyi Qianwen ajusta a estratégia comercial
No dia 21 de maio, a Alibaba Cloud anunciou uma redução significativa nos preços de chamada da API do modelo Tongyi Qwen. O preço de entrada do modelo principal Qwen-Long caiu de 0,02 yuan/k tokens para 0,5 yuan/milhão tokens, uma redução de até 97%. Anteriormente, no dia 9 de maio, a Alibaba Tongyi também lançou um modelo de código aberto com uma escala de parâmetros de 110 bilhões, o Qwen1.5-110B, que se destacou em vários testes de referência.
Esta combinação de "redução de preços + código aberto" tornou-se um consenso entre os fabricantes de grandes modelos globais. Esta medida ajuda a resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: o elevado custo das APIs e a baixa qualidade dos modelos de código aberto, promovendo assim o desenvolvimento abrangente das aplicações de IA.
Na verdade, várias empresas de grandes modelos lançaram recentemente produtos a preços baixos ou medidas de redução de preços. Desde maio, empresas como a Huansheng Quantitative, a Zhipu AI, a OpenAI, a Baidu e a iFlytek reduziram os preços de seus produtos de grandes modelos em diferentes graus ou os tornaram gratuitos. Essa tendência pode ser originada pelos avanços na tecnologia de inferência de grandes modelos e pela redução dos custos de inferência, proporcionando mais opções para os desenvolvedores, o que é benéfico para aumentar o uso e desenvolvimento de grandes modelos de IA.
Além de reduzir preços, a Alibaba Tongyi também lançou vários modelos de diferentes escalas para atender às necessidades de diferentes cenários. Modelos pequenos como 0,5B-14B podem ser implementados em dispositivos de borda, como smartphones e PCs; modelos grandes como 72B-110B suportam aplicações empresariais e de pesquisa; o modelo médio de 32B busca um equilíbrio entre desempenho, eficiência e uso de memória. Além disso, foram disponibilizados modelos em código aberto para campos especializados, como visual, áudio e código. Essas iniciativas oferecem suporte a uma variedade de cenários de aplicação de IA.
Com o rápido desenvolvimento da tecnologia de grandes modelos e a aceleração do processo de comercialização, espera-se que a cadeia industrial relacionada tenha novas oportunidades de desenvolvimento. As áreas a serem observadas incluem: infraestrutura de computação( como comunicação óptica, agendamento de computação, equipamentos de computação, etc.), fatores de dados( como operadores de telecomunicações, visualização de dados, etc.) e novas direções emergentes como computação em borda. No entanto, o processo de comercialização e o desenvolvimento tecnológico dos grandes modelos ainda apresentam incertezas, e esses fatores de risco também precisam de atenção contínua.