A Mistral AI, uma empresa promissora no campo da inteligência artificial, acaba de lançar seu mais recente modelo, o Mistral Large 2 (ML2). Esse novo sistema de linguagem, apesar de ser menor que os gigantes da tecnologia, alegadamente rivaliza com os principais modelos da indústria, como o OpenAI, Meta e Anthropic.
Principais Destaques
– O ML2 é capaz de processar uma janela de contexto de até 128.000 tokens, o que lhe confere uma “memória” aprimorada e a capacidade de lidar com conversas mais longas.
– O modelo suporta dezenas de idiomas e mais de 80 linguagens de programação, tornando-o uma ferramenta versátil para desenvolvedores e empresas em todo o mundo.
– De acordo com os testes da Mistral, o ML2 tem um desempenho competitivo em comparação com os melhores modelos do mercado em uma variedade de tarefas de linguagem, codificação e matemática.
Eficiência e Desempenho
O que realmente diferencia o ML2 é sua capacidade de alcançar alto desempenho com recursos significativamente menores do que seus rivais. Com apenas 123 bilhões de parâmetros, o ML2 é menos de um terço do tamanho do maior modelo da Meta e aproximadamente um décimo do tamanho do GPT-4.
Essa eficiência tem implicações importantes para a implantação e aplicações comerciais. Com apenas 246GB de memória em precisão de 16 bits, o ML2 pode ser facilmente implantado em um servidor com quatro a oito GPUs, sem a necessidade de quantização, algo que não é necessariamente viável com modelos maiores como o GPT-4 ou o Llama 3.1 405B.
Melhorias-Chave
A Mistral priorizou o combate às “alucinações”, um problema comum em que os modelos de IA geram informações convincentes, mas imprecisas. Eles afirmam que o ML2 foi refinado para ser mais “cauteloso e discernidor” em suas respostas e melhor em reconhecer quando não possui informações suficientes para responder a uma consulta.
Além disso, o ML2 foi projetado para se destacar no seguimento de instruções complexas, especialmente em conversas mais longas. Essa melhoria nas capacidades de seguir instruções pode tornar o modelo mais versátil e amigável ao usuário em várias aplicações.
Conclusão
À medida que a corrida pela IA se intensifica, o Mistral Large 2 representa um passo significativo em direção ao equilíbrio entre poder, eficiência e praticidade. Embora ainda reste saber se ele pode realmente desafiar o domínio dos gigantes da tecnologia, seu lançamento é certamente uma adição emocionante ao campo dos modelos de linguagem de grande porte.