Teste
Entrar
Criar conta
Tópicos
Biblioteca
Chat
Gema 4
Capacidades
Descreve que os modelos possuem reasoning; os maiores processam texto e imagem, enquanto os menores também processam áudio e vídeo.
Comparação com concorrentes
Levanta a comparação entre Gema 4 e Qwen 3.5, indicando que ainda não é possível afirmar qual é melhor sem mais testes.
Comparação de desempenho
Conclui que o modelo 26B pode ser preferível se a diferença de qualidade não for grande, por ser muito mais rápido.
Comparação de qualidade
Observa empate técnico no teste de personagens, com leve vantagem para o modelo 26B por cometer menos erros na identificação.
Comparação entre variantes
Explica a diferença entre modelos densos e o modelo 26B mixture of experts, incluindo observações sobre parâmetros ativos e encoder de vídeo.
Conclui que o modelo 31B foi ligeiramente superior em qualidade geral, enquanto o 26B se destacou pela velocidade.
Configuração técnica
Compara janela de contexto entre modelos menores com 128 mil tokens e modelos maiores com 256 mil tokens, além de citar uso para código e tool calling.
Informa que os testes estão sendo executados com versões GGUF usando llama.cpp, e não versões MLX.
Correção de código
Ajusta manualmente erro de acesso ao 3JS no jogo gerado pelo modelo 31B e solicita correção adicional de variável.
Identifica problema de gravidade invertida no jogo gerado pelo modelo 26B, onde os elementos sobem e o jogo não fica jogável.
Desempenho
Mede a velocidade do modelo 31B em cerca de 18 tokens por segundo durante resposta com reasoning.
Mede a velocidade do modelo 26B em cerca de 66,92 tokens por segundo, indicando desempenho mais de três vezes superior ao 31B.
Execução
Informa que está rodando localmente as versões instruct dos modelos 31B e 26B para testes práticos.
Licenciamento
Explica que os modelos usam licença Apache 2.0, permitindo uso comercial de forma permissiva.
Teste de código
Solicita a criação de um site para empresa de aluguel de bicicletas com funcionalidade interativa diferenciada.
Avalia o site gerado pelo modelo 26B e considera o resultado funcional, porém abaixo da expectativa em design e interatividade.
Avalia o site gerado pelo modelo 31B e considera o resultado melhor, com calculadora de impacto ecológico e mensagens dinâmicas por faixa de distância.
Solicita a criação de um clone de Angry Birds usando 3JS para comparar capacidade de geração de código mais complexa.
Testa a versão corrigida do jogo gerado pelo modelo 31B e observa funcionamento surpreendentemente bom da física, apesar de gráficos simples e ausência de condição clara de vitória.
Testa a versão do jogo gerado pelo modelo 26B e conclui que o resultado ficou instável, com comportamento incorreto da bola e jogabilidade ruim.
Teste de visão
Testa reconhecimento de local em imagem e ambos os modelos identificam corretamente o Rio de Janeiro com referências ao Pão de Açúcar e Baía de Guanabara.
Testa identificação de local urbano e os modelos apontam corretamente a Rua 25 de Março, em São Paulo.
Avalia nomeação de personagens em imagem e compara acertos e erros entre os modelos 31B e 26B.
Versões do modelo
Diferencia versões base para treinamento e versões instruct para conversa e execução de tarefas.
Visão geral
Apresenta a família Gema 4 com quatro variantes: 2B, 4B, 26B mixture of experts e 31B denso, destacando foco do vídeo nos modelos maiores.
Em breve