Mesma equipe
VerifiedAmbos os modelos são desenvolvidos pela Divisão de Inovação ATH do Alibaba (Future Life Lab sob o Grupo Taotian)
O Happy Oyster é o simulador de mundo 3D do Alibaba para ambientes interativos, enquanto o Happy Horse é seu modelo de vídeo 2D irmão, que liderou os rankings globais de geração de texto para vídeo e imagem para vídeo.

Key facts
Ambos os modelos são desenvolvidos pela Divisão de Inovação ATH do Alibaba (Future Life Lab sob o Grupo Taotian)
Classificado em 1º lugar na Artificial Analysis para texto para vídeo (Elo 1.389) e imagem para vídeo (Elo 1.416)
Arquitetura Transfusion com Transformer unificado de 40 camadas, redução de ruído (denoising) conjunta de áudio e vídeo em uma única passagem
O Happy Oyster produz mundos 3D interativos; o Happy Horse produz clipes de vídeo 2D
O Happy Oyster e o Happy Horse são modelos irmãos da mesma equipe do Alibaba. Entender o relacionamento entre eles é fundamental para compreender a estratégia de IA do Alibaba: o Happy Horse domina a geração de vídeo 2D, e o Happy Oyster estende a tecnologia da mesma equipe para mundos 3D interativos.
Ambos os modelos vêm da equipe do Future Life Lab no Grupo Taotian do Alibaba, parte da Divisão de Inovação ATH. A equipe é liderada por Zhang Di, ex-VP da Kuaishou e ex-chefe da tecnologia Kling AI. Esta é a mesma equipe que transformou o Kling em líder de mercado antes de migrar para o Alibaba.
O Happy Horse apareceu na Artificial Analysis por volta de 7 de abril de 2026, sem identificar seu criador. Ele subiu para a 1ª posição nos rankings de texto para vídeo e imagem para vídeo antes de o Alibaba confirmar a autoria em 10 de abril. O Happy Oyster foi anunciado em 16 de abril de 2026 como a contraparte 3D.
| Recurso | Happy Oyster | Happy Horse | |---|---|---| | Tipo de saída | Mundos 3D interativos | Clipes de vídeo 2D | | Dimensão | 3D (explorável) | 2D (visualizável) | | Modos principais | Direção + Wandering | Texto para vídeo, imagem para vídeo | | Áudio | Co-geração nativa | Geração conjunta de áudio e vídeo em uma única passagem | | Arquitetura | Multimodal nativa | Transfusion (Transformer unificado de 40 camadas) | | Ranking de benchmark | Sem pontuações públicas | 1º em texto para vídeo (Elo 1.389), 1º em imagem para vídeo (Elo 1.416) | | Interatividade | Adaptação de cena em tempo real | Reprodução linear | | Acesso | Acesso antecipado limitado | API planejada para 30 de abril; código aberto em breve | | Uso principal | Jogos, RV, simulação | Cinema, redes sociais, marketing |
O Happy Horse é atualmente o modelo de geração de vídeo mais bem classificado globalmente. Sua pontuação Elo de 1.389 para texto para vídeo superou o Seedance 2.0 por quase 115 pontos. Em imagem para vídeo, ele estabeleceu um novo recorde com um Elo de 1.416. Essas não são lideranças marginais; elas representam uma lacuna significativa sobre todos os concorrentes.
O modelo utiliza uma arquitetura Transfusion com um Transformer unificado de 40 camadas. Tokens de texto, latentes de imagem de referência e tokens de áudio e vídeo com ruído são processados juntos (denoised) dentro de uma única sequência de tokens. As 4 primeiras e as 4 últimas camadas usam projeções específicas de modalidade, enquanto as 32 camadas intermediárias compartilham parâmetros entre todas as modalidades. Ele gera vídeo e áudio juntos em uma única passagem.
O Happy Oyster leva os recursos de geração da equipe ATH para a terceira dimensão. Em vez de produzir um vídeo plano que você assiste, ele cria um mundo no qual você entra. O modo de Direção oferece aos criadores controle sobre a construção da cena, enquanto o modo Wandering permite a exploração livre de ambientes gerados.
A transição da geração passiva para a simulação ativa é como o Alibaba descreve esse salto. Para aplicações em que os usuários precisam interagir com o conteúdo gerado, incluindo prototipagem de jogos, experiências de RV, visualização arquitetônica e simulações de treinamento, mundos 3D são categoricamente mais úteis do que clipes de vídeo.
Esses modelos não estão competindo entre si. Eles representam duas camadas da pilha de IA generativa do Alibaba:
Um estúdio de jogos pode usar o Happy Oyster para gerar ambientes exploráveis e o Happy Horse para criar trailers cinematográficos para o mesmo projeto. A equipe ATH compartilhada e as prováveis semelhanças arquitetônicas sugerem que uma integração mais profunda entre os dois modelos poderá surgir à medida que ambos amadurecerem.
A API do Happy Horse está agendada para 30 de abril de 2026, com um lançamento completo de código aberto a seguir. O Happy Oyster está atualmente em acesso antecipado limitado, sem cronograma público para API. Se você precisa começar a gerar conteúdo agora, o Happy Horse é a opção mais próxima.
Para avaliar ambos os modelos como parte de um fluxo de trabalho de IA mais amplo, o Elser.ai fornece ferramentas de comparação entre plataformas de vídeo e 3D. Leia O que é o Happy Oyster? para uma análise completa do modelo 3D, ou veja como ele se compara ao seu concorrente externo mais direto, o HY-World 2.0.
Mixed signal
Os benchmarks do Happy Horse são verificados. O Happy Oyster está em acesso antecipado com dados públicos limitados. Ambos vêm da mesma equipe ATH do Alibaba.
Readers should expect careful wording here because public reporting confirms the topic, while some product details still need cautious treatment.
Ferramenta recomendada
Ignore a espera — experimente a geração de vídeo por IA agora mesmo com uma ferramenta disponível hoje.
Desenvolvido por Elser.ai — funciona independentemente de qualquer modelo discutido acima.
Experimente o Animador de Imagens por IAReceba mais de 50 prompts de vídeo por IA testados, folhas de dicas de comparação e modelos de fluxo de trabalho entregues em sua caixa de entrada.
FAQ
Sim. Ambos são desenvolvidos pela Divisão de Inovação ATH do Alibaba, especificamente pela equipe do Future Life Lab sob o Grupo Taotian, liderada por Zhang Di.
Eles servem a propósitos diferentes. O Happy Horse é para criação de conteúdo em vídeo. O Happy Oyster é para ambientes 3D interativos. Escolha com base na sua necessidade de vídeo ou de mundos 3D.
O acesso à API do Happy Horse está planejado para 30 de abril de 2026, com um lançamento completo de código aberto, incluindo GitHub e pesos do modelo, a seguir.
Potencialmente. O Happy Horse poderia gerar vídeos de marketing para um produto construído com os ambientes 3D do Happy Oyster. A arquitetura ATH compartilhada pode permitir uma integração mais estreita ao longo do tempo.