OpenAi lança a criação de imagem GPT-4O para todos

O OpenAI lançou um novo sistema de geração de imagens diretamente integrado ao GPT-4O. Este sistema permite que a IA acesse sua base de conhecimento e contexto de conversa ao criar imagens.

Diz -se que essa integração permite saídas visuais mais relevantes e precisas contextualmente.

Openai’s anúncio Leia:

“A geração de imagem GPT -4O se destaca em renderizar com precisão o texto, com precisão seguindo os avisos e alavancando a base de conhecimento e o contexto de bate -papo inerente de 4o – incluindo a transformação de imagens enviadas ou usando -as como inspiração visual.

Aqui está tudo o mais que você precisa saber.

Capacidades técnicas

O OpenAI destaca os seguintes recursos de seu novo sistema de geração de imagens:

  1. Ele renderiza com precisão o texto dentro das imagens.
  2. Ele permite que os usuários refinem imagens através da conversa, mantendo um estilo consistente.
  3. Ele suporta instruções complexas com até 20 objetos diferentes.
  4. Ele pode gerar imagens com base em referências carregadas.
  5. Ele cria visuais usando informações dos dados de treinamento do GPT-4O.

OpenAI afirma em seu anúncio:

“Como a geração de imagens agora é nativa do GPT -4O, você pode refinar imagens através de conversas naturais. O GPT -4O pode construir imagens e texto no contexto de bate -papo, garantindo consistência o tempo todo. Por exemplo, se você está projetando um personagem de videogame, a aparência do personagem permanece coerente em várias iterações enquanto você refina e experimenta.”

Exemplos

Para demonstrar consistência do personagemaqui está um exemplo mostrando um gato e depois o mesmo gato com um chapéu e monóculo.

Captura de tela de: Openai.com/index/introducing-4o-image-generation/, março de 2025.

Aqui está um exemplo mais prático para os profissionais de marketing, demonstrando geração de texto: Um menu completo de restaurante gerado com um prompt detalhado.

Captura de tela de: Openai.com/index/introducing-4o-image-generation/, março de 2025.

Há dezenas de mais exemplos no post de anúncio da Openai, muitos dos quais contêm vários avisos e acompanhamentos.

Limitações

Openai admite:

“Nosso modelo não é perfeito. Estamos cientes de várias limitações no momento em que trabalharemos para abordar através de melhorias no modelo após o lançamento inicial”.

A empresa observa as seguintes limitações de seu novo sistema de geração de imagens:

  • Cropping: O GPT-4O às vezes colhe imagens longas, como pôsteres, muito próximos no fundo.
  • Alucinações: Este modelo pode criar informações falsas, especialmente com avisos vagos.
  • Altos problemas de mistura: Ele luta para representar com precisão mais de 10 a 20 conceitos ao mesmo tempo, como uma tabela periódica completa.
  • Texto multilíngue: O modelo pode ter problemas mostrando caracteres não latinos, levando a erros.
  • Edição: Solicitações para editar peças de imagem específicas podem alterar outras áreas ou criar novos erros. Também luta para manter os rostos consistentes em imagens carregadas.
  • Densidade da informação: O modelo tem dificuldade em mostrar informações detalhadas em tamanhos pequenos.

Implicações de pesquisa

Esta atualização altera a geração de imagens da IA ​​de usos principalmente decorativos para funções mais práticas em negócios e comunicação.

Os sites podem usar imagens geradas pela IA, mas com considerações importantes.

As diretrizes do Google não proíbem visuais gerados pela IA, concentrando-se se o conteúdo fornece valor, independentemente de como ele é produzido.

Seguir estas práticas recomendadas é recomendado:

  • Usando os metadados C2PA (que o GPT-4O adiciona automaticamente) para manter a transparência
  • Adicionando texto ALT adequado para acessibilidade e indexação
  • Garantir que as imagens sirvam de intenção do usuário, em vez de apenas preencher o espaço
  • Criando visuais exclusivos em vez de modelos de IA genéricos

Advogado de pesquisa do Google John Mueller tem expresso Uma opinião negativa sobre imagens geradas pela IA. Embora suas preferências pessoais não influenciem os algoritmos do Google, eles podem indicar como os outros se sentem sobre imagens de IA.

Captura de tela de: bsky.app/profile/johnmu.com, março de 2025.

Observe que o Google está implementando medidas para rotular imagens geradas por IA nos resultados da pesquisa.

Disponibilidade

O recurso está agora disponível para usuários de chatgpt com planos Plus, Pro, Team ou Grátis. O acesso aos usuários da empresa e da EDU estará disponível em breve.

Os desenvolvedores podem esperar acesso à API nas próximas semanas. Devido às necessidades mais altas de processamento, a geração de imagens leva cerca de um minuto em média.


Imagem em destaque: Patrickassale/Shutterstock

#OpenAi #lança #criação #imagem #GPT4O #para #todos

Mais do autor

Onde estamos com os processos do Google?

A mudança para pesquisas com clique zero: o tráfego ainda é rei?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *