ChatGPT agora cria imagens com texto
Nova função do GPT-4o transforma ideias em ilustrações com precisão surpreendente. A inteligência artificial agora interpreta descrições e gera visuais com qualidade profissional, acessíveis a todos.
A inovação mais aguardada do ChatGPT
A OpenAI anunciou uma das funcionalidades mais entusiasmantes da sua história: a geração visual embutida diretamente na interface do ChatGPT.
Com essa adição, o modelo GPT-4o se consolida como um verdadeiro assistente criativo, respondendo a comandos em linguagem natural e entregando composições gráficas sofisticadas.
A novidade já está acessível para quem utiliza os planos pagos, com previsão de ampliação ao público geral em breve.
Antes, a criação pictórica exigia plataformas paralelas como o DALL·E. Agora, todo o processo ocorre no mesmo ambiente, com agilidade e controle.
O usuário descreve o que deseja, e o sistema compreende contexto, estilo, composição, cores e até referências anteriores. O resultado é uma figura coerente, refinada e adequada ao propósito proposto.
Além disso, o recurso também foi implementado no Sora, projeto audiovisual da própria empresa, ampliando o alcance dessa tecnologia integrada.
O GPT-4o deixa de ser apenas um gerador textual e assume o papel de solucionador multimodal, reunindo capacidades de escrita, som e imagem numa única ferramenta.
O Site Cultura Alternativa, já escreveu sobre:
PARA LER SOBRE O ASSUNTO CLIQUE NO ARTIGO DE SEU INTERESSE
🔗 Therabot: Chatbot com IA Generativa
🔗 Li-Fi em 2025: A Conectividade Pela Luz Que Pode Mudar Tudo
🔗 Facebook – A rede dos mais velhos
ChatGPT agora cria imagens com texto
Anime, humor gráfico e quadrinhos sob seu comando
Na apresentação da funcionalidade, os engenheiros Gabe e Proful demonstraram, em tempo real, a transformação de uma selfie em uma cena de anime. Bastou capturar uma imagem e descrever o estilo desejado.
O modelo leu a foto, interpretou a solicitação e entregou um retrato estilizado com fidelidade aos traços, expressão e ambientação solicitada.
O potencial de entretenimento também ficou evidente com a criação de memes personalizados. O sistema absorve referências culturais da internet, detecta nuances do sarcasmo e adapta elementos visuais com alto grau de exatidão.
O diferencial está na memória da conversa: é possível solicitar ajustes, alterações ou melhorias sem reiniciar o processo.
Outro exemplo marcante foi a criação de uma página em estilo mangá abordando a Teoria da Relatividade, combinando humor leve com conteúdo científico.
Isso prova que a funcionalidade pode ser aplicada em múltiplos contextos — do lúdico ao didático — estimulando novas formas de apresentar conhecimento e engajar públicos diversos.
Criatividade com domínio total dos detalhes
Um dos pontos mais impressionantes da nova tecnologia é a capacidade de seguir instruções específicas com rigor.
Na demonstração, um colaborador solicitou a criação de um card colecionável com seu cachorro como personagem. Incluiu nome estilizado, habilidades fictícias, altura, peso e outros elementos personalizados. O sistema atendeu a todas as exigências com exatidão gráfica.
A renderização textual também foi aprimorada. Diferente das versões anteriores, onde letras saíam distorcidas ou imprecisas, agora os caracteres aparecem nítidos, legíveis e bem posicionados.
Essa melhoria expande o uso da ferramenta para infográficos, histórias em quadrinhos, convites, embalagens e apresentações.
Outro destaque é a manutenção da identidade visual entre projetos diferentes. A IA consegue gerar uma sequência de imagens com o mesmo personagem, mantendo coerência estética e padronização de estilo.
Isso permite elaborar séries visuais, narrativas ilustradas ou campanhas promocionais com unidade gráfica, tudo a partir de simples mensagens digitadas.
Um cérebro que entende com olhos e ouvidos
O GPT-4o é um modelo verdadeiramente multimodal. Isso significa que ele processa e gera diferentes formas de informação — palavras, sons e imagens — de maneira simultânea e contextualizada. Assim, você pode combinar fotos, frases, descrições e instruções, e obter uma resposta visual que sintetiza tudo isso de forma coesa.
Esse funcionamento permite interações mais naturais e refinadas. Deseja mudar o cenário da imagem? É só pedir. Quer um novo enquadramento, filtro ou objeto adicional? Basta informar. A linguagem usada pode ser espontânea e informal, como se você estivesse conversando com um designer particular.
Durante o lançamento, uma criação simbólica chamou atenção: uma moeda comemorativa digital, feita com elementos gráficos gerados anteriormente.
O modelo reconheceu todas as referências, entendeu o tema da primavera, aplicou um código cromático específico e combinou tudo em um objeto visual harmonioso — pronto para ser impresso como lembrança física do evento.
ChatGPT agora cria imagens com texto
O nascimento de uma nova era visual
Com essa atualização, a inteligência artificial da OpenAI deixa de ser apenas uma ferramenta de consulta ou escrita.
Ela se transforma num instrumento expressivo, capaz de converter ideias abstratas em imagens impactantes, acessíveis até para quem nunca mexeu com design.
O alcance é amplo: profissionais de marketing, docentes, escritores, lojistas, influenciadores e até crianças podem criar obras visuais com agilidade e originalidade.
Cartilhas, pôsteres, capas, jogos, artes promocionais, convites e até produtos digitais tornam-se realidade em poucos minutos — sem necessidade de programas complicados.
O ChatGPT agora enxerga, interpreta e ilustra. E mais: está disponível para dialogar sobre cor, estilo, composição, refinamentos. A era do conteúdo gerado por inteligência artificial evoluiu. E você já pode começar a explorar esse novo universo com a simplicidade de uma conversa.
Anand Rao e Agnes Adusumilli
Editores Chefes
Cultura Alternativa