Como pequenas e médias empresas podem aproveitar a IA de texto para imagem

0
484

Inscreva-se agora para obter seu passe virtual gratuito para o Low-Code/No-Code Summit em 9 de novembro. Ouça os executivos do Service Now, Credit Karma, Stitch Fix, Appian e muito mais. Saber mais.


Ter a chance de experimentar o DALL-E 2, o novo sistema de IA da OpenAI que pode criar imagens realistas a partir de linguagem natural, foi extraordinário.

Não há dúvida de que o sistema ainda está em sua infância, mas está claro que a tecnologia está se movendo rapidamente e já estamos começando a ver modelos aprimorados de texto para imagem. O Imagen do Google Brain, que pode gerar imagens fotorrealistas de uma cena com uma descrição textual, e o Make-A–Scene do Meta, que permite aos usuários desenhar um esboço digital de forma livre para acompanhar um prompt de texto, são exemplos promissores.

Essa tecnologia também não é apenas para grandes empresas de tecnologia. Existem várias maneiras pelas quais as pequenas e médias empresas podem tirar proveito da tecnologia de texto para imagem hoje.

Em média, é recomendável que as pequenas empresas gastem de 7 a 8% de sua receita bruta em marketing. E, no entanto, muitos estão gastando apenas 3 a 5%. Ferramentas como o DALL-E 2 podem permitir que os empreendedores superem seu peso, mesmo que não tenham o luxo de contratar talentos para produzir gráficos personalizáveis ​​e de marca.

Evento

Cúpula Low-Code/No-Code

Junte-se aos principais executivos de hoje no Low-Code/No-Code Summit virtualmente em 9 de novembro. Registre-se para seu passe gratuito hoje.

Registre-se aqui

Como diz o ditado, uma imagem vale mais que mil palavras. À medida que o DALL-E 2 e outros sistemas de conversão de texto em imagem se tornam mais amplamente disponíveis, faz sentido que os profissionais de marketing comecem a usá-los em suas campanhas.

Tomemos, por exemplo, uma marca que vende frutos do mar frescos. Embora faça sentido incluir imagens atraentes em seus e-mails, não há nenhuma vantagem real em fazer suas próprias sessões de fotos em vez de usar fotos de banco de imagens. Assinaturas de catálogos de fotos para uso comercial podem facilmente custar centenas de dólares por mês, o que é difícil para marcas menores justificarem.

Digite DALL-E 2. O modelo permite que os profissionais de marketing combinem a criatividade de contratar um designer gráfico interno com uma economia potencial de preço. Aqui, por exemplo, está o que DALL-E 2 produz ao pedir “uma foto representando um salmão de dar água na boca com fatias de limão”.

Embora essas imagens sejam realmente de dar água na boca, o que acontece quando a oferta de salmão cai inesperadamente e nossa oferta desta semana muda de salmão para bacalhau? Para pequenas empresas que precisam mudar a qualquer momento, a capacidade de gerar novas imagens em 30 segundos não tem preço.

Criação gráfica por DALL-E 2

DALL-E 2 entrou na consciência popular não por causa de sua capacidade de espelhar fielmente o mundo, mas por causa de sua capacidade de criar imagens maravilhosamente estilizadas.

Considere esta aquarela de um panda usando um chapéu. A imagem é lúdica, bem estruturada e não existe em nenhum catálogo de fotos. É por isso que o DALL-E 2 é empolgante – abre novas oportunidades, especialmente para pequenas empresas.

O sucesso de ferramentas como o DALL-E 2 pode ser assustador para designers preocupados com a automação de seus papéis por IA, especialmente porque alguns especialistas preveem que 99,9% do conteúdo online será gerado por IA até 2030. Mas acreditamos que o DALL-E 2 não t substituir quaisquer empregos; em vez disso, ele se tornará parte do kit de ferramentas e do conjunto de habilidades de um profissional de marketing.

A qualidade de saída do DALL-E 2 varia drasticamente dependendo de quais prompts são inseridos nele. Gerar um bom prompt é um processo muito criativo, semelhante a escrever uma cópia em si. Se o futuro incluir profissionais de marketing em funções híbridas usando essas ferramentas como inspiração, isso se tornará cada vez mais uma habilidade de domínio.

DALL-E 2: Inpainting

Um dos recursos mais interessantes que o DALL-E 2 oferece é a pintura automática. Pense nisso como uma varinha mágica que os profissionais de marketing podem acenar para alterar as imagens da maneira que quiserem.

Isso é melhor visto através do exemplo. Aqui, DALL-E 2 recebeu a primeira imagem e foi instruído a inserir um corgi em um local específico. A modelo entendeu o contexto da imagem bem o suficiente para entender que estava sendo solicitado a renderizar o cachorro dentro de uma pintura e foi capaz de compor em um estilo que combinasse.

Exemplo de https://openai.com/dall-e-2/

Esse recurso fascinante tem muito valor, especialmente para marcas que desejam capturar seus produtos em diferentes locais ou cenários únicos. Imagine colocar seu produto em cenários que você não pode visitar ou ver como George Washington ficaria enquanto tomava uma Coca-Cola.

O DALL-E 2 pode mudar notavelmente o jogo para os profissionais de marketing para que eles sejam mais limitados por sua criatividade do que por tempo e orçamento.

Limitações

Embora haja motivos para estar empolgado com o futuro, a tecnologia atual ainda tem limitações. Ele se esforça para gerar pessoas fotorrealistas e muitas vezes não consegue gerar texto coerente. Além disso, houve algumas críticas significativas ao DALL-E 2 sobre a questão do viés. Por exemplo, quando encarregado de gerar o “retrato de uma pessoa inteligente” DALL-E Mini – uma implementação de código aberto e de baixo custo do DALL-E 2 – gerou nove fotos de homens brancos em trajes formais.

A OpenAI lançou recentemente uma atualização destinada a mitigar alguns desses problemas de viés, mas resta saber se eles serão realmente resolvidos. Enquanto isso, os profissionais de marketing que usam essas ferramentas terão que ter cuidado para evitar a propagação não intencional de vieses.

Empacotando

Então, queremos DALL-E 2, em sua forma atual, como uma ferramenta em nossa caixa de ferramentas de marketing? Absolutamente, e para muitos propósitos: imagens que podem ser usadas como geradas, para dar pontos de partida para edição posterior; para ajudar a debater; transmitir ideias a artistas gráficos; executar testes A/B eficientes no criativo; e criar imagens fantásticas e atraentes que hoje só poderiam ser feitas por artistas. Apesar de suas limitações, também há oportunidades.

Nos últimos seis meses, vimos um interesse crescente na tecnologia inovadora de conversão de texto em imagem. À medida que a tecnologia continua a se mover rapidamente, modelos melhores e mais aprimorados continuarão a surgir, e os casos de uso para marcas só crescerão.

Robert Huselid e Tom Dinitz são cientistas de dados da Claviyouma plataforma de cliente unificada para e-mail, SMS e muito mais, que permite que as marcas online sejam proprietárias de seus dados e cresçam em seus próprios termos.

Tomadores de decisão de dados

Bem-vindo à comunidade VentureBeat!

DataDecisionMakers é onde especialistas, incluindo o pessoal técnico que trabalha com dados, podem compartilhar insights e inovações relacionadas a dados.

Se você quiser ler sobre ideias de ponta e informações atualizadas, melhores práticas e o futuro dos dados e da tecnologia de dados, junte-se a nós no DataDecisionMakers.

Você pode até considerar contribuir com um artigo seu!

Leia mais sobre DataDecisionMakers

Fonte: venturebeat.com

Receba nossas atualizações
Fique por dentro de todas as notícias e novidades do mundo da tecnologia!

Deixe uma resposta