Layout do blog

Criando capas de podcast com inteligência artificial

Danilo Fernandes • jul. 16, 2023

A inteligência artificial pode trazer uma abordagem inovadora e cativante para atrair e envolver o seu público. Mas será que é tudo isso mesmo?

Robôs prateados com um coração vermelho no meio do peito. Imagem criada com inteligência artificial.

Faz mais ou menos 10 meses desde que eu comecei a me interessar por inteligência artificial.


Sempre gostei de conhecer e experimentar novas tecnologias. Meu primeiro podcast, por exemplo, foi criado por volta de 2008, quando eu tinha 17 anos. Então sendo essa pessoa, resolvi entrar na brincadeira logo cedo e passei a criar imagens usando ideias completamente malucas e abstratas para minha própria diversão.

O que é inteligência artificial, afinal de contas?

De acordo com o site Tecnoblog, inteligência articial (IA ou AI, do inglês artificial intelligence) "é um avanço tecnológico que permite que sistemas simulem uma inteligência similar à humana — indo além da programação de ordens específicas para tomar decisões de forma autônoma, baseadas em padrões de enormes bancos de dados".


Resumindo com minhas próprias palavras, é uma forma de programação altamente treinada para executar tarefas que você não quer fazer.

Como funciona a tecnologia de geração de imagens?

Uma das plataformas mais usadas atualmente para a criação de imagens é o Midjourney. Foi através dele que eu fiz algumas capas para meus podcasts, mas vou me aprofundar mais nesse tópico em breve.


O Midjourney é um sistema que ajuda a coletar e organizar dados para alimentar sua base. Primeiro, ele rastreia e coleta informações e imagens pela internet adentro. Ele captura imagens e depois tenta rastrear algum tipo de descrição em texto em cada uma delas.


No vídeo abaixo, lançado pelo canal Vox em junho de 2022, podemos ver que antes de chegar no usuário final, o software separa e categoriza inúmeras características de objetos para remontá-los conforme o gosto do usuário.

Através de muita engenharia e programação, o Midjourney consegue discernir uma banana amarela de um balão vermelho, por exemplo. Para começar a fazer essa distinção, os programadores poderiam definir que "tudo que for amarelo é uma banana" e "tudo que for vermelho é um balão".


Mas o que aconteceria se aparecesse um balão amarelo? O Midjourney possivelmente entenderia, a princípio, que aquilo era uma banana. Então um novo parâmetro é criado: "agora tudo que tive uma forma arredondada é um balão". Mesmo se for amarelo.


Agora imagine o número de parâmetros necessários para definir todas as cores, formas, tamanhos e texturas existentes. É por isso que a base de dados de uma tecnologia como o Midjourney precisa ser enorme.



Se uma inteligência artificial não for bem calibrada, os resultados podem ser catastróficos. Não é à toa que em 2016 a Microsoft criou um robô que aprendeu a conversar através do Twitter e, em pouco tempo, ele passou a reproduzir discursos nazistas.


E situações semelhantes podem acontecer com os humanos, principalmente aqueles que consome apenas um tipo de conteúdo, muitas vezes proveniente de fontes não muito confiáveis.


Mas até aqui estamos falando apenas sobre como o Midjourney (e similares) funcionam internamente. Vamos partir agora para a etapa mais interessante para a maioria dos usuários.

Mini tutorial do Midjourney e do Discord

Ao acessar o Midjourney, através do Discord, o usuário consegue acessar uma espécie de chat muito parecido com o Whatsapp Web (ou o saudoso MSN). Na parte de baixo do chat é onde você consegue digitar todas as suas ideias para criação de imagens.


Para entender com detalhes, assista ao vídeo abaixo antes de seguir lendo esse texto.


Criando capas de podcast no Midjourney

Se você avançou sua leitura direto para cá, peço para que volte e leia toda a contextualização. Vai ser importante para você entender as coisas direito.


Pois bem, vou falar sobre minha experiência agora.


Em 2022, nós fizemos por aqui um podcast sobre o Big Brother Brasil. O programa deu certo e em 2023 nós repetimos e aumentamos a dose. Além de dois episódios semanais com mais de 1h de duração cada, também lançamos episódios de cortes, focando em um único ponto da discussão dos episódios maiores.


Como eu ainda estava bastante engajado em aprender a usar o Midjourney no início do ano, achei que poderia ser uma ideia ilustrar aqueles trechos com imagens criadas artificialmente.


E foi assim que todas as imagens abaixo foram criadas.

Todas as 36 capas dos episódios do podcast reunidas numa pasta do computador

Um erro de entendimento que as pessoas têm é que as inteligências artificiais não criam nada sozinhas de fato. Talvez alguém chegue nesse post achando que existe alguma plataforma que escute seu podcast inteiro e devolva automaticamente uma imagem de capa mas eu posso afirmar que isso simplesmente não existe. Pelo menos por enquanto.


Ao invés disso, existe uma pessoa - ou várias, dependendo do caso - que vão ficar tendo milhões de ideias após ouvir o podcast e a partir disso, começar a elaborar uma ideia de capa.


O que eu estou tentando dizer é que a inteligência artificial pode até ser capaz de entregar uma imagem baseada em várias outras já existentes aqui e ali, mas o esforço criativo e a geração de ideias é totalmente fruto da capacidade humana.


Veja por exemplo a imagem que ilustra o segundo episódio de cortes do BBB23 e que, não por acaso, é a mesma imagem que ilustra esse texto. Na figura temos um batalhão de robôs com um grande coração vermelho no peito. Isso porque nós comentamos no episódio o fato de que vários participantes do reality compraram seguidores para darem like e engajamento nas suas redes sociais.


O sétimo episódio de cortes foi ilustrado por um robô cor de rosa com um lacinho na cabeça. Isso porque foi comentado no episódio uma prova do Big Brother em que uma participante se referia ao mascote do reality como uma boneca e não como um robô.


Já um outro episódio teve uma releitura do meme do Pica-Pau limpando o chão com um esfregão. Isso porque a discussão do dia foi o fato da Globo não ter "passado pano" - isto é, não ter perdoado - a importunação sexual cometida na casa pelo MC Guimê e pelo lutador Cara de Sapato.

Dito tudo isso...

... eu acredito que criar imagens com inteligência artificial pode não ser a melhor escolha para todos os momentos.


Continuo achando que essa tecnologia é muito interessante, mas precisa ser usada com ressalvas. Não que eu ache que o rápido avanço das possibilidades digitais vai resultar na dominação das máquinas como ocorre em O Exterminador do Futuro.


Minha razão é muito mais simples que isso: a estética do Midjourney já está saturada.


Em menos de um ano testando e brincando com essas ferramentas eu já não aguento mais olhar para essa pintura digital semi-deformada. Se você ainda não fez o exercício de analisar de perto qualquer uma dessas imagens, deixo aqui o convite. Repare nas mãos tortas, nos dentes em excesso e na falta de detalhes dessas imagens. Com o tempo eu tenho certeza que você vai começar a achar tudo grotesco.


Claro, se você não tem grana para contratar profissionais do design para atender suas demandas e/ou se você acha que essa estética ainda combina com a proposta do seu podcast, sinta-se livre para testar e explorar todas as possibilidades.


Mas se você quer deixar a estética do seu programa mais alinhada, personalizada e condizente com as ideias e sensações que você deseja transmitir, dê a chance para outro ser humano resolver isso para você.


E se você gostou do que leu aqui ou quiser continuar a falar a respeito, entre em contato através do nosso formulário ou de nossas redes sociais.


Eu fico por aqui. Grande abraço,

Danilo.

Por Danilo Fernandes 21 out., 2023
Post especial do Dia do Podcast sobre o público ouvinte de podcast.
Cooler do computador com o logotipo do ComéquePOD refletido ao lado
Por Danilo Fernandes 30 jun., 2023
Leia e saiba quais equipamentos usar para criar seu podcast!
Por Danilo Fernandes 03 jan., 2023
A ano começou e queremos compartilhar nossos planos com você!
Arte do Spotify cheia de cores e com o texto: a retrospectiva 2022 chegou.
Por Danilo Fernandes 02 dez., 2022
Confira como foi o ano do ComéquePOD e seus spin-offs no Spotify!
Fone de ouvido e microfone profissional
Por Danilo Fernandes 25 nov., 2021
Se você procura seu primeiro equipamento, esse post pode te ajudar.
Share by: