top of page
Foto do escritorVictor Gerhardt

IAS ARTISTAS E A REVOLUÇÃO CRIATIVA DAS MÁQUINAS

Atualizado: 7 de dez. de 2022

Acho bem provável que você já esteja careca de consumir histórias em que uma inteligência artificial cria consciência e subjuga a humanidade, certo? Há décadas, autores de ficção científica e futurólogos abordam esse tema e, em algum momento, concordam com uma coisa bem específica: as IAs seriam formas de consciência totalmente frias, calculistas e incapazes de sentir emoções; logo, incapazes de produzir arte. Mas, para surpresa geral, estamos diante de um plot twist que encheria Isaac Asimov de orgulho. Não só nenhuma IA parece estar dando a mínima para dominação mundial, como agora elas estão alegremente criando belíssimas artes em escala industrial.


Exemplo de uma ilustração de uma IA mostrando como elas visualizam o futuro da humanidade.

Mas calma, o objetivo desse post não é preocupar ninguém. Na série de postagens que inicio aqui, vou tentar explicar da melhor maneira possível a respeito das "famigeradas IAs criadoras de arte". Onde elas vivem? O que comem? Como se reproduzem? Agora mesmo, no Nerdice.com.


Eu ainda pretendo fazer um post mais técnico em algum momento dessa série, mas começar a falar tecnicalidades agora só faria você, querido leitor, cair nos braços de Morpheus. Antes disso, quero ganhar a confiança de vocês. Quero explicar que a tecnologia text-to-image não é malvada e não vai roubar o emprego de ninguém. Vamos pelo começo:


O que é o modelo text-to-image?

Basicamente o modelo text-to-image de aprendizado de máquinas é focado na geração de imagens através de um prompt escrito. Em outras palavras: tu digitas, ela cria! Tu digitas "vaca amarela de patins dançando cara caramba cara caraô" e será agraciado com a imagem bem nítida de um ser bovino fêmea amarelado, usando tênis com rodinhas. A parte da dança já não garanto, as IAs pedem desculpa.


Dentro de algum desses barcos malucos tem uma vaca

Quem está por trás disso?

Pra resumir: uma galera. Essa tecnologia já vem sendo estudada e aprimorada há anos, mas hoje temos três principais nomes: a StabilityAI, a OpenAI e o Midjourney. Há vários outros, inclusive um da própria Google, mas esses três são os titãs dessa tecnologia no momento que este texto é escrito.


Tá, mas como eu brinco com esse trem?

Calma lá, jovem padawan. Primeiro precisamos fazer seu sabre de luz, ou melhor, escolher qual das tecnologias vamos investir nosso tempo e dinheiro... "O quê? Dinheiro? Tchau, fui". Segura as pontas aí, pois é sim possível que você já possa desfrutar dessa tecnologia sem desembolsar um centavo sequer... Basta ter uma plaquinha de vídeo básica com 8gb de VRAM (o que, de fato, é bem básica pra hoje em dia, e acredito que uma parcela considerável dos que estão lendo já estejam aptos). Então vamos começar conhecendo sobre as três melhores plataformas do mercado.


  • Dall-E - é a plataforma text-to-image da OpenAI. A pronúncia de Dall-E é pra ser uma homenagem a Salvador Dalí, mas acabou descambando pro guaraná Dolly mesmo.

Logo da Dolly... digo Dall-E

Fazer o que, né? A OpenAI foi fundada por ninguém menos que Elon Musk, mas podem ficar tranquilos, pois o nosso Homem de Ferro desprovido de neurônios está muito ocupado assassinando passarinhos azuis e não faz mais parte da empresa. Pra usar o serviço deles, não tem jeito, tem que abrir o bolso. No mesmo esquema que joguinhos ruins de celular, você começa com umas moedinhas que você pode usar pra gerar seus belos rabiscos lá, e quando começar a se empolgar, trate de passar o número do cartão de crédito. Todo o uso do Dall-E é feito através do navegador, então não requer nenhuma instalação ou chateação por parte do usuário. A Dall-E foi por um bom tempo a rainha da porra toda, sendo a plataforma que produzia os melhores resultados, mas recentemente esse posto foi tomado por ninguém menos que:


Esse barquinho besta é a logo da Midjourney
  • Midjourney - é a plataforma mais misteriosa das três. Pouco de sabe sobre o laboratório independente por trás da Midjouney. Ela é bem novinha, tendo entrado em open beta em julho de 2022, um nenê. Mas um nenê de krypton, pois já chegou voando. A mais recente versão da Midjourney, a quatro ponto zero, produz imagens capazes de gerar suspiros em qualquer amante de artes visuais. É absurdo o que essa joça faz e chega a ser um desrespeito com as competidoras. Mas, é claro, usar tamanho poder requer um cheque igualmente grande. Tá, não é assim tããão caro: trinta doletas é quanto custa a mensalidade da plataforma, mas, assim como a Dall-E, ela te dá um gostinho. O mais curioso é a forma que a Midjourney é usada: ela é um bot de Discord! Nada de app próprio, site ou software; essa danada funciona como um bot dentro da principal plataforma de socialização da geração z. Como eu sou boomer, ainda não brinquei com o melhor brinquedo da loja, mas não por conta do Discord e sim porque ainda não vi necessidade em abrir meu bolso quando temos a deusa toda poderosa:


  • Stable Diffusion - É aqui que você queria chegar. Sim, estou falando com você dono

A dona da minha queridinha Stable Diffusion.

de uma conta zerada mas com um pc gamer meia bomba parcelado em 12x na Pichau. Acontece, que a StabilityAI foi uma verdadeira mãe e decidiu que todas crianças merecem brincar. O Stable Diffusion é open source e, como falei lá em cima, com uma placa de vídeo meia boca você já está apto para desfrutar de todas as maravilhas que só essa tecnologia pode proporcionar. Sim, ao contrário das concorrentes, o Stable Diffusion pode rodar localmente e sem nenhum limite. É poder sem limites, como diria o bom velhinho Palpatine. Apesar de ser open source, eles possuem o próprio web app pago, mas que não faz nada superior ao que a sua versão local possa fazer, apenas oferece a comodidade de usar a ferramenta em qualquer batata que tenha conexão com a internet. Aliás, o Lensa, aplicativo do momento entre a galerinha influencer, também roda Stable Diffusion para produzir suas imagenzinhas (e cobram 20 reais por isso. Não paguem!).


Agora que conhecemos as ferramentas, seus prós e contras e tudo o mais, basta escolher aquela que mais nos agrada. A escolhida por mim, vocês já sabem, é a Stable Diffusion. Ela é a menina que eu gosto e vocês serão os amigos para quem falarei dela por muito tempo. Ah, como eu amo falar sobre a menina que eu gosto.



Foto da menina que eu gosto. Mentira, é só a minha versão mulher feita pela Stable Diffusion. verdadeira menina que eu gosto.

“Ah, mas ela não é tão boa quanto a Midjouney” podem comentar aqueles espertinhos que foram até o Instagram e buscaram #midjouney. Em primeiro lugar: vai lá e casa com ela então, chatão. E em segundo lugar, pense o seguinte: há duas semanas a rainha era a Dall-E, posto usurpado sem misericórdia pela Midjourney, mas e depois? Quem será a próxima? Essa tecnologia está avançando em uma velocidade absurda. Novas plataformas virão e, enquanto você lê esse post, muitas melhorias estão sendo aplicadas nas que já existem, mas só uma, até o momento, possui o poder da comunidade. Só a Stable Diffusion permite que você usufrua de modelos criados por outros usuários, que crie e treine os seus próprios e compartilhe também suas criações.


Mas acho que já estou me precipitando demais por hoje. Nos próximos posts vou abordar mais profundamente todas as possibilidades que essa tecnologia pode nos proporcionar, vou dar aquele tutorialzinho básico de como usá-la e entrar no modo filósofo de boteco pra discutirmos as implicações éticas dessa tecnologia.


Enquanto isso, siga a mim e o Nerdice para não perder o restante dessa série.


Até lá, nerds.

0 comentário

Comments


bottom of page