IA e Arte: A percepção visual transformada pela arte do algoritmo de transferência de estilo

Neste artigo irei abordar a relação entre inteligência artificial e arte, mas precisamente uma ferramenta criada por Leon Gatsy a partir da inteligência artificial: o algoritmo da transferência de estilo e como ele influencia a mudança da nossa percepção visual através da arte.

Antes de abordar o algoritmo criado por Leon Gatys, é necessário conhecê-lo. Ele é um pesquisador de Machine Learning que atualmente trabalha na Apple como membro fundador da equipe de IA de saúde, em Seattle. Em sua tese de doutorado em Aprendizado de Máquina e Neurociência Computacional pela Universidade de Tuebingen na Alemanha, o pesquisador e dois colegas inventaram o “Popular Neural Style Transfer Algorithm” usando uma área das “Deep Neural Networks” (redes neurais profundas): as “Convolutional Neural Networks” (redes neurais convolucionais) para modelar a percepção visual. A tese de Doutorado de Leon, realizada em 2015, foi fonte dessa pesquisa junto às outras bibliografias.

As redes neurais biológicas são estruturas que conectam os neurônios de forma que a combinação das operações unitárias simples realizadas por cada um, ocasione em soluções de problemas complexos. Esperando imitar esse processo biológico, as redes neurais artificiais utilizam de neurônios artificiais para enviar, receber informações entre si e resolver operações simples que levam a resoluções de problemas de grande complexidade. As redes neurais convolucionais usadas no algoritmo de Gatys, possuem muitas camadas de processamento compostas de neurônios, sendo elas camada de entrada, camadas ocultas e camada de saída. Essa rede passa por um treinamento de reconhecimento de objetos, criando uma representação deste que gera informações que são transmitidas ao longo da hierarquia de processamento. A imagem de entrada é transformada em representações que se preocupam cada vez mais com o conteúdo real da imagem em comparação com seus valores de pixel detalhados. Esses dados do conteúdo passam pelo sistema de pesos e viés (weights and biases), de forma que, o neurônio calcula uma soma ponderada implementando o viés e dependendo do resultado e de uma função de ativação predefinida, ele delibera se deve ser ‘disparado’ ou ativado. Após esse processo, a informação é transmitida a outros neurônios pelo processo de “forward pass”. Posteriormente, a última camada oculta é conectada à camada de saída que possui um neurônio para cada saída possível desejada, tornando, assim, a previsão possível. Desse modo, por exemplo, pode ser realizado um comando para extrair o estilo e o conteúdo de uma imagem.

Após conhecer o método utilizado por Leon, é possível compreender melhor o “Popular Neural Style Transfer Algorithm”. O objeto da pesquisa do cientista é criar obras de transferência de estilo recriando uma fotografia arbitrária no estilo de uma pintura existente, de modo que uma máquina seja capaz de perceber o mundo como os seres humanos e também de criar algo admirador. 

Pensando-se nos anos 80, essa tarefa era muito difícil. Naquela época, quando ainda não existiam as redes neurais, as máquinas eram capazes de aprender e lidar com afirmações da realidade humana a partir de símbolos inseridos em redes complexas cheias de viés e regras, assim sendo capazes de ver o mundo como nós. Comparando com os dias atuais, naquele momento fazer a aplicação dessas redes em uma pintura era impensável, já hoje, com o uso das redes neurais profundas, o pesquisador alcançou esse feito mas não por meio de afirmações, e sim por números. Esse processo consiste na substituição de cada pixel pelos números que o codificam. As codificações para a imagem de estilo de uma pintura e a imagem de conteúdo fotográfico são alimentadas nas camadas da rede, depois é colocada uma imagem de ruído branco, que serve como base da nova imagem, como uma tela em branco. Após isso, os pixels dessa imagem são distribuídos aleatoriamente, e essa tela em branco é propagada para frente e para trás por meio do sistema de modo a captar o máximo possível do estilo da pintura e do conteúdo da fotografia, misturando estas até conseguir reproduzir a fotografia com o estilo da pintura.

Um exemplo é a transferência de estilo de uma fotografia do Neckarfront em Tübingen e a transformação no estilo de Van Gogh’s The Starry Night para criar uma nova imagem.

Figura 2. MILLER, Arthur. The Artist In the Machine. Cambridge: MIT Press, 2019.

O que torna essa transferência interessante e bem cativante são as infinitas possibilidades de criação e a capacidade de eu, você ou qualquer pessoa testar e incentivar esse tipo de criação através do site que o Leon Gatys e seus colegas da universidade desenvolveram (https://deepart.io/#). O site disponibiliza o algoritmo e permite que qualquer pessoa se registre e e anexe uma fotografia e um estilo de pintura e em poucos minutos a arte é disponibilizada.

Durante toda a minha pesquisa, houveram alguns problemas de acesso ao site. Ele ficava fora do ar, não carregava e dava erro. Muitas vezes, tinha que esperar horas para conseguir acessá-lo, sendo isto algo prejudicial para a proposta do site de permitir que qualquer um acesse livremente e crie arte. Na página de recepção no site, tem um passo a passo simplificado e objetivo de como realizar suas próprias criações através da transferência de estilo, o site informa também sobre o limite de tamanho de imagem, que seria de 500 × 500 pixels e que possui uma fila, logo, a criação levaria em torno de 15 minutos. É oferecida a possibilidade de pular essa fila e levar menos de 15 minutos pagando 1,99 euros. Além disso, o site possui três planos de resolução, tendo o plano gratuito uma imagem produto com baixa resolução, pagando 19 euros é possível ter uma imagem com resolução um pouco melhor e pagando 59 euros consegue-se a melhor definição de imagem comparada aos dois planos anteriores. No entanto, acho que seria necessário ter também informações técnicas de como a ferramenta funciona para que todos possam entender mais profundamente sobre o algoritmo criado. Um aspecto interessante do site, além da possibilidade de utilizar a ferramenta, é conseguir ver as artes que outras pessoas desenvolveram e compartilharam no modo público.

Quando tentei fazer uma criação pela primeira vez deu erro, imagino que as imagens que escolhi eram muito pesadas, porém em uma segunda e terceira tentativas, consegui anexar as imagens e a ferramenta criou essa nova obra a partir das minhas escolhas.

Uma das áreas possíveis da transferência de estilo é a transferência de estilo fotográfico,  na qual a imagem de estilo é também uma fotografia. Porém, pensa-se como esse algoritmo conseguiria controlar como a imagem é importada de modo que as linhas retas, por exemplo, continuassem fiéis à fotografia. Além disso, outra área que pode-se incluir na transferência de estilo é a moda. A rede neural profunda na teoria, é capaz de aprender a diferenciar entre tendências mais populares e menos baseadas em elementos simples de vestimenta como bolsos e padrões, dessa forma seria possível transferir o estilo de uma vestimenta para outra. Outra possibilidade que é levantada justamente no site criado por Leon Gatsy, é a criação de um vídeo “desenhado” pelo seu artista favorito. O site diz que este processo é feito através do rastreio dos recursos de imagem ao longo do tempo, de modo a dar continuidade entre os quadros do vídeo. Um exemplo é um vídeo de uma cena da animação A Era do Gelo no estilo de pintura de Vincent Van Gogh. Caso alguém queira utilizar a ferramenta para criar vídeos parecidos com o de baixo, é necessário que pague uma quantia relativa a resolução do vídeo e ao tempo de duração, o que o torna pouco acessível.

Video retirado do site: https://deepart.io/video/

Além desse algoritmo de transferência de estilo, existem outros que também integram arte e inteligência artificial, cada um com um processo, objetivo e resultado específicos. Um desses exemplos é o famoso DeepDream, que apesar deste também utilizar da rede neural profunda e o convolutional neural nets (tipo de rede neural frequentemente utilizada para reconhecimento gráfico), ele identifica e enaltece padrões em imagens, através de algoritmos de pareidolia – fenômeno psicológico em que você percebe padrões familiares onde não existem; como enxergar rostos em carros.

O pesquisador responsável por essa criação, Leon Gatys, acredita que o “Popular Neural Style Transfer Algorithm” é responsável por provocar novos conhecimentos e mudar a forma como as pessoas vêem o mundo e que possam compreender a percepção em sua forma mais crua e real.

Em minha opinião, a transferência de estilo foi uma descoberta incrível que me abriu os olhos para as possibilidades de criação de obras de arte únicas que nos induz a mudar nossa percepção visual do mundo, perceber como o jeito que enxergamos as coisas, as pessoas, o dia a dia pode ser diferente. Isto que estimula nossa criatividade e novas perspectivas de existências, nos faz querer descobrir como nosso lugar favorito poderia ser reformulado e visto de uma forma totalmente nova se um estilo de pintura fosse aplicado a ele. No entanto, não precisamos ficar só no mundo da imaginação de como seria isso, pois os desenvolvedores desse algoritmo disponibilizaram essa oportunidade gratuitamente para qualquer um ter acesso, de forma a estimular ainda mais o desejo de mexer e nós mesmos criarmos uma obra quando quisermos. Os únicos pontos negativos do site em meu olhar, é o erro constante que impossibilita o visitante de acessar o site em alguns momentos, o limite de 500 × 500 pixels por imagem e a falta de aprofundamento do funcionamento do algoritmo.

Bibliografia

1. THE ARTIST IN THE MACHINE. CAMBRIDGE: MIT PRESS, 2019. MILLER, Arthur. Acesso em 19 jan. 2022

2. LEON GATYS. < https://www.linkedin.com/in/leon-gatys-a1a131220 >. Acesso em 19 jan. 2022

3. O QUE SÃO REDES NEURAIS. Pablo de Assis. https://www.tecmundo.com.br/programacao/2754-o-que-sao-redes-neurais-.htm .  Acesso em 19 jan. 2022

4. COMO FUNCIONAM AS REDES NEURAIS DE DEEP LEARNING. <https://ilumeo.com.br/todos-posts/2020/09/13/como-funcionam-as-redes-neurais-de-deep-learning> .  Acesso em 19 jan. 2022

5. INTRODUÇÃO A REDES NEURAIS E DEEP LEARNING. <https://didatica.tech/introducao-a-redes-neurais-e-deep-learning/> .  Acesso em 19 jan. 2022

6. GOOGLE DEEPDREAM: A TECNOLOGIA QUE CRIA AUCINAÇÕES. Edu Fiorin. https://www.showmetech.com.br/google-deepdream-alucinacoes/ .  Acesso em 24 jan. 2022

7. A NEURAL ALGORITHM OF ARTISTIC STYLE. Leon A. Gatys, Alexander S. Ecker, Matthias Bethge . Acesso em 26 jan. 2022

Um comentário sobre “IA e Arte: A percepção visual transformada pela arte do algoritmo de transferência de estilo

Deixe um comentário