A marca d’água SynthID do Google DeepMind detecta imagens geradas por IA

A equipe do Google DeepMind passou anos construindo melhores ferramentas generativas de IA, na esperança de construir ferramentas melhores para descobrir o que a IA criou. Existem muitas razões óbvias e de alto risco, diz Demis Hassabis, CEO do Google DeepMind. “Cada vez que falamos sobre isso e outros sistemas, perguntamos: ‘E quanto ao problema dos deepfakes?’” Hassabis diz que com outra temporada eleitoral controversa se aproximando nos EUA e no Reino Unido em 2024, eles estão desenvolvendo sistemas para detectar e detectar IA imagens. O mais importante o tempo todo.

Hassabis e sua equipe têm trabalhado em uma ferramenta nos últimos anos, que o Google está lançando publicamente hoje. Chama-se SynthID e foi projetado para marcar uma imagem gerada por IA de uma forma invisível ao olho humano, mas facilmente detectada por uma ferramenta de detecção de IA dedicada.

Hassabis diz que a marca d’água está embutida nos pixels da imagem, mas não altera a imagem de forma perceptível. “Isso não muda a imagem, a qualidade da imagem ou a experiência dela”, diz ele. “Mas é robusto para muitas mudanças – corte, redimensionamento, todas as coisas que você pode fazer para contornar marcas d’água simples, normais e tradicionais.” À medida que os modelos subjacentes do SynthID melhoram, diz Hassabis, a marca d’água se tornará menos perceptível para os humanos, mas mais facilmente detectada pelas ferramentas do DeepMind.

Tecnologias como Hassabis e Google DeepMind são essenciais por enquanto. Até mesmo a postagem do blog de lançamento é escassa em detalhes, já que o SynthID ainda é um sistema relativamente novo. “Quanto mais você revela sobre como funciona, mais fácil será para hackers e empresas mal-intencionadas se locomoverem”, diz Hassabis. O SynthID está sendo lançado pela primeira vez com foco no Google: os clientes do Google Cloud que usam a plataforma Vertex AI da empresa e o gerador de imagens Imagen podem incorporar e detectar marcas d’água. À medida que o sistema for testado no mundo real, Hassabis espera que melhore. Depois disso, o Google poderá usá-lo em mais lugares, compartilhar mais sobre como funciona e obter mais dados sobre como funciona.

READ  Mais 2.500 voos cancelados na terça-feira

As ferramentas SynthID do Google permitem saber a probabilidade de uma imagem gerada por IA.
Imagem: Google

Em última análise, Hassabis espera que o SynthID possa se tornar um padrão para toda a web. As ideias básicas também podem ser aplicadas a outras mídias, como vídeo e texto. Depois que o Google provar a tecnologia, “a questão é escaloná-la, compartilhá-la com outros parceiros que a desejem, depois dimensionar a solução para o consumidor – e então discutir com a sociedade civil sobre onde queremos levar isso”. Ele reitera que este é um teste beta, uma primeira tentativa de algo novo, e “não uma solução mágica para um profundo problema de falsificação”. Mas ele claramente acha que poderia ser enorme.

É claro que o Google não é a única empresa com esta ambição específica. Distante. No mês passado, Meta, OpenAI, Google e muitos outros grandes nomes da IA ​​prometeram construir sistemas adicionais de segurança e proteção para sua IA. Muitas empresas estão trabalhando com um protocolo chamado C2PA, que usa metadados criptográficos para codificar conteúdo gerado por IA. O Google está, de muitas maneiras, tentando se atualizar com todas as suas ferramentas de IA, incluindo a detecção. E parece que vamos conseguir Muitos padrões de diagnóstico de IA Antes de pegar aqueles que realmente funcionam. Mas Hassabis acredita que a marca d’água pode ser pelo menos parte da resposta na Internet.

O Google não é a única empresa com essa ambição específica – longe disso

SynthID está sendo lançado durante a conferência Cloud Next do Google, onde a empresa apresentará novos recursos nos produtos Cloud e Workspace do Google para seus clientes empresariais. O CEO do Google Cloud, Thomas Kurian, diz que o uso da plataforma Vertex AI está explodindo: “Os modelos estão ficando cada vez mais sofisticados e tivemos um declínio enorme, enorme no número de pessoas que usam os modelos”. Esse crescimento, juntamente com os avanços no sistema SynthIT, fizeram Gurion e Hassabis perceberem que era hora de começar.

READ  Fontes - Patriots readquirem CB JC Jackson dos Chargers

Os clientes certamente se preocupam com deepfakes, diz Kurian, mas também têm necessidades mais mundanas de detecção de IA. “Temos muitos clientes que usam essas ferramentas para criar imagens para textos publicitários e querem verificar a imagem original porque muitas vezes o departamento de marketing tem uma equipe central que cria a imagem original. O varejo é outro grande problema: alguns varejistas estão usando ferramentas de IA para criar descrições para seus grandes catálogos de produtos e precisam garantir que as fotos dos produtos que carregam não se misturem com as imagens criadas que usam. Brainstorming e objetivos iterativos. (Você provavelmente já está vendo descrições geradas pelo DeepMind como esta em sites de varejo e curtas do YouTube.) Elas não são tão importantes quanto fotos falsas de Trump ou um Papa arrogante. Estas são as formas pelas quais a IA já está aparecendo no dia a dia dos negócios.

Uma coisa que Kurian diz que está procurando quando o SynthID for lançado é: além do sistema, você sabe, funciona — Como e onde as pessoas desejam usá-lo. Ele acredita firmemente que o Apresentações e o Documentos precisarão da integração do SynthID. “Ao usar slides, você precisa saber de onde está tirando as imagens.” Mas onde mais? Hassabis sugere que o SynthID poderia eventualmente ser oferecido como uma extensão do Chrome ou integrado ao navegador para que possa identificar imagens geradas na web. Mas digamos que sim: a ferramenta deve sinalizar preventivamente tudo o que pode ser gerado ou aguardar alguma consulta do usuário? Um grande triângulo vermelho é a maneira certa de dizer “é feito com IA” ou deveria ser mais sutil?

O SynthID pode eventualmente ser oferecido como uma extensão do Chrome ou integrado ao navegador para que possa identificar imagens geradas na web.

READ  Morgan Stanley substitui James Corman por Ted Pick como CEO

Kurian diz que eventualmente poderá haver várias opções de experiência do usuário. Enquanto a tecnologia subjacente continuar a funcionar, os utilizadores podem escolher exactamente como querem que ela apareça, avalia ele. Pode até variar de acordo com o tópico: você pode não se importar muito se os planos de fundo dos slides que você usa são criados por humanos ou por IA, mas “se você estiver escaneando tumores em hospitais, você quer ter certeza de que não é um tipo de. Uma imagem criada artificialmente.”

O lançamento de qualquer ferramenta de detecção de IA certamente será o início de uma corrida armamentista. Em muitos casos, falhou: a OpenAI já abandonou a sua própria ferramenta de detecção de texto chatbot ChatGPT. Se o SynthID se popularizar, incentivará hackers e desenvolvedores a encontrar formas criativas de contornar o sistema, forçando o Google DeepMind a melhorá-lo. Hassabis diz com um pouco de resignação que a equipe está preparada para isso. “É provavelmente uma solução direta que precisamos atualizar”, diz ele, “antivírus ou algo parecido. É preciso estar sempre atento a um novo tipo de ataque e a um novo tipo de mudança.

Por enquanto, este é um problema rebuscado, já que o Google controla todo o sistema inicial de geração, uso e detecção de imagens de IA. Mas a DeepMind o construiu pensando em toda a Internet, e Hassabis diz que está pronta para a longa jornada para levar o SynthID a todos os lugares. Mas então ele se recupera – uma coisa de cada vez, diz ele. “É prematuro pensar na expansão e nas discussões da sociedade civil até que demonstremos que a base da tecnologia funciona”. Esse foi o primeiro trabalho e a razão pela qual o SynthID está sendo lançado agora. Se o SynthID ou algo parecido realmente funcionar, podemos começar a descobrir o que isso significa para a vida online.

Leave a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Scroll to Top