No final da conferência anual de desenvolvedores do Google, I/O, no Shoreline Amphitheatre em Mountain View, o CEO do Google, Sundar Pichai, revelou que a empresa disse “AI” 121 vezes. Esse foi, essencialmente, o ponto crucial da palestra de duas horas do Google – infundir IA em todos os aplicativos e serviços do Google usados por mais de dois bilhões de pessoas em todo o mundo. Aqui estão todas as principais atualizações anunciadas pelo Google no evento.
Atualizações para Gemini 1.5 Flash e Gemini 1.5 Pro
O Google anunciou um novo modelo de IA chamado Gemini 1.5 Flash, que afirma ser otimizado para velocidade e desempenho. O flash fica entre o Gemini 1.5 Pro e o Gemini 1.5 Nano, que é o modelo menor da empresa no mercado interno. O Google disse que criou o Flash com algumas das coisas que diferenciam o Gemini Pro dos modelos concorrentes, como uma janela de contexto mais longa de um milhão de tokens, já que os desenvolvedores queriam criar aplicativos e serviços baseados em IA para torná-lo um modelo mais leve e menos caro. do que o Gemini Pro. Ainda este ano, o Google duplicará a janela de contexto do Gemini para dois milhões de tokens, o que significa que pode processar simultaneamente duas horas de vídeo, 22 horas de áudio, mais de 60.000 linhas ou mais de 1,4 milhão de palavras. .
Projeto Astra
Enquanto o Google exibia o Projeto Astra, uma versão inicial de um assistente universal alimentado por IA, o CEO da DeepMind do Google, Temis Hassabis, disse que a versão do Google de um agente de IA “será útil na vida cotidiana”.
Em um vídeo que o Google diz ter sido filmado em uma única tomada, um usuário do Astra anda pelo escritório do Google em Londres segurando seu telefone e apontando a câmera para várias coisas – o alto-falante, alguns símbolos em um quadro branco e para fora de uma janela – e o que parece ser uma conversa natural com o aplicativo. Em um dos momentos mais interessantes do vídeo, ele informa à usuária exatamente onde ela colocou os óculos antes, sem precisar pegá-los.
O vídeo termina com uma reviravolta – quando o usuário encontra e usa os óculos perdidos, ficamos sabendo que eles possuem um sistema de câmera interno e a capacidade de conversar perfeitamente com o usuário usando o Projeto Astra. Um concorrente dos óculos inteligentes Ray-Ban da Meta.
Pergunte ao Google Fotos
O Google Fotos já era inteligente quando se tratava de pesquisar imagens ou vídeos específicos, mas com a IA, o Google está levando as coisas para o próximo nível. Se você for assinante do Google One nos EUA, poderá fazer uma pergunta complicada ao Google Fotos, como “Mostre-me a melhor foto de cada parque nacional que visitei”, quando o recurso for lançado no próximo poucos meses. O Google Fotos usa informações de GPS e determina o que é “melhor” para lhe dar opções
Vio e Imagem 3
Os novos mecanismos de criação de mídia baseados em IA do Google são chamados Veo e Imagen 3. Veo é a resposta do Google ao Sora da OpenAI. O Google disse que pode criar vídeos 1080p de “alta qualidade” que duram “mais de um minuto” e pode compreender conceitos cinematográficos como lapsos de tempo.
A Imagem 3, por sua vez, é um gerador de texto para imagem que, segundo o Google, lida com texto melhor do que seu antecessor, a Imagem 2. O resultado é o modelo de texto para imagem da mais alta qualidade da empresa, “níveis incríveis de detalhes”, imagens brilhantes e realistas “e menos artefatos – essencialmente comparando-o com o DALLE-3 da OpenAI.
Grandes atualizações na Pesquisa Google
O Google está fazendo grandes mudanças na forma como opera nos termos de pesquisa. A maioria das atualizações anunciadas hoje inclui a capacidade de fazer perguntas mais complexas (“Encontre os melhores estúdios de ioga ou pilates em Boston e mostre detalhes sobre suas ofertas introdutórias e tempos de caminhada em Beacon Hill”) e use a pesquisa para planejar refeições e férias. ‘Não disponível até que você opte pelo Search Labs, a plataforma da empresa que permite que as pessoas experimentem recursos experimentais.
Mas um grande novo recurso que o Google chama de sobreposições de IA e que a empresa vem testando há um ano está finalmente sendo lançado para milhões de pessoas nos EUA. A Pesquisa Google agora retornará respostas geradas por IA no topo dos resultados por padrão, e a empresa afirma que levará o recurso para mais de um bilhão de usuários em todo o mundo até o final do ano.
Gêmeos no Android
O Google integra o Gemini diretamente no Android. Quando o Android 15 for lançado ainda este ano, o Gemini estará ciente do aplicativo, imagem ou vídeo que você está executando e você poderá acessá-lo e fazer perguntas contextuais. Onde fica o Google Assistente que já faz isso? Quem sabe! O Google não tocou no assunto durante a palestra de hoje.
Houve algumas outras atualizações também. O Google disse que adicionará marcas d’água digitais a vídeos e textos gerados por IA, tornará o Gemini acessível em um painel lateral no Gmail e no Docs e adicionará uma equipe virtual de IA ao local de trabalho que ouvirá chamadas telefônicas e detectará se você está realmente sendo escamado. Tempo e muito mais.
Fique por dentro de todas as novidades do Google I/O 2024 Aqui!