Gemini - BlipX

Google apresenta Gemini 2.0, sua atualização em inteligência artificial generativa

O Google lançou no início desta semana a sua mais recente atualização no campo da inteligência artificial generativa, o Gemini 2.0, que chega com a promessa de avanços significativos na multimodalidade, permitindo a interpretação e uso de dados em diferentes formatos, como texto, imagens e vídeos.

Sundar Pichai, CEO do Google, destacou a ampliação dos recursos do modelo, que agora inclui a geração nativa de imagens e áudios e a integração de ferramentas voltadas para criar agentes de IA mais sofisticados. “Nosso objetivo está mais próximo: um assistente universal que transforme como interagimos com a tecnologia”, afirmou em comunicado.

O Gemini 2.0 está disponível para desenvolvedores e parceiros selecionados, e sua integração aos produtos do Google, como a Busca, é esperada nos próximos meses.

Principais recursos do Gemini 2.0

Gemini 2.0 Flash

Uma versão experimental do modelo que permite aos usuários criar e editar imagens ou gerar textos em estilos variados. É uma solução voltada para usuários que necessitam de flexibilidade criativa com eficiência.

Projeto Astra

Descrito como um protótipo de pesquisa para um possível “assistente universal de IA”, o Projeto Astra combina imagens, vídeos e voz em uma linha do tempo de eventos. A integração com o Gemini 2.0 promete conversas mais naturais e recuperação de informações eficiente.

Projeto Mariner

Este produto é projetado para compreender e processar informações diretamente da tela do navegador. A proposta é transformá-las em instruções capazes de treinar modelos de IA que auxiliam em tarefas personalizadas.

Projeto Jules

Voltado para desenvolvedores, o Jules é um agente de código experimental que utiliza IA para resolver problemas de programação, incluindo a identificação e solução de bugs e desafios complexos de codificação.

Deep Research

Uma das grandes novidades é a capacidade de realizar pesquisas aprofundadas sobre tópicos complexos. O Deep Research utiliza IA avançada para explorar conteúdos extensos, gerando relatórios detalhados com análises abrangentes.

Futuro da integração com produtos Google

O lançamento do Gemini 2.0 é um marco no desenvolvimento de inteligência artificial pelo Google, marcando sua liderança na corrida por soluções inovadoras e integradas. Nos próximos meses, a tecnologia será gradualmente incorporada a produtos como a Busca e potencialmente estendida a outros serviços da Big Tech.

A atualização reforça a visão do Google em oferecer ferramentas que não apenas aprimorem a produtividade, mas também ampliem as possibilidades criativas e analíticas para indivíduos e empresas.

Google anuncia pacote de novidades para Android 15 e dispositivos Pixel

A partir de hoje, usuários de dispositivos Android e Pixel começam a receber as primeiras atualizações trimestrais do Android 15. Entre os destaques, estão legendas aprimoradas, melhorias no assistente Gemini e no app Lookout, além de atualizações exclusivas para a linha Pixel, com funcionalidades específicas para o Pixel 9.

Principais novidades do Android

As Expressive Captions, ou Capções Expressivas, agora incluem descrições detalhadas de momentos não falados, como [suspiro] ou [aplausos]. Essas legendas estão disponíveis em qualquer lugar onde o recurso de legendas para vídeos pode ser acessado, incluindo aplicativos de redes sociais e mensagens de vídeo.

O app Lookout, voltado para pessoas com deficiência visual, agora utiliza o modelo Gemini 1.5 na funcionalidade Image Q&A. Isso permite descrições mais precisas e detalhadas de fotos tiradas ou abertas no aplicativo, expandindo o esforço da Google de trazer IA avançada para soluções de acessibilidade.

O Assistente Gemini traz novas extenções para Spotify (agora o assistente Gemini pode reproduzir músicas diretamente do Spotify, um recurso básico que ainda estava ausente) e pode ainda realizar ações como fazer chamadas, enviar e-mails e alterar configurações do telefone, aproximando-se das funcionalidades do Google Assistente tradicional.

Essas funções variam conforme o dispositivo e a versão do Android.

Recursos Exclusivos para Dispositivos Pixel

A série Pixel 9 recebe uma série de funcionalidades exclusivas:

Triagem de Chamadas:
- Sugestões contextuais de resposta enquanto o assistente atende a chamada, permitindo responder rapidamente sem precisar atender diretamente.
App de Capturas de Tela (Screenshots):
- Circle to Search: Opção de salvar pesquisas diretamente no app de capturas de tela.
- Gboard: Sugestões de frases baseadas no conteúdo salvo no Screenshots.
- Integração com Google Wallet: Permite salvar capturas de ingressos ou cartões diretamente no app de Screenshots.

Os modelos Pixel 6 e superiores recebem o recurso Identity Check, que exige autenticação adicional ao acessar configurações sensíveis em novos locais.

As atualizações começam a ser distribuídas hoje para dispositivos Android 15 e modelos Pixel 6 ou superiores. Verifique a compatibilidade do seu dispositivo para acessar as novas funcionalidades.

Publicadas novas informações sobre a IA na LLM Siri

A Apple está preparando uma transformação significativa na Siri, integrando inteligência artificial avançada que a tornará mais semelhante ao ChatGPT, da OpenAI, e ao Gemini Live, do Google, segundo informações de Mark Gurman, da Bloomberg. A nova versão, apelidada de “LLM Siri” (Large Language Model Siri), será alimentada por modelos de IA desenvolvidos pela Apple, prometendo interações mais naturais e conversacionais.

Novas capacidades da Siri

O objetivo da Apple é expandir as funcionalidades da Siri para torná-la mais útil em tarefas complexas. Entre as melhorias planejadas estão:

Interação com aplicativos de terceiros: com capacidades ampliadas de usar App Intents, a Siri poderá interagir de maneira mais profunda com apps externos.
Criação e resumo de textos: a integração da Apple Intelligence permitirá que a Siri resuma conteúdos e escreva textos, funções antes restritas a modelos de IA dedicados.

Cronograma de Lançamento

Embora as primeiras novidades possam ser anunciadas já em 2025, a substituição completa do sistema subjacente da Siri está prevista para a primavera de 2026. Isso marca uma mudança significativa na abordagem da Apple, que historicamente avança com mais cautela em relação à implementação de IA.

Diferenciação do ChatGPT e outros concorrentes

Craig Federighi, vice-presidente sênior de software da Apple, destacou em entrevista recente ao The Wall Street Journal que a Siri, mesmo com IA avançada, continuará focada em oferecer suporte local e funcionalidades práticas. Federighi observou que, enquanto ferramentas como o ChatGPT são excelentes para consultas complexas, como escrever poemas sobre mecânica quântica, a Siri se destaca em ações do dia a dia, como enviar mensagens ou abrir a garagem.

Ele explicou:
“Há um espectro de capacidades e trade-offs aqui. Essas tecnologias irão convergir, mas a Siri continuará a oferecer utilidades rápidas e locais.”

Avanços recentes e futuro

A Apple tem adotado uma abordagem mais gradual na integração de IA. No mês passado, a empresa adicionou um recurso de ChatGPT à Siri no beta do iOS 18.2. Outros avanços programados incluem a habilidade da Siri de interpretar conteúdos na tela e realizar ações dentro de aplicativos, funcionalidades esperadas para o próximo ano.

Impacto e expectativas

A nova Siri promete colocar a Apple em pé de igualdade com concorrentes no setor de assistentes virtuais, ao mesmo tempo em que mantém a privacidade e a performance local como diferenciais. Essa evolução não apenas reforça o papel da Siri no ecossistema da Apple, mas também sinaliza o compromisso da empresa em liderar a integração de IA de maneira estratégica e centrada no usuário.

Google Workspace permitirá criação de imagens de apoio através de IA

O Google Workspace está lançando um gerador de imagens com IA baseado na tecnologia Gemini, integrado diretamente ao Google Docs. Esse recurso permite criar rapidamente visuais para documentos, funcionando essencialmente como uma ferramenta de clip art. A funcionalidade segue os passos do recurso de arte gerada por IA que a Microsoft já oferece em seus produtos do Office.

O gerador de imagens no Google Docs já está disponível para alguns usuários com contas pagas do Workspace que incluem os add-ons Gemini Business, Enterprise, Education, Education Premium ou Google One AI Premium. Para utilizar, basta acessar o menu: Inserir > Imagem > Ajude-me a criar uma imagem. Isso abrirá uma barra lateral onde é possível descrever a imagem desejada e escolher o estilo artístico, como “Fotografia” ou “Esboço”.

Além disso, o gerador oferece opções de proporções, permitindo criar imagens quadradas, horizontais ou verticais para se adequar ao layout do documento. Há também suporte para imagens de capa em tela cheia em documentos sem margens.

A funcionalidade utiliza o Imagen 3, o mais recente modelo de geração de imagens da Google, que promete maior detalhamento, iluminação aprimorada e menos artefatos visuais em comparação às versões anteriores. No ano passado, o Google Slides já havia recebido um gerador de slides integrado, alimentado pelas ferramentas de IA Duet.

O recurso tem prazo de até deve estar disponível para todos os usuários até 16 de dezembro.

Google expande o controle de Google Home com nova extensão no app Gemini

A Google está integrando uma extensão do Google Home ao aplicativo Gemini, permitindo que os usuários controlem seus dispositivos inteligentes enquanto interagem com o assistente de IA. A atualização, disponível para usuários Android no programa de pré-visualização pública do Google Home, permite comandos de linguagem natural, como “Prepare a sala de jantar para uma noite romântica” para ajustar a iluminação, ou “Ajude a limpar a cozinha” para ligar o aspirador.

Anteriormente, ao tentar controlar a casa inteligente pelo app Gemini, ele abria o Google Assistant. Agora, com a extensão do Google Home, os usuários podem controlar luzes, climatização, persianas, TVs, alto-falantes e mais diretamente pelo Gemini.

Contudo, nem todos os dispositivos inteligentes são suportados. Para dispositivos de segurança, como câmeras, fechaduras, portões e portas, a extensão direciona os usuários para o app Google Home. Além disso, a nova funcionalidade não executa rotinas.

Enquanto isso, a Amazon está trabalhando em comandos de linguagem natural para a Alexa e já lançou uma prévia com alguns elementos dessa atualização, mas uma reformulação completa deve ocorrer apenas no próximo ano. A Apple, por outro lado, planeja melhorias no Siri com a Apple Intelligence, mas ainda não integrou o assistente a funções de casa inteligente.

Para acessar a nova extensão do Google Home, é necessário participar do programa de pré-visualização pública do Google Home e utilizar o recurso em inglês. Os usuários devem fazer login no app Gemini com a mesma conta do Google Home e podem pedir ações específicas, como “ligue as luzes da sala de estar.” Se a extensão não for usada automaticamente, pode ser necessário incluir “@Google Home” no comando.