Junte-se a nós no dia 9 de novembro para aprender como inovar com sucesso e alcançar a eficiência, aprimorando e escalando desenvolvedores cidadãos no Low-Code/No-Code Summit. Registre-se aqui.
Em um evento de IA do Google esta manhã nos escritórios do Pier 57 da empresa em Nova York, o Google anunciou uma variedade de avanços em inteligência artificial (IA), incluindo IA generativa, tradução de idiomas, IA de saúde e gerenciamento de desastres.
O evento também se concentrou fortemente em uma discussão sobre seus esforços para construir uma IA responsável, particularmente relacionada a controle e segurança, ajudando a identificar IA generativa e “construindo para todos”.
“Vemos tantas oportunidades pela frente e estamos comprometidos em garantir que a tecnologia seja construída para ajudar as pessoas, como qualquer tecnologia transformacional”, disse o CEO do Google, Sundar Pichai, em um vídeo compartilhado com os participantes, no qual o evento deveria “Reimagine como a tecnologia pode ser útil na vida das pessoas.”
Além disso, Pichai apontou os riscos e desafios que acompanham a IA. “É por isso que o Google está focado na IA responsável desde o início, publicando princípios de IA que priorizam a segurança e a privacidade das pessoas sobre qualquer outra coisa”, disse ele.
Evento
Cúpula Low-Code/No-Code
Aprenda como Bconstrua, dimensione e governe programas low-code de uma maneira direta que cria sucesso para todos neste 9 de novembro. Rcadastre-se para o seu passe livre hoje.
Registre-se aqui
Google lança Imagen Video — combinação Phenaki
Douglas Eck, cientista principal do Google Research e diretor de pesquisa do Brain Team do Google, compartilhou uma variedade de anúncios de IA generativa do Google, incluindo seus esforços cautelosos e lentos (comparados ao DALL-E 2 ou Stability AI) para liberar seu texto para imagem Sistemas de IA.
Embora o Google Imagen ainda não esteja disponível ao público, a empresa anunciou que adicionará uma forma limitada dele ao seu aplicativo AI Test Kitchen (que este ano mostrou o LaMDA) como uma maneira de coletar feedback antecipado. A empresa exibiu uma demo chamada City Dreamer na qual os usuários podem gerar imagens de uma cidade projetada em torno de um tema, como, digamos, abóboras.
Além disso, com base em seu trabalho de texto para vídeo anunciado no mês passado, o Google compartilhou a primeira renderização de um vídeo que compartilha as duas abordagens complementares de pesquisa de texto para vídeo da empresa – Imagen Video e Phenaki. O resultado combina a capacidade da Phenaki de gerar vídeo com uma sequência de prompts de texto com os detalhes de alta resolução do Imagen.
“Acho incrível que possamos falar sobre contar histórias longas como essa com vídeo de super-resolução, não apenas de um prompt, mas de uma sequência de prompts, com uma nova maneira de contar histórias”, disse Douglas Eck, cientista principal da Pesquisa do Google e diretor de pesquisa do Brain Team do Google, acrescentando que estava animado sobre como cineastas ou contadores de histórias em vídeo poderiam fazer uso dessa tecnologia.
Outros avanços generativos de IA
No espaço do texto, Eck também discutiu o mecanismo de diálogo LaMDA e o Wordcraft Writers Workshop, que desafiou autores profissionais a escrever ficção experimental usando o LaMDA como ferramenta.
O Google lançará em breve um trabalho de pesquisa sobre isso, disse Eck.
“Uma descoberta clara é que usar o LaMDA para escrever histórias completas é um beco sem saída”, disse ele. “É mais útil usar LaMDA para adicionar tempero.” A interface do usuário também precisa estar correta, acrescentou, servindo como um “editor de texto com um propósito”.
Eck também destacou os esforços do Google para usar a IA para gerar código, bem como a pesquisa recentemente introduzida do AudioLM que – sem a necessidade de uma partitura musical – estende o áudio de qualquer clipe de áudio inserido – e o DreamFusion, o recém-anunciado text-to- Renderização 3D que combina o Imagen com os recursos 3D do NeRF.
“Nunca vi tantos avanços no espaço generativo, o ritmo é realmente incrível”, disse ele.
Google está construindo um tradutor de fala universal
Depois de analisar uma variedade de avanços do Google na pesquisa de IA de idiomas, o líder do Google Brain, Zoubin Ghahramani, anunciou o esforço da empresa para refletir a diversidade dos idiomas do mundo e uma tentativa ambiciosa de construir um modelo que suporte os 1.000 principais idiomas do mundo.
Além disso, o Google diz que está construindo um modelo de fala universal treinado em mais de 400 idiomas, com a alegação de que é a “maior cobertura de modelo de linguagem vista em um modelo de fala hoje”.
Todos esses esforços “serão uma jornada de vários anos”, disse ele. “Mas este projeto estabelecerá uma base crítica para tornar a IA baseada em linguagem realmente útil para todos.”
Um forte foco na IA responsável
Após os anúncios de IA, que também incluíram Marian Croak, vice-presidente de engenharia do Google, e James Manyika, vice-presidente sênior do Google-Alphabet, discutiram o foco do Google na IA responsável.
“Acho que se vamos ser líderes, é extremamente importante que impulsionemos o estado da arte em tecnologia de IA responsável”, disse Croak. “Sou apaixonado por querer descobrir maneiras de fazer as coisas funcionarem na prática.”
O Google faz testes adversários “constante e continuamente”, disse ela. “Então, também nos certificamos de que estamos definindo um conjunto de benchmarks quantitativos e que podem ser medidos e verificados em todas as dimensões de nossa IA. Então, também fazemos isso de forma contínua.”
A missão do VentureBeat é ser uma praça digital para os tomadores de decisões técnicas adquirirem conhecimento sobre tecnologia empresarial transformadora e realizarem transações. Conheça nossos Briefings.
Fonte: venturebeat.com