Pular para o playerIr para o conteúdo principalPular para o rodapé
  • anteontem
Transcrição
00:00E como não poderia deixar de ser hora de repercutir esse assunto com a nossa coluna semanal Fala Aí!
00:14E vamos receber Roberto Pena Spinelli, que é físico pela USP, com especialidade em Machine Learning por Stanford e colunista aqui do Olhar Digital.
00:26Vamos receber o Pena aqui nos nossos estúdios. Olha, o Pena com um cenário diferentão hoje. Vai escalar, Pena? Estou vendo uma corda ali atrás, parece que vai fazer alpinismo. Boa noite! Bem-vindo, querido!
00:38Tudo bem, Marida? Eu adoraria escalar hoje, mas não posso. Na verdade, esse aqui é o nosso cenário, aqui da Caramelo Biônico, que é a minha empresa que desenvolve coisas com inteligência artificial.
00:49Estou fazendo, hoje eu estou nesse cenário porque eu estou fazendo um pouco de hora essa aqui. Estou terminando de editar um vídeo que vai, inclusive, ao ar amanhã.
00:55Então, para quem tiver curiosidade aí de ver um vídeo sobre amanhã, vai estar lá no Caramelo Biônico.
01:02Mas, enfim, vamos falar do que interessa, Marisa. Vamos falar sobre essa nova questão da OpenAI, que está aí. Vai dar o documento da OpenAI, Marisa?
01:10Pois é, pois é. E aí trouxe algumas informações, digamos, em primeira mão de quais são os projetos, não é, da OpenAI.
01:20Mas até eu queria que você falasse aqui com a gente, Pena, sobre esses planos futuros da OpenAI, se eles são muito ambiciosos
01:28ou se realmente eles são factíveis, podem sair do papel. E mais, se os usuários vão adotar esse estilo de vida, digamos assim,
01:37com esse assistente pessoal tão próximo do nosso dia a dia.
01:42Primeira coisa a notar, então, que de fato parece que a OpenAI foi construindo passo a passo seus recursos
01:49para chegar nesse ponto de ter esse super assistente, né? Não sei como que a gente pode chamar.
01:54Então, primeiro que a gente viu os modelos de raciocínio, que são aqueles capazes de fazer tarefas mais complexas,
01:59com planejamento, né? Um pouco que não é só aquela resposta rápida, podem pensar a respeito.
02:05Depois a gente viu os modelos multimodais, que eles podem ter texto, imagem, áudio, vídeo.
02:12Isso é essencial para você ter um assistente na sua vida, que vai poder compartilhar em vários sentidos com você.
02:18Depois a gente viu também a memória de longo prazo, Marisa, que é uma tecnologia fundamental
02:23para que você tenha alguém útil na sua vida.
02:25A pessoa tem que lembrar tudo que ela vai tendo na sua vida, esse assistente,
02:29tem que ir recolhendo informações do seu cotidiano, do que você faz, de quem é você, etc., para ser útil.
02:35Então, quando a gente viu essas três tecnologias sendo lançadas aí meses a meses,
02:40então agora parece que eles desvendaram o seu grande plano,
02:43o seu plano aí maquiavérico de dominar o mundo, será?
02:45Que é, então, dar esse super assistente, alguém que vai estar permeando a sua vida,
02:52que vai poder fazer meio que tudo para você, tudo intelectual junto com você,
02:57desde fazer uma lista de mercado, fazer um exercício de academia,
03:02dar um prognóstico, te dar informações úteis quando você precisa, resolver alguma coisa do seu trabalho,
03:08enfim, é isso que eles estão dizendo.
03:09Mas também vêm grandes desafios, Marisa.
03:12Eu não acho que é tão fácil, não.
03:14Primeiro é que vai precisar de muita energia e muito processamento,
03:17porque aí você vai ter alguém que vai estar meio que o tempo todo recebendo informações de você,
03:22compartilhando com você.
03:24Alguém que vai poder estar acessando, digamos, a sua informação em tempo real.
03:29Então, isso aí já acho que vai faltar,
03:32porque a própria OpenAI já está reclamando que está faltando processamento
03:35para atender os pedidos normais.
03:37Imagina quando estiver escalando para esse super ultra assistente.
03:41E outra coisa é que vai faltar um corpo também,
03:43porque será que o celular é esse corpo?
03:47Você tem que estar carregando isso o tempo todo,
03:49mas o celular é sempre uma coisa meio inconveniente,
03:51tem que tirar, abrir a câmera, fazer não sei o quê.
03:55E aí, Marisa, eu acho que a gente conseguiu umas pistas do que está por vir,
03:59porque a OpenAI recentemente comprou uma empresa
04:01que é do designer do iPhone.
04:04Então, o designer do iPhone que trabalhava na Apple,
04:07ele saiu, faz um tempo, fundou uma nova empresa de dispositivos físicos
04:12que meio que revolucionários.
04:15A OpenAI comprou essa empresa, chama Love From I.O.
04:19O nome do cara, se eu não me engano, é Jeff Ivey,
04:24eu acho que esse é o nome dele,
04:26ou Johnny Ivey é o nome do CEO.
04:28E agora, parece que a OpenAI quer lançar um novo dispositivo,
04:34não vai ser um celular, vai ser uma coisa, sei lá,
04:35que você vai prender no pescoço, que você vai, não sei,
04:38que vai talvez embarcar essa IA toda para ser esse super assistente.
04:43Tudo isso, Marisa, são muitos desafios pela frente, né?
04:47Mas do jeito que a OpenAI está realmente comprometida e está jogando tudo,
04:51talvez a gente vai ver o documento vazado dizer que é a meta do primeiro semestre agora,
04:58desse ano, de 2025.
04:59Eu acho que não chega, mas quem sabe chega até o final do ano
05:03a gente tenha, digamos, esse super assistente.
05:06Não sei.
05:06Pois é, isso imaginando uma grande escala ainda, né, Pena?
05:10Porque se é um projeto de fazer parte da vida como um assistente pessoal,
05:14imagina-se que vai incorporar a vida de muita gente.
05:17Praticamente todo mundo que usa ali um celular vai querer ter o seu assistente.
05:22Aí precisa saber realmente a capacidade de entrega disso, né?
05:27Bom, vamos acompanhar para ver se esse vazamento se consolida nesse ano ainda.
05:32Agora, Pena, vamos para um outro tema que é uma tecnologia recém-lançada
05:37que a Eleven Labs trouxe uma nova inteligência artificial
05:41que é voltada para conversas.
05:44O que ela traz de novidade? Conta para a gente.
05:47É legal que a Eleven Labs está aparecendo aqui.
05:51Normalmente ela não aparece em uma dessas empresas que a gente sempre fala, né?
05:54Não é uma big tech, enfim.
05:56Mas ela cavou um nicho muito específico, Marisa.
05:59Então ela se especializou em voz, em sintetizador de voz,
06:02gerar vozes realistas, gerar vozes que realmente clonagem de voz.
06:07Então muitas pessoas acabaram usando os recursos para, digamos,
06:11uma pessoa como eu que faz conteúdo.
06:13Então a pessoa fala assim, eu vou ter que ficar narrando meus textos o tempo todo?
06:17Eu vou treinar a minha voz.
06:18E aí eu ponho o roteiro, a voz fala por mim.
06:22Seria, por exemplo, um uso.
06:23Mas tem vários usos diversos para as pessoas que são de vozes que falam.
06:28Então a Eleven Labs se especializou nisso.
06:30Mas agora ela está vindo com uma novidade.
06:32Ela está entrando também para entregar o modelo conversacional.
06:35Então não é só a voz.
06:36Eu entrego também a inteligência junto.
06:39Claro que ela integra isso de outras, né?
06:40Gemini, OpenAI, etc.
06:42Mas o que ela está entregando?
06:44Então o modelo avançado de voz deles é melhor do que o que a gente tem,
06:49por exemplo, na OpenAI ou no Gemini.
06:51Por quê?
06:53Porque para quem usa esse modelo sabe que se você está conversando e de repente dá uma hesitada,
06:57digamos que eu estou lá pedindo uma informação,
06:59ah, hoje eu quero saber sobre, aí eu estou tentando buscar na minha cabeça o que eu quero saber.
07:04A resposta já vem toda errada, porque o modelo, a inteligência artificial não ouviu você até o fim.
07:11Ela não conseguiu sacar que a sua informação ainda estava esperando, hesitando.
07:15É normal uma conversa com humanos?
07:16O humano esperaria, né?
07:18Se eu estou conversando com alguém, a pessoa não vai me interromper no meio e falar
07:21ela sabe que está precisando de mais informação que eu estou buscando na mente.
07:24Então isso é o diferencial que agora a Eleven Lab está trazendo.
07:27O modelo esperto o suficiente para saber que, opa, você está hesitando?
07:30Vou esperar um pouco mais, vou ficar aguardando aqui para pegar a informação.
07:34Mas tem outras coisas legais também que esse modelo dá.
07:36Então a outra é você poder colocar várias vozes diferentes numa mesma conversa.
07:41Então isso pode ser útil.
07:42Você está gravando um podcast que você tem várias pessoas ou, sei lá, um filme
07:46que você precisa de vários atores.
07:48Eu não sei o que as pessoas vão querer fazer com isso.
07:50Então assim, você pode jogar várias vozes na mesma conversa.
07:53Isso é bem legal.
07:54Ele detecta automaticamente idioma também.
07:56Então se você começa a falar em outra língua, você não precisa passar informação nenhuma.
08:00Já automaticamente esse modelo de voz, de conversa, já muda para outra língua.
08:04E também ele faz o que a gente chama de RAG interno,
08:07que é um sistema de você passar informações específicas.
08:09Digamos que você é um médico, você tem uma empresa, ou sei lá, tem uma empresa que tem regras específicas
08:14que você quer que esse agente de voz seja um, sei lá, um assistente para essa empresa.
08:21Então ele tem que saber as diretrizes da empresa.
08:24Ele não pode fazer alguma coisa que vá contra a empresa.
08:26Então você passa, digamos, um corpo, um documento contando todas essas diretrizes
08:31e ele faz em tempo real essa informação para o modelo de voz.
08:35Tudo isso parece muito legal.
08:36Então é mais um modelo promissor, é mais uma empresa promissora aí
08:40entrando nessa questão de conversação.
08:42E a vantagem deles é que é muito rápido, viu Marisa?
08:46É dos que eu testei.
08:47É assim, o mais realista e o mais rápido que a gente tem até hoje.
08:52Pois é, agora falando ainda em empresas e falando ainda em inteligência artificial.
08:58A empresa Sacana AI apresentou uma inteligência artificial.
09:03Nome diferente esse, né?
09:04É essa piada pronta, né Marisa?
09:08Piada pronta.
09:09Bom, mas enfim, a Sacana AI lançou uma inteligência artificial
09:13que pode reescrever o próprio código e melhorar sozinha.
09:18Como isso é possível, Pena?
09:20E mais, estamos diante de uma inovação preocupante ou fascinante,
09:25ainda mais com um nome desse, não é?
09:27Então, Sacana AI, eu acho que ambos, viu Marisa?
09:31É fascinante, é preocupante, é tudo.
09:33Mas vamos entender, então.
09:34Primeiro que essa empresa é uma empresa que já lança artigos científicos em alguns momentos,
09:41já vem lançando sempre artigos inovadores, propondo novas técnicas, novos usos, enfim.
09:47Muito legal, eu já li vários.
09:48Mas esse novo aí me chamou a atenção.
09:50Por quê?
09:51Porque ele coloca um tipo, um sisteminha, um processo que pode reescrever o próprio código.
09:56E aqui a gente precisa entender, abrir um pouco o capô e entender o que está acontecendo por trás.
10:02Então, já existe a ideia do algoritmo evolucionário, algoritmo evolutivo,
10:08esse é o termo que se usa, que é replicar mais ou menos o que acontece na natureza.
10:12Então, como é que na natureza funciona?
10:14Você tem uma mutação, alguma coisa acontece, um novo ser, o filho,
10:18os pais têm um novo filho, os genes não são cópias fiéis, tem algumas diferenças,
10:25são mutações genéticas.
10:27E se essas mutações geram comportamentos ou coisas melhores, vai sendo selecionado.
10:32Aqueles que se adaptam melhor vão sendo selecionados, aqueles genes vão para frente.
10:36Os filhos desses novos filhos vão conseguir, vão passar adiante porque os genes são bons,
10:41são genes que fazem coisas legais.
10:43Aqueles filhos que vieram com genes defeituosos, que não servem, que de repente geram problemas,
10:49eles vão ter mais dificuldade de passar os genes adiante e então vai selecionando.
10:54Esse é o mecanismo da natureza.
10:55Então, a ideia é meio que replicar esse mecanismo.
10:58Então, como é que funciona?
10:59Você tem lá o primeiro, a base, o modelo base, o modelo pai,
11:05que vai tentar fazer uma certa tarefa.
11:07O que é essa tarefa?
11:08Tanto faz, a tarefa que eles quiserem, é um benchmark que eles rodam.
11:10Então, pode ser fazer conta bem, gerar um código novo, responder perguntas.
11:16Você gerar a tarefa que você quer e ele vai pontuar nessa tarefa.
11:20Foi lá, fez 50 pontos na tarefa.
11:22Beleza.
11:22Agora, ele vai gerar um filho.
11:24O que é isso?
11:24Vai ser um novo código que uma outra IA vai pegar e vai falar assim,
11:28eu vou alterar algumas coisas desse código.
11:30E vai ser meio aleatório.
11:32Ela vai, ah, eu vou alterar aqui, vou alterar aqui, vou alterar aqui.
11:34Altera o que for.
11:35Está gerando a mutação.
11:37Esse novo filho vai tentar fazer a mesma tarefa.
11:40E, de repente, vai ter um score pior.
11:42Fez 40 pontos.
11:43Joga fora.
11:44O filho é pior que o pai.
11:45Não nos interessa.
11:46Gera um novo.
11:47Gera um novo filho.
11:48E, assim, gera um novo filho.
11:49E, se esse filho for melhor do que o pai, gera uma linhagem.
11:52Fica o filho, o pai vai embora.
11:54E, agora, esse filho pode ter mais filhos.
11:56E esse processo vai sendo sozinho.
11:58Você gera um IA.
11:59Ela faz um benchmark, faz uma tarefa.
12:03É pontuado.
12:04Só que você gera várias gerações ao mesmo tempo.
12:06Você não só gera uma.
12:07Você tem vários filhos do mesmo pai.
12:08Cada pai tem 10 filhos.
12:10E cada filho vai ter 10 filhos.
12:12Daqui a pouco, você está com um monte de modelos de IA.
12:15Todos eles competindo na mesma tarefa.
12:17Aqueles que vão indo melhor vão sendo selecionados.
12:19É um jeito da IA reescrever o próprio código?
12:22Por quê?
12:22Porque, no final desse processo inteiro,
12:24você vai ter uma nova IA,
12:26que vai ser muito melhor para aquela tarefa do que a original.
12:31Você pode pensar que, de certa maneira,
12:32ela reescreveu o próprio código.
12:34Embora seja meio aleatório.
12:35Embora pareça uma coisa evolutiva.
12:37Mas não deixa de ser um processo válido que copia a natureza.
12:41Então, assim, embora já se conhecia esse algoritmo evolucionário,
12:45evolutivo há muito tempo, não é uma novidade por si só.
12:47A novidade foi como aplicar ele usando as IAs de hoje.
12:50Porque não é muito simples aplicar em qualquer tecnologia.
12:56Então, parabéns aí a sacaneiai.
12:58Espero que não sacaneie a gente.
13:01E que isso realmente seja útil, seja dado para o nosso benefício.
13:06Que agora lança-se essas questões, Marisa.
13:08Será que é uma preocupação a gente ter uma IA que vai poder ir se automelhorando?
13:13Será que no meio desse processo de automelhoria
13:15não pode vir algum comportamento que a gente não está vendo?
13:19Porque, veja, ninguém está supervisionando isso.
13:21Então, aí vem a parte da preocupação.
13:23Então, a parte deslumbra é essa.
13:24A gente realmente ter que conseguir hoje ter um jeito de maximizar,
13:28criar essa evolução, essa explosão de inteligência.
13:31Porque no momento que a IA começa a gerar o próprio código melhorando,
13:34você tem uma explosão de inteligência.
13:35Você não precisa mais ter humano no meio.
13:37Mas a preocupação é por não ter humano no meio.
13:40Será que isso vai ser bom?
13:41Então, mais uma vez, eu faço o convite para as pessoas da segurança de IA.
13:45Precisamos garantir protocolos, precisamos garantir governança.
13:51Porque aí sim, o nosso mundo, a gente tem que ter um órgão fiscalizador disso tudo
13:55para nenhum modelo desse pode sair de graça, para sair livre.
13:59A gente tem que ter um órgão fiscalizador.
14:01É isso que eu defendo.
14:02Então, é isso, Marisa.
14:04Com certeza, Pedro.
14:06Porque você imagina o sistema pronto, que faz alguma coisa,
14:08você tem que saber o que tem ali no meio,
14:10o que está escondido e que você não viu.
14:13Realmente, precisa mesmo ter um apoio aí do ser humano.
14:17Bom, assuntos interessantíssimos.
14:19Mais uma vez, na nossa coluna da semana, fala aí.
14:23Pena, semana que vem temos mais assuntos para discutir por aqui.
14:27Obrigado, Marisa.
14:28Boa noite, boa noite, pessoal.
14:29Até semana que vem.
14:31Até.
14:31Ótima semana para você, Pena.
14:33Beijo grande.
14:35É isso aí, pessoal.
14:36Mais uma coluna super bacana com Roberto Pena Spinelli
14:40trazendo as novidades para vocês aí.
14:43Hoje, falando sobre empresas em inteligência artificial
14:46e todas as alternativas que estão surgindo.
14:50E vocês acompanham tudo aqui, sempre com a gente,
14:53no Olhar Digital.
14:55E semana que vem tem mais coluna Fala aí.
14:58Tchau.
14:59Tchau.
15:00Tchau.
15:01Tchau.
15:02Tchau.

Recomendado