TECNOLOGIA
Por que o RAG não resolverá o problema de alucinação da IA generativa
As alucinações – basicamente as mentiras que os modelos generativos de IA contam – são um grande problema para as empresas que buscam integrar a tecnologia em suas operações.
Porque os modelos não têm inteligência real e são simplesmente prevendo palavras, imagens, fala, música e outros dados de acordo com um esquema privado, às vezes eles erram. Muito errado. Em um artigo recente no The Wall Street Journal, um fonte relata um caso em que a IA generativa da Microsoft inventou os participantes da reunião e deu a entender que as teleconferências eram sobre assuntos que não foram realmente discutidos na teleconferência.
Como escrevi há pouco, alucinações pode ser um problema insolúvel com as atuais arquiteturas de modelos baseados em transformadores. Mas vários fornecedores de IA generativa sugerem que eles pode ser eliminada, mais ou menos, por meio de uma abordagem técnica chamada geração aumentada de recuperação, ou RAG.
Veja como um fornecedor, Squirro, lança:
No centro da oferta está o conceito de Retrieval Augmented LLMs ou Retrieval Augmented Generation (RAG) incorporado na solução… [our generative AI] é único em sua promessa de zero alucinações. Cada informação gerada é rastreável até uma fonte, garantindo credibilidade.
Aqui está um tom semelhante do SiftHub:
Usando a tecnologia RAG e grandes modelos de linguagem ajustados com treinamento de conhecimento específico do setor, o SiftHub permite que as empresas gerem respostas personalizadas sem alucinações. Isto garante maior transparência e redução de riscos e inspira confiança absoluta para usar a IA para todas as suas necessidades.
O RAG foi iniciado pelo cientista de dados Patrick Lewis, pesquisador da Meta e da University College London e autor principal do 2020 papel que cunhou o termo. Aplicado a um modelo, o RAG recupera documentos possivelmente relevantes para uma questão – por exemplo, uma página da Wikipedia sobre o Super Bowl – usando o que é essencialmente uma pesquisa por palavra-chave e depois pede ao modelo para gerar respostas dado este contexto adicional.
“Quando você está interagindo com um modelo generativo de IA como Bate-papoGPT ou Lhama e você faz uma pergunta, o padrão é que o modelo responda a partir de sua ‘memória paramétrica’ – ou seja, a partir do conhecimento armazenado em seus parâmetros como resultado do treinamento em dados massivos da web”, David Wadden, cientista pesquisador na AI2, a divisão de pesquisa focada em IA do Allen Institute, sem fins lucrativos, explicou. “Mas, assim como é provável que você dê respostas mais precisas se tiver uma referência [like a book or a file] na sua frente, o mesmo acontece em alguns casos com os modelos.”
O RAG é inegavelmente útil – permite atribuir coisas que um modelo gera a documentos recuperados para verificar sua factualidade (e, como um benefício adicional, evitar possíveis infrações de direitos autorais). regurgitação). O RAG também permite que empresas que não desejam que seus documentos sejam usados para treinar um modelo – por exemplo, empresas em setores altamente regulamentados, como saúde e direito – permitam que os modelos utilizem esses documentos de uma forma mais segura e temporária.
Mas RAG certamente não pode impedir que uma modelo tenha alucinações. E tem limitações que muitos fornecedores ignoram.
Wadden diz que o RAG é mais eficaz em cenários de “conhecimento intensivo”, onde um usuário deseja usar um modelo para atender a uma “necessidade de informação” – por exemplo, para descobrir quem ganhou o Super Bowl no ano passado. Nesses cenários, o documento que responde à pergunta provavelmente conterá muitas das mesmas palavras-chave da pergunta (por exemplo, “Super Bowl”, “ano passado”), tornando relativamente fácil encontrá-lo por meio de pesquisa por palavra-chave.
As coisas ficam mais complicadas com tarefas de “raciocínio intensivo”, como codificação e matemática, onde é mais difícil especificar em uma consulta de pesquisa baseada em palavras-chave os conceitos necessários para responder a uma solicitação – e muito menos identificar quais documentos podem ser relevantes.
Mesmo com perguntas básicas, os modelos podem se “distrair” com conteúdos irrelevantes nos documentos, especialmente em documentos longos onde a resposta não é óbvia. Ou podem – por razões ainda desconhecidas – simplesmente ignorar o conteúdo dos documentos recuperados, optando por confiar na sua memória paramétrica.
O RAG também é caro em termos do hardware necessário para aplicá-lo em grande escala.
Isso ocorre porque os documentos recuperados, seja da web, de um banco de dados interno ou de outro lugar, precisam ser armazenados na memória – pelo menos temporariamente – para que o modelo possa consultá-los. Outra despesa é calcular o contexto ampliado que um modelo deve processar antes de gerar sua resposta. Para uma tecnologia já conhecida pela quantidade de computação e eletricidade que requer até mesmo para operações básicas, isto constitui uma consideração séria.
Isso não quer dizer que o RAG não possa ser melhorado. Wadden observou muitos esforços contínuos para treinar modelos para fazer melhor uso dos documentos recuperados pelo RAG.
Alguns desses esforços envolvem modelos que podem “decidir” quando fazer uso dos documentos, ou modelos que podem optar por não realizar a recuperação em primeiro lugar, caso considerem desnecessário. Outros centram-se em formas de indexar de forma mais eficiente conjuntos de dados massivos de documentos e em melhorar a pesquisa através de melhores representações de documentos — representações que vão além de palavras-chave.
“Somos muito bons em recuperar documentos com base em palavras-chave, mas não tão bons em recuperar documentos com base em conceitos mais abstratos, como uma técnica de prova necessária para resolver um problema matemático”, disse Wadden. “É necessária pesquisa para construir representações de documentos e técnicas de busca que possam identificar documentos relevantes para tarefas de geração mais abstratas. Acho que esta é principalmente uma questão em aberto neste momento.”
Portanto, o RAG pode ajudar a reduzir as alucinações de um modelo – mas não é a resposta para todos os problemas alucinatórios da IA. Cuidado com qualquer fornecedor que tente alegar o contrário.
Fonte: techcrunch.com
TECNOLOGIA
Lyft faz parceria com May Mobility e Mobileye para trazer veículos autônomos para o aplicativo
Parece que Lyft espera alcançar o Uber série de parcerias de veículos autônomos.
Lyft anunciou na quarta-feira três parcerias separadas – com a startup May Mobility, a empresa de direção automatizada Mobileye e a empresa de câmeras inteligentes Nexar – todas com o objetivo de estabelecer uma posição no mercado emergente de veículos autônomos.
No anúncio, a empresa de transporte disse que assinou um acordo com a May Mobility para lançar veículos autônomos no aplicativo Lyft a partir de Atlanta em 2025. Lyft também anunciou uma parceria com a Mobileye, de propriedade da Intel, que permitirá certos veículos equipados com tecnologia AV para aproveitar o aplicativo de carona, bem como um acordo de compartilhamento de dados com a Nexar que foi projetado para fornecer aos OEMs e operadores melhores insights para treinar sistemas de direção autônomos.
Esta não é a primeira vez que Lyft se aprofunda em veículos autônomos. Anteriormente, a empresa fornecia um serviço de robotáxi – sempre com um motorista de segurança humana ao volante – em Las Vegas por meio de uma parceria com Mocional. Teve um acordo semelhante em Austin e Miami com Argo AI. No entanto, Motional pausou essa parceria em maio depois reduzindo sua força de trabalhoe Argo AI foi encerrado em 2022. Lyft tinha uma participação na Argo e assumiu uma US$ 135,7 milhões atingidos quando a empresa faliu.
Enquanto isso, o Uber tem estado ocupado fechando acordos com as principais empresas de AV do setor de robotáxi, entrega e frete, incluindo Waymo, Cruzeiro, Avride, Servir Robótica, Aurora Inovação, Waabie muito mais.
Maio Mobility + Lyft, a partir de 2025
May Mobility fez seu nome lançando serviços de microtrânsito autônomo principalmente em áreas com cerca geográfica nos EUA Os ônibus da startup operam dentro dos campi e para paradas designadas ao longo de rotas fixas em cidades como Ann Arbor, Michigan, Arlington, Virgínia, Peachtree Corners em Atlanta, Miami e Sun City, Arizona. Em maio de 2023, a May Mobility lançou um serviço sob demanda em Grandes CorredeirasMichigan em parceria com a Via.
“A parceria com a Lyft abrirá novos mercados para operarmos, garantindo maior mobilidade a mais pessoas, mais rapidamente”, disse Edwin Olson, cofundador e CEO da May Mobility, num comunicado.
A parceria plurianual com a Lyft é a primeira incursão de maio no mercado de carona. May Mobility e Lyft não disseram quando os AVs serão implantados, quantos veículos Toyota Sienna Autono-MaaS de maio chegarão às ruas ou se maio fornecerá passeios e ônibus em pool ou transporte individual sob demanda.
Em comunicado, May observou que as implantações iniciais usarão motoristas de segurança no banco da frente, com planos de transição para totalmente sem motorista ao longo do tempo.
Criando uma rede Mobileye ‘pronta para Lyft’
Mobileye oferece tecnologia de direção autônoma em todo o espectro de autonomia, desde Sistemas avançados de assistência ao motorista de nível 2 para sistemas de Nível 4 totalmente autônomos. Mobileye Drive, o sistema L4 da empresa, consiste em tudo, desde o software autônomo até a pilha de sensores e uma infraestrutura em nuvem com um gêmeo digital do mundo.
“O próximo passo para nós é usar esta nuvem Mobileye Drive, ou o gateway de demanda, como o chamamos, para nos conectarmos às diferentes redes de carona, carona compartilhada e transporte público do mundo”, Christian Lichtmannecker, chefe de AV da unidade de desenvolvimento de negócios de mobilidade como serviço da Mobileye, disse ao TechCrunch.
Em outras palavras, qualquer frota de veículos que já tenha o Mobileye Drive a bordo – que hoje inclui alguns modelos Volkswagen, Schaeffler e Benteler Holon – poderá se conectar à rede Lyft no futuro. Lichtmannecker disse que isso permite que pequenos e grandes operadores de frota obtenham acesso contínuo à plataforma e à rede de passageiros da Lyft.
“O objetivo da Lyft é conectar AVs, motoristas, passageiros e parceiros para criar novas oportunidades para todos”, disse o CEO da Lyft, David Risher, em um comunicado. “Nossa rede de transporte compartilhado continuará a evoluir à medida que milhões de pessoas terão a oportunidade de ganhar bilhões de dólares, independentemente de decidirem dirigir, colocar seus AVs em serviço ou ambos.”
Nem Lyft nem Mobileye compartilharam quando ou onde os primeiros veículos movidos a Mobileye apareceriam no aplicativo Lyft, mas Lichtmannecker observou que os dois estão em negociações com parceiros operacionais e OEM hoje.
A Mobileye está testando sua tecnologia Drive em Austin, Detroit e Orlando, Flórida. A empresa também está testando como sua tecnologia lida com condições climáticas extremas na Noruega, Alemanha e Israel. A Mobileye atualmente testa com um motorista de segurança ao volante e planeja removê-lo assim que validar a segurança de sua tecnologia.
Trazendo insights da câmera inteligente Nexar para o desenvolvimento de AV
Nos últimos anos, a Nexar usou dados de vídeo de sua linha de câmeras inteligentes para dimensionar um serviço de gêmeo digital que vende para OEMs automotivos e cidades.
Agora, a Nexar e a Lyft acreditam que, ao combinar forças, serão capazes de fornecer aos OEMs e às empresas AV ainda melhores insights.
As duas empresas combinarão os mais de 45 petabytes de imagens do mundo real da Nexar, abrangendo 200 milhões de milhas percorridas mensalmente, com os dados históricos do mercado recém-anonimizados e agregados da Lyft para criar “um conjunto de dados abrangente e robusto para o desenvolvimento de tecnologia AV”.
Lyft e Nexar não compartilharam como planejam dividir as receitas nesta parceria. As empresas também não disseram se a Lyft oferecerá câmeras Nexar com desconto aos motoristas Lyft ou mesmo dará aos motoristas uma parte pela coleta de dados em nome da empresa, embora um porta-voz da Nexar tenha dito que os motoristas precisam concordar em participar.
O acordo ocorre apenas alguns meses depois que Zach Greenberger deixou seu cargo como diretor de negócios da Lyft para se tornar o CEO da Nexar.
Fonte: techcrunch.com
TECNOLOGIA
MoradaUno quer facilitar o aluguel de apartamentos no México
O aluguel na América Latina é restritivo. A maioria dos proprietários exige três meses de aluguel como depósito e um fiador que possua um imóvel na mesma cidade para assinar o contrato. Santiago Morales, cofundador e CEO da proptech MoradaUno, disse que essa dinâmica torna 40% dos possíveis locatários inelegíveis. Sua empresa deseja atrair mais inquilinos para aluguéis, subscrevendo seus riscos.
“Esse é o maior problema da indústria hoje”, disse Morales ao TechCrunch. “As pessoas não conseguem alugar onde querem, ou têm que, tipo, alugar com colegas de quarto, colegas de quarto ou basicamente não conseguem alugar. Então dissemos, vamos consertar isso. Vamos resolver esse problema.”
O resultado foi MoradaUnouma empresa sediada na Cidade do México que busca antecipar o risco do inquilino para os proprietários. A empresa trabalha com corretores de imóveis selecionando e subscrevendo potenciais inquilinos e concordando em assumir o pagamento do aluguel se os inquilinos pararem de pagar. Morales disse que o processo minucioso de verificação da empresa, que inclui verificações de antecedentes e verificação de renda, elimina muitos maus atores desde o início. MoradaUno também oferece serviços adicionais de corretagem opcionais, como seguros jurídicos e residenciais.
A empresa decidiu visar os corretores, em vez dos próprios proprietários, devido à natureza fragmentada do mercado de arrendamento mexicano, disse Morales. Ao contrário das cidades dos EUA, onde há uma concentração de grandes proprietários que administram uma tonelada de unidades, no México acontece o oposto. A maioria dos proprietários possui apenas uma propriedade.
“É tudo familiar, como se 97% do mercado fosse familiar”, disse Morales. “Eles dependem muito dessa renda. Então eles ficam tipo, ‘Oh, para quem estou alugando? O que acontece se eles não pagarem? Há uma falta de confiança aí. Dizemos que podemos ajudar a resolver isso ou colmatar essa falta de confiança com a tecnologia.”
A equipe fundadora da MoradaUno conhece bem o mercado imobiliário latino-americano. Morales disse que se mudou para o México no início de 2020, pouco antes da pandemia, porque trabalhava com a proptech Loft, o mercado latino-americano de compra e venda de imóveis. Ele deveria ajudá-los a se expandir para o país, mas quando o COVID-19 chegou, esses planos fracassaram.
A experiência deu-lhe uma boa oportunidade para enfrentar os desafios imobiliários da América Latina e o apresentou a Ines Gamboa Sorensen e Diego Llano, seus agora cofundadores. A MoradaUno foi formada em 2020 e lançou formalmente seu produto em 2021. Desde então, a MoradaUno trabalhou com mais de 4.500 corretores e ajudou a fechar mais de 20.000 aluguéis. Santiago acrescentou que a empresa está processando cerca de 1.000 arrendamentos por mês e quer atingir 3.000 arrendamentos por mês até o próximo verão.
A empresa acaba de arrecadar uma rodada da Série A de US$ 5,6 milhões para ajudar nisso. A rodada foi co-liderada pela Flourish Ventures, com foco em fintech, e pela Cometa, uma empresa de capital de risco focada em apoiar empresas que constroem para populações de língua espanhola. Clocktower Ventures, Picus Capital e Y Combinator também participaram. Morales disse que o capital será usado para ajudar na expansão.
O mercado de startups proptech vem crescendo na América Latina. Existem algumas outras startups que também procuram lidar com aluguéis. Apuno é aquele que ajuda as pessoas a encontrar e solicitar apartamentos on-line, com sede em Bogotá e que arrecadou US$ 7 milhões em financiamento de risco. Houm é outra que busca contornar o difícil mercado de aluguel da região, atuando como corretora digital. Houm arrecadou mais de US$ 44 milhões em dinheiro de capital de risco.
MoradaUno está atualmente em quatro cidades do México, mas a empresa quer aumentar isso adicionando mais seis cidades em um futuro próximo. Morales acrescentou que subscrever inquilinos é apenas o começo e, no futuro, eles gostariam de poder oferecer serviços de fintech, como pagamentos antecipados de aluguel ou até mesmo construir um modelo de IA para corretores.
“É muito legal poder dar acesso [to] pessoas que de outra forma não teriam condições de alugar”, disse Morales. “Agora você está dando a eles uma opção. Isso é muito poderoso e emocionante. Isso nos alimenta todos os dias. E também estamos melhorando a vida de milhares de corretores imobiliários porque eles têm ferramentas melhores e tecnologia mais eficiente.”
Fonte: techcrunch.com
TECNOLOGIA
Apple será multada por violar a Lei de Mercados Digitais da UE, relata Bloomberg
O principal regulamento de disputabilidade de mercado da União Europeia está em vigor em um punhado de gigantes da tecnologia por meses. Desde marçoo bloco abriu investigações sobre vários guardiões. Mas é a Apple quem enfrentará a primeira multa da Lei de Mercados Digitais (DMA), Bloomberg relatórios, citando pessoas familiarizadas com o caso.
As regras da App Store da Apple estão em vigor. Em Junhoo bloco compartilhou conclusões preliminares com a empresa, alertando que os desenvolvedores deveriam ser livres para informar os usuários sobre rotas alternativas de compra. No entanto, a Apple persistiu em inventando novas taxas em uma tentativa de contornar os requisitos de DMA para permitir que os desenvolvedores evitem seu corte usual na App Store.
O relatório da Bloomberg diz que a decisão da UE sobre o caso ainda está a ser elaborada, mas poderá chegar ainda este mês. Não especifica o valor da multa, mas o DMA permite penalidades de até 10% do faturamento anual global, de modo que poderia se traduzir em dezenas de bilhões de dólares, dadas as receitas da Apple.
A Apple foi contatada para comentar.
Fonte: techcrunch.com
-
SÉRIES2 semanas ago
Marissa deu a Ramsés uma segunda chance depois de ‘Love Is Blind’?
-
GAMES2 semanas ago
Final Fantasy 7 Glitch meio que permite que você salve seu personagem amado do assassinato
-
GAMES2 semanas ago
Asus ROG Phone 9 revelado, lançado em 19 de novembro
-
GAMES2 semanas ago
A nova atualização do sistema PS5 torna o recurso de atividades menos confuso
-
FILMES2 semanas ago
Could 'Master and Commander' Get a Prequel? Studio Exec Gives an Answer
-
FILMES2 semanas ago
‘Megalopolis’ Will Whimper Out of Theaters Short of This Small Box Office Milestone
-
SÉRIES2 semanas ago
A mãe de Marissa não estava errada sobre ‘Love Is Blind’s Ramses
-
SÉRIES2 semanas ago
‘Chicago PD’ dá a Torres um caso assustador na prévia da 12ª temporada