TECNOLOGIA
A estrutura de código aberto de Giskard avalia modelos de IA antes de serem colocados em produção
Giskard é uma startup francesa que trabalha em uma estrutura de testes de código aberto para grandes modelos de linguagem. Ele pode alertar os desenvolvedores sobre riscos de preconceitos, falhas de segurança e a capacidade de um modelo de gerar conteúdo prejudicial ou tóxico.
Embora haja muito entusiasmo em torno dos modelos de IA, os sistemas de teste de ML também se tornarão rapidamente um tema quente, à medida que a regulamentação estiver prestes a ser aplicada na UE com a Lei de IA e em outros países. As empresas que desenvolvem modelos de IA terão de provar que cumprem um conjunto de regras e mitigar riscos para não terem de pagar multas pesadas.
Giskard é uma startup de IA que adota regulamentação e é um dos primeiros exemplos de ferramenta de desenvolvedor que se concentra especificamente em testes de maneira mais eficiente.
“Já trabalhei na Dataiku antes, principalmente na integração de modelos de PNL. E pude perceber que, quando eu estava encarregado dos testes, havia ambas as coisas que não funcionavam bem quando você queria aplicá-las em casos práticos, e era muito difícil comparar o desempenho dos fornecedores entre si”, O cofundador e CEO da Giskard, Alex Combessie, me contou.
Existem três componentes por trás da estrutura de testes de Giskard. Primeiro, a empresa divulgou uma biblioteca Python de código aberto que pode ser integrado em um projeto LLM – e mais especificamente em projetos de geração aumentada por recuperação (RAG). Já é bastante popular no GitHub e é compatível com outras ferramentas nos ecossistemas de ML, como Hugging Face, MLFlow, Weights & Biases, PyTorch, Tensorflow e Langchain.
Após a configuração inicial, Giskard ajuda a gerar um conjunto de testes que será usado regularmente em seu modelo. Esses testes abrangem uma ampla gama de questões, como desempenho, alucinações, desinformação, resultados não factuais, preconceitos, vazamento de dados, geração de conteúdo prejudicial e injeções imediatas.
“E há vários aspectos: você terá o aspecto de desempenho, que será a primeira coisa que passará pela cabeça de um cientista de dados. Mas cada vez mais, você tem o aspecto ético, tanto do ponto de vista da imagem da marca como agora do ponto de vista regulatório”, disse Combessie.
Os desenvolvedores podem então integrar os testes no pipeline de integração contínua e entrega contínua (CI/CD) para que os testes sejam executados sempre que houver uma nova iteração na base de código. Se houver algo errado, os desenvolvedores recebem um relatório de verificação em seu repositório GitHub, por exemplo.
Os testes são personalizados com base no caso de uso final do modelo. As empresas que trabalham no RAG podem dar acesso a bancos de dados de vetores e repositórios de conhecimento para Giskard para que o conjunto de testes seja o mais relevante possível. Por exemplo, se você estiver construindo um chatbot que possa fornecer informações sobre mudanças climáticas com base no relatório mais recente do IPCC e usando um LLM da OpenAI, os testes de Giskard verificarão se o modelo pode gerar informações erradas sobre as mudanças climáticas, se contradiz. , etc.
O segundo produto de Giskard é um hub de qualidade de IA que ajuda a depurar um grande modelo de linguagem e compará-lo com outros modelos. Este centro de qualidade faz parte do projeto da Giskard oferta premium. No futuro, a startup espera conseguir gerar documentação que comprove que um modelo está em conformidade com a regulamentação.
“Estamos começando a vender o AI Quality Hub para empresas como o Banque de France e a L’Oréal — para ajudá-las a depurar e encontrar as causas dos erros. No futuro, é aqui que colocaremos todos os recursos regulatórios”, disse Combessie.
O terceiro produto da empresa se chama LLMon. É uma ferramenta de monitoramento em tempo real que pode avaliar as respostas do LLM para os problemas mais comuns (toxicidade, alucinação, verificação de fatos…) antes que a resposta seja enviada de volta ao usuário.
Atualmente trabalha com empresas que usam APIs e LLMs da OpenAI como modelo fundamental, mas a empresa está trabalhando em integrações com Hugging Face, Anthropic, etc.
Regulando casos de uso
Existem várias maneiras de regular os modelos de IA. Com base em conversas com pessoas do ecossistema de IA, ainda não está claro se a Lei de IA se aplicará aos modelos fundamentais da OpenAI, Anthropic, Mistral e outros, ou apenas em casos de uso aplicados.
Neste último caso, Giskard parece particularmente bem posicionado para alertar os desenvolvedores sobre possíveis usos indevidos de LLMs enriquecidos com dados externos (ou, como os pesquisadores de IA chamam, geração aumentada por recuperação, RAG).
Atualmente, 20 pessoas trabalham para Giskard. “Vemos um ajuste de mercado muito claro com clientes de LLMs, então vamos praticamente dobrar o tamanho da equipe para sermos o melhor antivírus LLM do mercado”, disse Combessie.
Fonte: techcrunch.com
TECNOLOGIA
Os robotaxis de cruzeiro retornam à Bay Area quase um ano após o acidente com pedestres
Cruzeiro está retornando às ruas de Sunnyvale e Mountain View pela primeira vez desde que interrompeu as operações na Bay Area depois que um robotáxi atropelou um pedestre em outubro de 2023.
A empresa disse na quinta-feira que colocará “vários” veículos dirigidos por humanos nas duas cidades que inicialmente farão o mapeamento. A empresa disse que espera progredir para testes supervisionados de AV de até cinco robotaxis “mais tarde neste outono”.
“Retomar os testes na Bay Area é um passo importante à medida que continuamos a trabalhar em estreita colaboração com os reguladores da Califórnia e as partes interessadas locais”, disse a empresa em um comunicado. publicar no X. “Isso permitirá que nossos funcionários locais se envolvam diretamente com nosso produto enquanto refinam e melhoram nossa tecnologia por meio de P&D.”
A decisão de trazer os Chevy Bolts autônomos da Cruise de volta à Bay Area acontece poucos meses depois que a empresa chegou a um acordo com a Comissão de Serviços Públicos da Califórnia. Como parte desse acordo, a Cruise pagou uma multa de US$ 112.500 por não fornecer informações completas sobre o acidente de outubro de 2023.
Esse acidente, que envolveu um Cruise AV atingindo e arrastando uma pedestre após ela ter sido atingida por um carro dirigido por uma pessoa, deu início a uma série de eventos que acabaram levando a uma reestruturação da empresa robotaxi.
Pouco depois do acidente, a Cruise se separou de grande parte de sua equipe de liderança, incluindo cofundador e CEO Kyle Vogt. A empresa-mãe General Motors instalou uma nova liderança e, em junho passado, conectado outros US$ 850 milhões na subsidiária robotaxi. (Cruise também assentou com o pedestre no início deste ano.)
Desde junho, a Cruise lentamente retornou seus veículos autônomos às ruas de Fênix e Dallase simultaneamente descartou seu robotaxi construído para esse fimconhecida como a Origem.
A Cruise também lançou uma série de atualizações de software para resolver um recall de seus robotaxise a National Highway Traffic Safety Administration encerrou uma investigação sobre relatos de problemas de frenagem. Em agosto, a Cruise anunciou que havia assinado um acordo de parceria plurianual com a Uber para levar seus robotaxis para a plataforma de transporte por aplicativo em 2025 — juntando-se à rival Waymo, que tinha seus robotaxis disponíveis na plataforma da Uber desde 2023.
Fonte: techcrunch.com
TECNOLOGIA
Startup de seguro saúde Alan atinge avaliação de US$ 4,5 bilhões com nova rodada de financiamento de US$ 193 milhões
Alano unicórnio francês dos seguros, acaba de assinar um acordo multifacetado com Belfioum dos maiores bancos da Bélgica, que inclui uma parceria de distribuição juntamente com um investimento financeiro significativo na startup.
Belfius está liderando a rodada de financiamento da Série F de Alan de € 173 milhões (cerca de US$ 193 milhões nas taxas de câmbio atuais). Alguns dos investidores existentes de Alan estão participando mais uma vez, a saber, OTPP via Teachers’ Venture Growth, Temasek, Coatue e Lakestar.
Se você não conhece Alan, a empresa começou originalmente com um produto de seguro saúde que complementa o sistema nacional de saúde na França. As empresas francesas devem fornecer seguro saúde a todos os seus funcionários quando eles se juntam.
Alan otimizou seu produto principal o máximo possível para que sua experiência de usuário seja muito melhor do que a de um provedor de seguros legado. Por exemplo, Alan automatizou muitas partes do sistema de gerenciamento de reivindicações. Em alguns casos, você recebe um reembolso em sua conta bancária apenas um minuto após sair do consultório médico.
Com o tempo, a empresa adicionou outros serviços relacionados à saúde, como a capacidade de conversar com médicos, pedir óculos de prescrição e usar conteúdo de cuidados preventivos sobre saúde mental, dor nas costas e muito mais por meio de seu aplicativo móvel. Mais recentemente, a empresa recorreu à IA para aumentar sua produtividade.
No início deste anoAlan compartilhou algumas métricas sobre o desempenho da empresa. A empresa havia dito que mais de 500.000 pessoas estavam cobertas pelos produtos de seguro de Alan, e que poderia atingir a lucratividade sem levantar outra rodada de financiamento.
Mas Alan disse que a parceria com o Belfius era uma boa oportunidade para aumentar sua base de clientes na Bélgica — o banco oferecerá os produtos de seguro saúde da startup para seus próprios clientes corporativos e institucionais, que representam milhões de funcionários.
“Esta parceria privilegiada com a Belfius, cuja transformação na última década foi verdadeiramente inspiradora, abre as portas para uma nova era para a Alan na Bélgica. O investimento da Belfius nos permitirá acelerar nosso desenvolvimento e expandir nossa capacidade de oferecer produtos e serviços de saúde de ponta e acessíveis a um amplo público”, disse o cofundador e CEO da Alan, Jean-Charles Samuelian-Werve, em uma declaração.
Desde fevereiro, a Alan adicionou mais 150.000 clientes, incluindo no escritório do Primeiro Ministro na França. Ela espera que sua receita recorrente anual alcance € 450 milhões (cerca de US$ 500 milhões) este ano.
No entanto, a Alan não é uma empresa típica de software como serviço, e a maior parte de sua receita é reservada para atender reivindicações de seguro. Ainda assim, uma coisa é certa — o crescimento da empresa não parece estar diminuindo.
Fonte: techcrunch.com
TECNOLOGIA
Uma reformulação na liderança da Motional, dentro da briga pelo dinheiro da TuSimple, e Fisker hesita em reparos de recall
Bem-vindo de volta a TechCrunch Mobilidade — seu hub central para notícias e insights sobre o futuro do transporte. Inscreva-se aqui gratuitamente — basta clicar TechCrunch Mobilidade!
O último ciclo de notícias é um bom lembrete de que até mesmo uma repórter velha e grisalha que acha que já viu de tudo ainda pode se surpreender — e nada dura para sempre. Intrigado? Continue lendo.
Um passarinho
Bem, com certeza está ficando picante aqui TuSimplede acordo com vários passarinhos.
A empresa divulgou no mês passado um novo segmento de negócios focado em — espere só — animação gerada por IA e videogames. Essa ação, nossa pequena rede de passarinhos nos contou, provocou reação negativa entre alguns acionistas. Agora parece que um a luta está se formando por cerca de US$ 450 milhões em fundosa maior parte da qual permanece nos Estados Unidos. E argumentos sobre a missão da empresa estão no centro disso.
As repórteres do TechCrunch Rebecca Bellan e Rita Liao investigaram a história, e há alguns detalhes interessantes. Por exemplo, a TuSimple estava reforçando sua força de trabalho de veículos autônomos na China no final do ano passado, mas mudou de rumo no início de 2024. Centenas foram demitidas, embora, quando questionado, o CEO Cheng Lu tenha dito a Rebecca que essas pessoas (cerca de 500) pediram demissão em massa.
Para onde a TuSimple vai daqui? Houve ameaças de processos, embora nada de novo ainda. Enquanto as ameaças pairam no fundo, a TuSimple está avançando com o desenvolvimento de um longa-metragem de animação e videogame baseado na série de ficção científica “The Three-Body Problem”.
Essa mudança radical me fez pensar: Nossa, talvez eu esteja cobrindo esse setor há tempo demais.
Tem uma dica para nós? Envie um e-mail para Kirsten Korosec em kirsten.korosec@techcrunch.comSean O’Kane em sean.okane@techcrunch.com ou Rebecca Bellan em rebecca.bellan@techcrunch.com. Ou confira estas instruções para saber como entrar em contato conosco por meio de aplicativos de mensagens criptografadas ou SecureDrop.
Ofertas!
O fluxo de negócios no setor de transporte está um pouco fraco esta semana. Aqui estão alguns destaques.
Companhias aéreas do Alasca completou seu Aquisição de US$ 1,9 bilhão da Hawaiian Airlines. A aquisição é mais um exemplo de consolidação no setor aéreo.
Frota AIuma startup de tecnologia de transporte rodoviário, arrecadou US$ 16,6 milhões em uma rodada de financiamento da Série B liderado por Tom Williams na Heron Rock. Notavelmente, a Volvo Group VC participou, junto com Obvious Ventures, Ibex Investors, Compound, Winthrop Square e Cooley. A empresa levantou US$ 50 milhões até o momento.
Elétrica limpauma startup indiana de tecnologia de baterias, arrecadou US$ 6 milhões em uma rodada de financiamento coliderada pela Info Edge Ventures, Pi Ventures e Kalaari Capital. Lok Capital e outros investidores também participaram.
SiLC recebeu um investimento não divulgado da Honda para desenvolver soluções lidar FMCW de última geração para todos os tipos de mobilidade.
ZeroAviauma startup que desenvolve motores elétricos a hidrogênio (alimentados por células de combustível) para aviões, estendeu sua rodada de financiamento da Série C para um total de $ 150 milhõescom um investimento do Scottish National Investment Bank. A rodada foi coliderada pela Airbus, Barclays Sustainable Impact Capital e NEOM Investment Fund, com o UK Infrastructure Bank se juntando como um investidor de nível fundamental. Breakthrough Energy Ventures, Horizons Ventures, Ecosystem Integrity Fund, Summa Equity, Alaska Airlines, Amazon’s Climate Pledge Fund e AP Ventures também participaram.
Oxauma startup apoiada pelo Google que desenvolve software para veículos autônomos, adquiriu a empresa de logística industrial StreetDrone por uma quantia não revelada.
Leituras notáveis e outras curiosidades
Veículos autônomos
Mocional presidente e CEO Carlos Iagnemma — um pioneiro na indústria AV — deixou o cargo de liderança máxima. A CTO Laura Major é agora CEO interina. Não se sabe se Major manterá essa posição. Minhas fontes internas sugerem que esta é uma situação muito em evolução. Fique ligado.
Waymo e Uber expandiram seu relacionamento em um acordo que é maior do que algumas pessoas podem perceber. Usuários do Uber em Austin e Atlanta poderão saudações Waymo robotaxis por meio do aplicativo no início de 2025 como parte de uma parceria expandida entre as duas empresas. Por que tão notável? Para começar, a Uber, não a Waymo, será a operadora.
Veículos elétricos, carregamento e baterias
Faraday Futuro está distribuindo grandes aumentos e bônus para seu CEO e seu fundador. Lembre-se de que esta empresa está mal se segurando e entregou apenas 13 carros em seus 10 anos de história.
Pescadora startup de veículos elétricos falida, é invertendo o curso poucos dias depois de informar aos proprietários que eles teriam que pagar os custos de mão de obra para os reparos do recall.
GMOs clientes de veículos elétricos da agora podem acesso oficial Os Superchargers da Tesla, mais de um ano depois que a montadora anunciou que adotaria os Superchargers de sua rival padrão de carregamento. Mas e todos os outros EVs não Tesla por aí? Fique ligado para uma lista que manteremos atualizada.
Gogoro CEO Horace Luke resignado enquanto uma investigação sobre fraude de subsídios continua na fabricante taiwanesa de patinetes elétricos e empresa de troca de baterias.
O futuro do voo
Startup do Reino Unido Apianoempresa de drones da Alphabet Asae o Serviço Nacional de Saúde do Reino Unido têm lançou um programa piloto que usará drones para transportar amostras de sangue urgentes entre dois hospitais em Londres.
UnidoA diretora de atendimento ao cliente da empresa, Linda Jojo, explicou ao TechCrunch por que o companhia aérea escolheu Starlink da SpaceX para alimentar seu Wi-Fi gratuito.
Segurança
Lembre-se daquele aparente ataque cibernético no Porto de Seattleque também opera o Aeroporto Internacional de Seattle-Tacoma? Agora temos confirmação oficial que foi alvo de um ataque de ransomware.
Rodas desta semana
As rodas desta semana retornarão na próxima semana com insights sobre o GMC Sierra EV. Os veículos futuros incluem o Mazda CX-90 PHEV e bicicletas elétricas.
O que é “This week’s wheels”? É uma chance de aprender sobre os diferentes produtos de transporte que estamos testando, seja um carro elétrico ou híbrido, uma e-bike ou até mesmo um passeio em um veículo autônomo.
Fonte: techcrunch.com
-
SÉRIES1 semana ago
John Cena revela por que a segunda temporada de ‘Peacemaker’ valerá a pena esperar
-
ANIMES2 semanas ago
Novo brinquedo Transformers recria o Optimus Prime original com um design digno de Autobot
-
GAMES2 semanas ago
Astro Bot – Como encontrar facilmente todos os bots e outros segredos
-
FILMES1 semana ago
Reacenda a vela da Chama Negra quando ‘Hocus Pocus’ retornar aos cinemas em outubro
-
FILMES1 semana ago
‘Presence’ de Steven Soderbergh acaba de ganhar um novo teaser trailer fantasmagórico
-
FILMES1 semana ago
Thriller de ação ‘Rebel Ridge’ atrai mais de 30 milhões de visualizações em quatro dias
-
FILMES1 semana ago
John Leguizamo diz que outra sequência de ‘A Era do Gelo’ está a caminho
-
FILMES1 semana ago
O filme que ajudou a lançar a série de sucesso da CBS ‘SWAT’ é um grande sucesso de streaming