TECNOLOGIA
Esta semana em IA: não esqueçamos o humilde anotador de dados
Acompanhar uma indústria tão veloz quanto IA é uma tarefa difícil. Então, até que uma IA possa fazer isso por você, aqui está um resumo útil de histórias recentes no mundo do aprendizado de máquina, junto com pesquisas e experimentos notáveis que não abordamos por conta própria.
Esta semana, na IA, gostaria de chamar a atenção para startups de rotulagem e anotação – startups como Scale AI, que é supostamente em negociações para levantar novos fundos com uma avaliação de US$ 13 bilhões. As plataformas de rotulagem e anotação podem não chamar a atenção de novos modelos generativos de IA como o Sora da OpenAI. Mas eles são essenciais. Sem eles, os modelos modernos de IA provavelmente não existiriam.
Os dados nos quais muitos modelos são treinados devem ser rotulados. Por que? Rótulos, ou tags, ajudam os modelos a compreender e interpretar os dados durante o processo de treinamento. Por exemplo, rótulos para treinar um modelo de reconhecimento de imagem podem assumir a forma de marcações ao redor de objetos, “caixas delimitadoras”Ou legendas referentes a cada pessoa, lugar ou objeto retratado em uma imagem.
A precisão e a qualidade dos rótulos impactam significativamente o desempenho — e a confiabilidade — dos modelos treinados. E a anotação é uma tarefa vasta, exigindo de milhares a milhões de rótulos para os conjuntos de dados maiores e mais sofisticados em uso.
Portanto, você pensaria que os anotadores de dados seriam bem tratados, receberiam salários dignos e receberiam os mesmos benefícios que os próprios engenheiros que constroem os modelos desfrutam. Mas muitas vezes, o oposto é verdadeiro – um produto das condições de trabalho brutais que muitas startups de anotação e rotulagem promovem.
Empresas com bilhões no banco, como a OpenAI, contam com anotadores em países do terceiro mundo pagavam apenas alguns dólares por hora. Alguns desses anotadores são expostos a conteúdos altamente perturbadores, como imagens gráficas, mas não recebem folga (já que geralmente são contratados) ou acesso a recursos de saúde mental.
Um excelente pedaço em NY Mag abre as cortinas sobre a Scale AI em particular, que recruta anotadores em países tão distantes como Nairobi e Quênia. Algumas das tarefas no Scale AI exigem dos rotuladores vários dias de trabalho de oito horas – sem intervalos – e pagam apenas US$ 10. E esses trabalhadores estão em dívida com os caprichos da plataforma. Os anotadores às vezes passam longos períodos sem receber trabalho ou são expulsos sem cerimônia da Scale AI – como aconteceu com empreiteiros na Tailândia, Vietnã, Polônia e Paquistão recentemente.
Algumas plataformas de anotação e rotulagem afirmam fornecer trabalho de “comércio justo”. Na verdade, eles fizeram disso uma parte central de sua marca. Mas como diz Kate Kaye, do MIT Tech Review notasnão existem regulamentações, apenas padrões industriais fracos sobre o que significa o trabalho de rotulagem ética — e as próprias definições das empresas variam amplamente.
Então o que fazer? Salvo um enorme avanço tecnológico, a necessidade de anotar e rotular dados para treinamento em IA não irá desaparecer. Podemos esperar que as plataformas se autorregulam, mas a solução mais realista parece ser a elaboração de políticas. Isso em si é uma perspectiva complicada – mas é a melhor chance que temos, eu diria, de mudar as coisas para melhor. Ou pelo menos começando.
Aqui estão algumas outras histórias dignas de nota sobre IA dos últimos dias:
-
- OpenAI constrói um clonador de voz: A OpenAI está apresentando uma nova ferramenta desenvolvida por IA, Voice Engine, que permite aos usuários clonar uma voz a partir de uma gravação de 15 segundos de alguém falando. Mas a empresa está optando por não divulgá-lo amplamente (ainda), citando riscos de uso indevido e abuso.
- Amazon dobra sua aposta na Antrópica: A Amazon investiu mais US$ 2,75 bilhões no crescimento do poder da IA Anthropic, seguindo em frente a opção que deixou aberta em setembro passado.
- Google.org lança um acelerador: Google.org, braço de caridade do Google, está lançando um novo programa de seis meses de US$ 20 milhões para ajudar a financiar organizações sem fins lucrativos que desenvolvem tecnologia que aproveita a IA generativa.
- Uma nova arquitetura de modelo: A startup de IA AI21 Labs lançou um modelo generativo de IA, Jamba, que emprega uma arquitetura de modelo nova (ish) – modelos de espaço de estado, ou SSMs – para melhorar a eficiência.
- Databricks lança DBRX: Em outras notícias de modelo, a Databricks lançou esta semana o DBRX, um modelo generativo de IA semelhante à série GPT da OpenAI e ao Gemini do Google. A empresa afirma que obtém resultados de última geração em vários benchmarks populares de IA, incluindo vários raciocínios de medição.
- Uber Eats e regulamentação de IA do Reino Unido: Natasha escreve sobre como a luta de um mensageiro do Uber Eats contra o preconceito da IA mostra que a justiça sob as regulamentações de IA do Reino Unido é difícil de conquistar.
- Orientações sobre segurança eleitoral da UE: A União Europeia publicou na terça-feira um projeto de diretrizes de segurança eleitoral destinadas a cerca de duas dúzias plataformas regulamentadas pelo Lei de Serviços Digitais, incluindo diretrizes relativas à prevenção de que algoritmos de recomendação de conteúdo espalhem desinformação generativa baseada em IA (também conhecidos como deepfakes políticos).
- Grok é atualizado: O chatbot Grok do X receberá em breve um modelo subjacente atualizado, Grok-1.5 – ao mesmo tempo, todos os assinantes Premium no X terão ganhar acesso para Grok. (Grok era anteriormente exclusivo para clientes X Premium+.)
- Adobe expande Firefly: Esta semana, a Adobe revelou Firefly Services, um conjunto de mais de 20 novas APIs, ferramentas e serviços generativos e criativos. Também lançou modelos personalizados, que permitem às empresas ajustar modelos Firefly com base em seus ativos — uma parte do novo GenStudio suíte.
Mais aprendizados de máquina
Como está o tempo? A IA é cada vez mais capaz de lhe dizer isso. Notei alguns esforços em previsão horária, semanal e em escala centenária alguns meses atrás, mas como todas as coisas de IA, o campo está avançando rapidamente. As equipes por trás do MetNet-3 e do GraphCast publicaram um artigo descrevendo um novo sistema chamado SEMENTESpara amostrador de difusão de envelope de conjunto escalável.
O SEEDS usa difusão para gerar “conjuntos” de resultados climáticos plausíveis para uma área com base nas informações (leituras de radar ou imagens orbitais, talvez) muito mais rápido do que modelos baseados em física. Com contagens maiores de conjuntos, eles podem cobrir mais casos extremos (como um evento que ocorre apenas em 1 entre 100 cenários possíveis) e ter mais confiança em situações mais prováveis.
A Fujitsu também espera compreender melhor o mundo natural através aplicando técnicas de manipulação de imagens de IA a imagens subaquáticas e dados lidar coletados por veículos autônomos subaquáticos. Melhorar a qualidade das imagens permitirá que outros processos menos sofisticados (como a conversão 3D) funcionem melhor nos dados de destino.
A ideia é construir um “gémeo digital” das águas que possa ajudar a simular e prever novos desenvolvimentos. Estamos muito longe disso, mas você precisa começar de algum lugar.
Entre os LLMs, os pesquisadores descobriram que eles imitam a inteligência por um método ainda mais simples do que o esperado: funções lineares. Francamente, a matemática está além da minha compreensão (coisas vetoriais em muitas dimensões), mas este artigo no MIT deixa bem claro que o mecanismo de recall desses modelos é bastante… básico.
Embora esses modelos sejam funções não lineares realmente complicadas, treinadas com muitos dados e muito difíceis de entender, às vezes existem mecanismos muito simples trabalhando dentro deles. Este é um exemplo disso”, disse o co-autor Evan Hernandez. Se você tiver uma mentalidade mais técnica, confira o jornal aqui.
Uma das maneiras pelas quais esses modelos podem falhar é não compreender o contexto ou o feedback. Mesmo um LLM realmente capaz pode não “entender” se você disser que seu nome é pronunciado de uma determinada maneira, já que na verdade ele não sabe ou entende nada. Nos casos em que isso possa ser importante, como nas interações humano-robô, pode desanimar as pessoas se o robô agir dessa forma.
A Disney Research vem pesquisando interações automatizadas entre personagens há muito tempo e pronúncia deste nome e reutilização de papel apareceu há pouco tempo. Parece óbvio, mas extrair os fonemas quando alguém se apresenta e codificá-los, em vez de apenas o nome escrito, é uma abordagem inteligente.
Por último, à medida que a IA e a pesquisa se sobrepõem cada vez mais, vale a pena reavaliar a forma como estas ferramentas são utilizadas e se existem novos riscos apresentados por esta união profana. Safiya Umoja Noble tem sido uma voz importante na IA e na ética de pesquisa há anos, e sua opinião é sempre esclarecedora. Ela deu uma bela entrevista com a equipe de notícias da UCLA sobre como o trabalho dela evoluiu e por que precisamos permanecer indiferentes quando se trata de preconceitos e maus hábitos de pesquisa.
Fonte: techcrunch.com
TECNOLOGIA
Os investidores estão lutando para entrar no ElevenLabs, que em breve poderá ser avaliado em US$ 3 bilhões
A ElevenLabs, uma startup que fabrica ferramentas de IA para aplicações de áudio, está sendo abordada por investidores novos e existentes sobre uma nova rodada, que poderia avaliar a empresa em até US$ 3 bilhões, descobriu o TechCrunch.
A empresa fundada há dois anos é especializada em criar ferramentas de IA para gerar vozes sintéticas para narrações de audiolivros e para dublagem de vídeos em tempo real para outros idiomas.
Uma fonte de uma empresa de capital de risco interessada disse ao TechCrunch que os investidores estão lutando para entrar na empresa de rápido crescimento e que sua empresa está disposta a oferecer uma avaliação de até US$ 3 bilhões, pensando que isso é o que será necessário para entrar na próxima rodada. Essa pessoa disse que um acordo provavelmente ocorrerá nas próximas semanas.
Investidores de duas outras empresas confirmaram que a ElevenLabs está aumentando, mas está repassando o negócio. Uma dessas fontes ouviu de segunda mão que a receita recorrente anualizada (ARR) da empresa cresceu de US$ 25 milhões no final do ano passado para cerca de US$ 80 milhões nos últimos meses, tornando-a uma das startups de crescimento mais rápido no desenvolvimento de aplicações reais para IA. (Esses investidores pediram anonimato por motivos competitivos.)
Se for preciso, esse valor de receita significa que os investidores poderiam avaliar a ElevenLabs em cerca de 38 vezes o valor ARR mais recente. Esse múltiplo é ligeiramente inferior ao de algumas empresas focadas em empresas, como Hebbia e Glean.
O múltiplo mais baixo pode ser porque uma parte substancial de sua receita vem do uso do consumidor para narração e dublagem de vídeos pessoais. A receita do consumidor é frequentemente considerada mais volátil do que a receita gerada por clientes corporativos.
A rodada, se concluída com uma avaliação de US$ 3 bilhões, avaliação tripla da ElevenLabs de sua Série B em janeiro, co-liderada por Andreessen Horowitz, Nat Friedman e Daniel Gross.
Esta seria a terceira rodada da Eleven Labs em pouco mais de um ano, mas o TechCrunch não conseguiu saber o tamanho do investimento potencial, pois as discussões com os investidores ainda estão em andamento. A Eleven Labs já arrecadou US$ 100 milhões.
Embora Gêmeos do Google e OpenAI introduziu seus próprios modelos de voz humana, nenhuma das ofertas da empresa pode clonar a fala de outros humanos como a Eleven Labs. Outras empresas que visam o mercado de geração de voz sintética incluem Murf, Tavus, Assemelha-se à IA, Respeitador e Lovo.
ElevenLabs não respondeu a um pedido de comentário.
Fonte: techcrunch.com
TECNOLOGIA
Um co-líder do Sora, gerador de vídeo da OpenAI, partiu para o Google
Um dos co-líderes do gerador de vídeo da OpenAI, Sorapartiu para o Google.
Tim Brooks, que estava liderando o desenvolvimento de Sora com William Peebles, anunciou em um publicar no X que ele se juntará ao Google DeepMind, divisão de pesquisa de IA do Google, para trabalhar em tecnologias de geração de vídeo e “simuladores mundiais”.
“Tive dois anos incríveis na OpenAI criando Sora”, escreveu Brooks. “Obrigado a todas as pessoas apaixonadas e gentis com quem trabalhei.”
O CEO do Google DeepMind, Demis Hassabis, deu as boas-vindas a Brooks em um responder em X, dizendo que ajudará a “tornar realidade o sonho de longa data de um simulador mundial”.
Brooks foi um dos primeiros a trabalhar no Sora, tendo iniciado o projeto na OpenAI em janeiro de 2023. Em seu LinkedInBrooks afirma ter liderado a direção de pesquisa do projeto e o treinamento do modelo.
Sua saída ocorre no momento em que Sora, que ainda não foi lançado, supostamente sofre contratempos técnicos que o posicionam mal contra sistemas rivais de Luma, Runway e outros. Por O Information, o sistema original, revelado em fevereiro, levou mais de 10 minutos de processamento para fazer um videoclipe de 1 minuto. A OpenAI está em processo de treinamento de um Sora aprimorado que poderia fazer clipes rapidamente, disseram fontes ao The Information.
O Google tem seu próprio modelo de geração de vídeo, Veoque foi revelado nesta primavera em sua conferência anual de desenvolvedores de I/O, e que em breve vir ao YouTube Shorts, o formato de vídeo curto do YouTube, para permitir que os criadores gerem planos de fundo e clipes de seis segundos.
Além dos obstáculos relacionados à tecnologia, a OpenAI parece ter cedido terreno de parceria aos desafiantes da geração de vídeo nos últimos meses. No início deste mês, a Runway assinou um negócio com a Lionsgate, o estúdio por trás das franquias “John Wick” e “Crepúsculo”, para treinar um modelo de vídeo personalizado no catálogo de filmes da Lionsgate. Cerca de uma semana depois a Stability que está desenvolvendo seu próprio conjunto de modelos de geração de vídeo recrutado James Cameron, diretor de “Avatar”, “Terminator” e “Titanic”, ao seu conselho.
OpenAI era disse se reunirá com cineastas e estúdios de Hollywood no início deste ano para demonstrar Sora, e a empresa se uniu a vários diretores independentes (e alguns marcas) para mostrar os recursos do sistema. No entanto, a OpenAI ainda não anunciou uma colaboração de longo prazo com um nome importante.
Brooks é o mais recente de uma série de demissões de alto nível da OpenAI.
CTO Mira Muratidiretor de pesquisa Bob McGrew e vice-presidente de pesquisa Barret Zoph anunciado suas demissões no final de setembro. Cientista pesquisador proeminente Andrej Karpathy esquerda OpenAI em fevereiro; meses depois, o cofundador da OpenAI e ex-cientista-chefe Ilya Sutskever pediu demissão, junto com o ex-líder de segurança Jan Leike. Em agosto, cofundador John Schulman disse que deixaria a OpenAI. E Greg Brockman, o presidente da empresa, está em licença sabática.
Fonte: techcrunch.com
TECNOLOGIA
Enganada e explorada, ela criou um aplicativo baseado em IA para imigrantes como ela
Os imigrantes enfrentam um enorme número de desafios e dificuldades. Em particular, sem uma base local de familiares ou amigos da qual depender, os novos imigrantes muitas vezes ficam na ignorância sobre informações fiáveis sobre serviços essenciais como habitação, cuidados de saúde e serviços bancários.
Depois de ser enganada e explorada, uma fundadora imigrante decidiu tentar ajudar outros imigrantes a resolver tais questões e construiu um serviço alimentado por IA treinado em dados específicos para estas necessidades: Imii é um assistente de IA para imigrantes que visa ajudá-los a estabelecer-se e a integrar-se nos seus novos países de origem.
O cofundador da startup, Jane Fishernasceu e foi criado no Japão, em uma família de imigrantes da União Soviética. “Meu pai era uma figura proeminente nos estudos japoneses e um autor publicado quando se mudou para o Japão”, disse ela ao TechCrunch. “Mas ele foi discriminado e desprezado pelos seus colegas durante muitos anos simplesmente porque era um imigrante e, portanto, por padrão, indesejado”, disse ela.
Fisher é compreensivelmente apaixonado pelo assunto. “Criei o imii porque conheço em primeira mão as dificuldades da imigração. Tive diferentes experiências de mudança para outro país — tanto assistida (com um coordenador que me orientava) quanto sozinha (sem orientação externa). Apesar de este último estar se mudando para o Reino Unido, onde estudei e falei o idioma fluentemente, isso teve um impacto enorme na minha saúde mental e no período de adaptação. Também fui enganada no caminho”, acrescentou ela.
O Imii oferece aconselhamento personalizado aos imigrantes e conecta-os com fornecedores e empresas locais de confiança que falam a sua língua, sempre que isso for possível. No aplicativo, o usuário se cadastra, responde algumas dúvidas e recebe orientações personalizadas. O chatbot – temporariamente alimentado pelo ChatGPT 4o até que a startup conclua uma arrecadação de fundos – fornece consultoria sobre habitação, serviços bancários e saúde. E se não puder ajudar com uma dúvida, os usuários podem entrar em contato diretamente com a equipe Imii para obter ajuda.
“Ele é treinado em nosso banco de dados de conteúdo e fornece respostas fáceis de usar para perguntas específicas. Nosso objetivo é fazer com que o imii pareça um assistente humano empático, em vez de um banco de dados sem alma”, disse Fisher. Seu cofundador e CTO, Alexandra Miltsintrabalhou anteriormente com Zoopla e Yelp, onde liderou o desenvolvimento de vários produtos baseados em IA.
Além dos potenciais benefícios sociais, Fisher argumenta que a aplicação poderia beneficiar as empresas que contratam talentos internacionais, uma vez que poderia reduzir despesas com gestão de relocalização, melhorar o bem-estar e a produtividade dos funcionários e, potencialmente, reduzir as taxas de rotatividade de pessoal.
A startup também oferece uma versão para empresas que permite listar seus serviços e especificar o público-alvo. Os empregadores podem integrar o Imii em seus processos de RH, proporcionando aos contratados internacionais acesso ao aplicativo para prepará-los para sua relocação.
“Fomos procurados por diversas empresas prestadoras de serviços para oportunidades de parceria, que estamos atualmente finalizando”, disse Fisher.
O espaço tecnológico de imigração e relocação já conta com alguns players emergentes e estabelecidos. Algumas delas concentram-se no próprio processo de imigração e outras na fixação “in situ”.
Matuto (principalmente B2C) concentra-se no fornecimento de serviços de realocação diretamente aos consumidores e surgiu da TechStars. Enquanto isso, Benivo (B2B) é especializada em fornecer soluções de relocação para empresas e arrecadou US$ 30 milhões no total.
Bem vindo tecnologia (B2C, ainda não lançado) afirma fornecer uma plataforma digital concebida para ajudar os imigrantes em vários aspectos da relocalização. Ela arrecadou US$ 30 milhões em abril de 2022, elevando seu total para US$ 73 milhões, mas não saiu do sigilo desde 2022.
Existem alguns outros também, como Perchpeek (B2B), Settly (B2B), Relocity (B2B) e Localyze (B2B).
No entanto, diz Fisher, poucos dos seus concorrentes pensam profundamente sobre a experiência do imigrante: “Somos centrados no ser humano. Nós nos preocupamos mais com a experiência dos imigrantes do que com a criação de mais um software de tecnologia de relocação para empresas. É por isso que começamos com um conceito B2C muito enxuto para disponibilizar um produto talvez mais simples, mas verdadeiramente focado no impacto, para todos, e oferecer versões atualizadas aos beneficiários comerciais.”
“Não acreditamos que uma grande empresa precise de mais um serviço de relocação. Acreditamos que startups, PMEs, ONGs e organizações como o NHS do Reino Unido o fazem”, acrescentou ela.
Ela também disse que o aplicativo evoluirá do uso do OpenAI para o fornecimento de serviços mais detalhados: “Não é apenas informação, é também se eles precisam de construção de crédito para imigrantes ou assistência jurídica. Isso não é algo que você pode simplesmente obter através de um invólucro GPT.”
Atualmente a startup oferece o aplicativo gratuitamente para usuários individuais e como serviço pago com assistência de realocação/instalação para clientes B2B. Ela também cobra dos prestadores de serviços em seu mercado uma comissão de marketing de afiliados.
Imii parece estar muito “na moda”.
Aproximadamente 281 milhões de pessoas são contabilizadas como migrantes internacionais em todo o mundo, representando 3,6% da população mundial, por ano. Relatório das Nações Unidas. Além disso, o Banco Mundial prevê que, até 2050, as alterações climáticas poderão deslocar até 216 milhões de pessoas. E o ACNUR estima que, nos próximos anos, o número de refugiados climáticos aumentará significativamente, com algumas projecções sugerindo que até 1,2 mil milhões de pessoas poderão ser deslocadas a nível mundial até 2050 devido a acontecimentos relacionados com o clima.
Fonte: techcrunch.com
-
TECNOLOGIA1 semana ago
O drama WordPress vs. WP Engine, explicado
-
TECNOLOGIA2 semanas ago
Masayoshi Son, da SoftBank, está planejando seu retorno
-
GAMES2 semanas ago
Novo Mega Set Fallout Baseado no Icônico Posto de Gasolina Red Rocket Disponível para Pré-venda
-
SÉRIES2 semanas ago
Problemas legais passados da estrela de ‘The Bachelorette’, Devin Strader, ressurgem
-
SÉRIES2 semanas ago
Histórico chocante de participante de ‘The Golden Bachelorette’ é exposto
-
FILMES2 semanas ago
Obi-Wan frustra a viagem de Anakin em ‘Star Wars’
-
FILMES2 semanas ago
Hugh Grant conduz um experimento social mortal no novo trailer de ‘Heretic’
-
FILMES2 semanas ago
This ‘Star Trek’ Darling Has a 64% Rotten Tomatoes Horror Thriller Dominating Paramount+