Conecte-se com a gente!

TECNOLOGIA

YouTuber move ação coletiva contra a coleta de transcrições de criadores pela OpenAI

Um criador do YouTube está tentando mover uma ação coletiva contra a OpenAI, alegando que a empresa treinou seus modelos de IA generativa em milhões de transcrições de vídeos do YouTube sem notificar — ou compensar — ​​os proprietários dos vídeos.

Em um reclamação arquivado na sexta-feira passada no Tribunal Distrital dos EUA para o Distrito Norte da Califórnia, os advogados de David Millette, um usuário do YouTube baseado em Massachusetts, alegam que a OpenAI transcreveu secretamente os vídeos de Millette e de outros criadores para treinar os modelos que alimentam a plataforma de chatbot com tecnologia de IA da empresa, Bate-papoGPTe outras ferramentas e produtos de IA generativa. Ao coletar esses dados, a OpenAI “lucrou significativamente” com o trabalho dos criadores, alega a denúncia, ao mesmo tempo em que violou a lei de direitos autorais e os termos de serviço do YouTube que proíbem o uso de vídeos para aplicativos independentes de seu serviço.

“Como [OpenAI’s] Os produtos de IA tornam-se mais sofisticados através do uso de conjuntos de dados de treinamento, eles se tornam mais valiosos para usuários atuais e potenciais, que compram assinaturas para acessar [OpenAI’s] Produtos de IA”, diz a reclamação. “Muito do material nos conjuntos de dados de treinamento da OpenAI, no entanto, vem de trabalhos que foram copiados pela OpenAI sem consentimento, sem crédito e sem compensação.”

Millette, representada pelo escritório de advocacia Bursor and Fisher, está buscando um julgamento com júri e mais de US$ 5 milhões em danos para todos os usuários do YouTube cujos dados podem ter sido coletados no treinamento da OpenAI.

Modelos de IA generativos como o OpenAI não têm inteligência real. Alimentados por um número enorme de exemplos (por exemplo, filmes, gravações de voz, ensaios e assim por diante), os modelos “aprender“a probabilidade de ocorrência de dados com base em padrões, incluindo o contexto de quaisquer dados circundantes.

A maioria dos modelos é treinada em dados obtidos de sites públicos e conjuntos de dados na web. As empresas argumentam que o uso justo protege seus esforços para coletar dados indiscriminadamente e usá-los para treinar modelos comerciais. Muitos detentores de direitos autorais discordam, no entanto — e eles estão arquivamento se adequa mirado no parando prática.

As transcrições de vídeo se tornaram um ingrediente essencial para dados de treinamento, à medida que outros recursos de dados secam, por assim dizer.

Mais de 35% dos 1.000 principais sites do mundo agora bloqueiam o rastreador da web da OpenAI, de acordo com dados da Originalidade.AI. E cerca de 25% dos dados de fontes de “alta qualidade” foram restringidos dos principais conjuntos de dados usados ​​para treinar modelos de IA, um estudar pela Data Provenance Initiative do MIT. Se a tendência atual de bloqueio de acesso continuar, o grupo de pesquisa Epoch AI prevê que os desenvolvedores ficarão sem dados para treinar modelos de IA generativos entre 2026 e 2032.

Em abril, o The New York Times relatado que a OpenAI criou seu primeiro modelo de reconhecimento de fala, Sussurrarcom o propósito de transcrever áudio de vídeos para coletar dados de treinamento adicionais. Uma equipe da OpenAI que incluía o presidente da empresa, Greg Brockman, transcreveu mais de um milhão de horas de vídeo do YouTube usando o Whisper, de acordo com o The Times, e usou as transcrições para treinar o modelo de geração e análise de texto da OpenAI GPT-4.

Alguns funcionários da OpenAI discutiram como tal medida poderia ir contra as regras do YouTube, segundo o The Times.

Em julho, Proof News relatado que empresas como Anthropic, Apple, Salesforce e Nvidia usaram um conjunto de dados chamado The Pile, que contém legendas de centenas de milhares de vídeos do YouTube, para treinar modelos de IA generativos. Muitos criadores do YouTube cujas legendas foram varridas no The Pile não estavam cientes e não consentiram com isso; a Apple posteriormente divulgou uma declaração dizendo que não pretendia usar esses modelos para alimentar quaisquer recursos de IA em seus produtos.

O Google, empresa controladora do YouTube, também tentou usar transcrições para treinar seus modelos.

Ano passado, O Google ampliou seus termos de serviço (ToS) em parte para permitir que a empresa explorasse mais dados do usuário para treinamento de modelo de IA generativo. Sob os antigos ToS, não estava claro se o Google poderia usar dados do YouTube para construir produtos além da plataforma de vídeo. Não é assim sob os novos termos, que afrouxam as rédeas consideravelmente.

Entramos em contato com a OpenAI e o Google para comentar sobre a ação coletiva e atualizaremos este artigo se eles responderem.

Foi um começo de mês difícil para a OpenAI.

O CEO da Tesla e da X, Elon Musk, entrou na segunda-feira com um novo processo contra a OpenAI e o CEO Sam Altman acusando a empresa de abandonar sua missão original sem fins lucrativos ao reservar parte de sua tecnologia mais sofisticada para clientes comerciais. Musk fez as mesmas alegações em um processo de fevereiro contra a OpenAI, mas o novo processo alega que a OpenAI também está se envolvendo em atividades de extorsão.

Fonte: techcrunch.com

Continue lendo
Clique para comentar

Deixe sua resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

TECNOLOGIA

Perplexity lança Sonar, uma API para pesquisa de IA

A Perplexity lançou na terça-feira um serviço de API chamado Sonar, permitindo que empresas e desenvolvedores construam as ferramentas generativas de pesquisa de IA da startup em seus próprios aplicativos.

“Embora a maioria dos recursos generativos de IA hoje tenham respostas informadas apenas por dados de treinamento, isso limita suas capacidades”, escreveu Perplexity em um comunicado. postagem no blog. “Para otimizar a factualidade e a autoridade, as APIs exigem uma conexão em tempo real com a Internet, com respostas informadas por fontes confiáveis.”

Para começar, a Perplexity está oferecendo dois níveis que os desenvolvedores podem escolher: uma versão básica que é mais barata e rápida, Sonar, e uma versão mais cara que é melhor para questões difíceis, Sonar Pro. Perplexity diz que a API Sonar também oferece às empresas e desenvolvedores a capacidade de personalizar as fontes de onde seu mecanismo de busca de IA extrai.

Com o lançamento de sua API, a Perplexity está disponibilizando seu mecanismo de busca de IA em mais lugares do que apenas seu aplicativo e site. Perplexity diz que a Zoom, entre outras empresas, já está usando o Sonar para alimentar um assistente de IA para sua plataforma de videoconferência. O Sonar está permitindo que o chatbot AI do Zoom dê respostas em tempo real, informadas por pesquisas na web com citações, sem exigir que os usuários saiam da janela do chat de vídeo.

O Sonar também poderia dar à Perplexity outra fonte de receita, o que poderia ser particularmente importante para os investidores da startup. Perplexity oferece apenas um serviço de assinatura para acesso ilimitado ao seu mecanismo de busca de IA e alguns recursos adicionais. No entanto, a indústria de tecnologia reduziu os preços para acessar ferramentas de IA por meio de APIs no ano passado, e a Perplexity afirma estar oferecendo a API de pesquisa de IA mais barata do mercado via Sonar.

A versão básica do Sonar oferece uma versão mais barata e rápida das ferramentas de pesquisa de IA da empresa. A versão básica do Sonar tem preço fixo e usa um modelo leve. Custa US$ 5 para cada 1.000 pesquisas, mais US$ 1 para cada 750.000 palavras digitadas no modelo de IA (cerca de 1 milhão de tokens de entrada) e outro US$ 1 para cada 750.000 palavras que o modelo exprime (cerca de 1 milhão de tokens de saída).

O Sonar Pro, mais caro, fornece respostas mais detalhadas e é capaz de lidar com questões mais complexas. Esta versão executará várias pesquisas após uma solicitação do usuário, o que significa que o preço pode ser mais imprevisível. Perplexity também diz que esta versão oferece o dobro de citações que a versão base do Sonar. O Sonar Pro custa US$ 5 para cada 1.000 pesquisas, mais US$ 3 para cada 750.000 palavras digitadas no modelo de IA (aproximadamente 1 milhão de tokens de entrada) e US$ 15 para cada 750.000 palavras que o modelo exprime (aproximadamente 1 milhão de tokens de saída).

A Perplexity afirma que o Sonar Pro superou os principais modelos do Google, OpenAI e Anthropic em um benchmark que mede a correção factual nas respostas do chatbot de IA, SimpleQA.

Como informamos recentemente, a receita recorrente anual da Perplexity é algo entre US$ 5 milhões e US$ 10 milhões. Isso parece bastante saudável para uma startup do tamanho e da idade da Perplexity, mas a startup certamente está procurando novas maneiras de aumentar sua receita. A startup levantou US$ 73,6 milhões adicionais em uma rodada de financiamento no início deste mês, avaliando a empresa em cerca de US$ 520 milhões.

Fonte: techcrunch.com

Continue lendo

TECNOLOGIA

Trump visa programas de financiamento de cobrança de veículos elétricos dos quais a Tesla se beneficia

O presidente Donald Trump está a tentar travar o fluxo de financiamento para infraestruturas de carregamento de veículos elétricos de dois programas dos quais a Tesla beneficiou – o exemplo mais recente de como os interesses políticos de Elon Musk parecem estar em desacordo com o objetivo da sua empresa automóvel de promover a energia sustentável.

Não é certo que a estratégia de Trump terá sucesso. Mas se isso acontecer, a Tesla poderá ficar sem duas fontes de financiamento que a montadora utilizou nos últimos dois anos para construir sua rede de carregamento de veículos elétricos líder de mercado.

Numa das inúmeras ordens executivas que Trump assinou no primeiro dia de seu segundo mandatoele declarou que “[a]Todas as agências suspenderão imediatamente o desembolso de fundos” dos programas criados pela Lei de Redução da Inflação e pela Lei Bipartidária de Infraestrutura. Ele pede especificamente a interrupção do financiamento para estações de carregamento de EV que foram disponibilizadas por meio do Programa Fórmula Nacional de Infraestrutura de Veículos Elétricos (NEVI) e do programa de subsídios de Infraestrutura de Carregamento e Abastecimento (CFI).

Essas agências devem apresentar uma revisão de “processos, políticas e programas para emissão de subsídios, empréstimos, contratos ou quaisquer outros desembolsos financeiros” no prazo de 90 dias a partir da data desta ordem, todos os chefes de agência deverão apresentar um relatório ao Escritório de Gestão e Orçamento (OMB) e do Conselho Econômico Nacional (NEC). A ordem também afirma que as agências não podem desembolsar mais fundos, a menos que o “Diretor do OMB e o Assistente do Presidente para a Política Económica tenham determinado que tais desembolsos são consistentes com quaisquer recomendações de revisão que tenham optado por adotar”.

Musk há muito afirma que a missão da Tesla é “acelerar a transição para a energia sustentável”. Mas agora está oficialmente a trabalhar com a segunda administração Trump, que fez grandes mudanças na energia sustentável no seu primeiro dia. Trump já assinou ordens de suspensão arrendamentos federais para desenvolvimento eólico offshorepuxando o Estados Unidos fora do acordo climático de Parise está tentando reverter outras Políticas de EV da administração Biden.

A Tesla recentemente fez parte de um grupo que ganhou um prêmio de US$ 100 milhões do programa Financeiro para construir infraestrutura de carregamento para caminhões elétricos pesados ​​em Illinois, como TechCrunch relatado pela primeira vez na semana passada. A empresa esperava garantir cerca de US$ 40 milhões do pedido de financiamento original do grupo de US$ 126 milhões. A Tesla também buscou repetidamente cerca de US$ 100 milhões em financiamento financeiro para construir um corredor de carregamento de caminhões entre o norte da Califórnia e o sul do Texas, mas isso o aplicativo foi ignorado várias vezes.

O prêmio CFI da Tesla em Illinois é uma pequena parte dos quase US$ 2 bilhões que o Departamento de Transportes alocou nos últimos dois anos. A Tesla ganhou uma parcela muito maior de subsídios do programa NEVI – que distribui quantias menores de dinheiro aos estados, que, por sua vez, usam esses fundos para oferecer subsídios para construir infraestruturas de carregamento. Tesla havia vencido cerca de 13% de todos os prêmios NEVI em meados de 2024, e estava a utilizar esses milhões para desenvolver ainda mais a sua rede de Superchargers, que agora está aberta a quase todos os VE concorrentes.

Trump poderia retardar ou interromper o fluxo de gastos futuros desses programas, de acordo com Martin Lockman, pesquisador do Centro Sabin para Legislação sobre Mudanças Climáticas da Faculdade de Direito de Columbia. Ele poderá fazê-lo especialmente se a sua administração for bem-sucedida na prometida luta legal. sobre a Lei de Controle de Represamentoo que limita a capacidade do presidente de impedir o Congresso de gastar dinheiro que foi apropriado.

“Há muita margem de manobra aqui, e a administração Trump certamente fará tudo o que puder para atrasar os gastos no âmbito desses projetos de lei”, disse ele.

No entanto, não está claro se Trump pode legalmente impedir o financiamento de prémios que já estão sob contrato.

“As pessoas que têm contratos hoje têm direitos sob esses contratos e o Presidente não pode retirá-los”, disse ele.

Mas, advertiu Lockman, se as agências sentirem pressão suficiente de Trump, poderão violar os termos desses contratos – e potencialmente as leis que estabeleceram os programas de financiamento em primeiro lugar – e recusar-se a distribuir o dinheiro. Nessa situação, as empresas, agências estaduais e locais, ou outras entidades que ganhassem prêmios do NEVI ou do CFI teriam que lutar para que eles fossem cumpridos.

“Se a nova administração quiser fazer com que as pessoas lutem pelos seus contratos em tribunal, isso certamente seria uma enorme barreira à construção de infraestruturas de veículos elétricos”, disse ele.

Fonte: techcrunch.com

Continue lendo

TECNOLOGIA

Spotify apresenta cursos educacionais de áudio, começando no Reino Unido

O Spotify está expandindo seu serviço de streaming para incluir cursos educacionais, além de música, podcasts e audiolivros. A empresa na terça-feira anunciado o lançamento de um novo recurso chamado cursos, que permitirá aos usuários aprender sobre temas em áreas como negócios, tecnologia, estilo de vida, música e muito mais.

O recurso será inicialmente disponibilizado para usuários do Reino Unido, observa o Spotify.

Créditos da imagem:Chris Messina

A empresa vem trabalhando há algum tempo para tornar seu serviço conhecido por mais do que apenas música. Ao oferecer diferentes tipos de áudio, o Spotify pode aumentar sua receita por meio de diferentes formas de monetização. Isso inclui anúncios em áudio e vídeo podcasts (mesmo Anúncios de IA), bem como horas de “recarga” pagas para audiolivros destinados a assinantes que usam até suas 15 horas gratuitas por mês mas ainda quero continuar ouvindo. A empresa também está superando o líder de mercado Audible com um Assinatura independente de audiolivros por US$ 10 por mês.

Os cursos, se implementados de forma mais ampla, também poderão representar um novo fluxo de receita se o Spotify decidir introduzir cursos pagos ou apoiados por anúncios para um público mais amplo.

A empresa apontou alguns cursos que recomenda para começar, incluindo:

No entanto, o entusiasta da tecnologia e pioneiro na adoção, Chris Messina flagrou o desenvolvimento de cursos antes do anúncio oficial. O TechCrunch perguntou sobre o recurso, mas não obteve resposta antes da publicação do Spotify pelo seu postagem no blog.

É digno de nota que as descobertas de Messina indicam que existem cursos disponíveis sobre assuntos que podem atrair o público mais técnico, como aprender sobre IA, web3, metaverso e outras ferramentas digitais.

Além disso, ele encontrado que os usuários poderiam filtrar sua biblioteca do Spotify para mostrar apenas “Podcasts e cursos”, em vez de apenas “Podcasts”, como está escrito atualmente.

Embora o Spotify não tenha confirmado que os cursos chegarão aos EUA, Messina descobriu que conseguiu acesse a seção via pesquisa. Aqui, porém, as páginas da categoria estavam vazias, indicando que o recurso dos EUA ainda está em desenvolvimento.

Fonte: techcrunch.com

Continue lendo

Top

Social Media Auto Publish Powered By : XYZScripts.com