TECNOLOGIA
UE expandirá o apoio a startups de IA para utilizarem seus supercomputadores para treinamento de modelos
Um plano da União Europeia para apoiar startups locais de IA, fornecendo-lhes acesso ao poder de processamento para treinamento de modelos nos supercomputadores do bloco, que foi anunciado de volta em setembro e deu o pontapé inicial mês passadotem visto IA Mistral da França participar numa fase piloto inicial, de acordo com uma atualização da UE. Mas uma aprendizagem inicial é que o programa precisa de apoiar especificamente as startups de IA, a fim de as formar sobre como tirar o máximo partido da computação de alto desempenho da UE.
“Uma das coisas que temos visto é a necessidade, não apenas de fornecer acesso, mas de fornecer instalação — especialmente habilidades, conhecimento e experiência que temos nos centros de hospedagem — sobre como esse acesso pode ser não apenas facilitado, mas para desenvolver algoritmos de treinamento que utilizem o melhor da arquitetura e do poder computacional que está disponível neste momento em cada centro de supercomputação e nas nossas máquinas”, disse hoje um funcionário da UE durante uma conferência de imprensa.
O plano é a criação de “centros de excelência” para apoiar o desenvolvimento de algoritmos de IA dedicados que possam ser executados nos supercomputadores da UE, acrescentaram.
É mais provável que as startups de IA estejam acostumadas a usar hardware de computação dedicado fornecido por hiperscaladores dos EUA para treinar seus modelos do que a aproveitar o poder de processamento oferecido pelos supercomputadores como recurso de treinamento. Assim, o acesso à computação de alto desempenho para o programa de treinamento em IA está sendo ampliado com um invólucro de suporte, de acordo com autoridades da UE que falaram sobre os antecedentes antes do lançamento oficial da fita para MareNostrum 5um supercomputador pré-exaescala que será inaugurado quinta-feira no Centro de Supercomputação de Barcelona, na Espanha.
“Estamos a desenvolver instalações para que as nossas PME possam compreender como utilizar melhor os supercomputadores e como aceder aos supercomputadores e como paralelizar os seus algoritmos no caso da IA para poderem desenvolver os seus modelos”, disse um funcionário da Comissão. . “A partir de 2024, esperamos muito mais abordagens desse tipo do que temos agora.”
“A IA é considerada agora uma prioridade estratégica para a União”, acrescentaram. “Com a IA se tornando uma prioridade estratégicapróximo ao Lei de IAestamos a fornecer a capacidade de inovação — ou queremos fornecer uma grande janela de inovação para que as nossas PME e startups possam utilizar melhor as nossas máquinas e esta infraestrutura pública que temos criado para que possam competir internacionalmente no desenvolvimento seguro, algoritmos de IA confiáveis e éticos.”
Um “centro de apoio à IA” está a caminho, confirmou outro funcionário da UE – dizendo que este terá “uma via especial” para as PME e startups obterem ajuda para tirar o máximo partido dos recursos de supercomputação da UE. “O que precisamos de reconhecer é que a comunidade de IA não tem utilizado supercomputadores na última década”, observaram. “Eles não são novos usuários de GPUs, mas são novos usuários de como interagir com um supercomputador e, portanto, precisamos ajudá-los.
“Em muitos casos, a comunidade de IA nasce de um enorme conhecimento sobre quantas GPUs você consegue colocar em uma caixa? E eles têm sido muito bons nisso. Mas o que temos nos supercomputadores são muitas caixas com GPUs e há alguns conjuntos de habilidades extras e alguma ajuda extra que é necessária para expandir e usar o supercomputador em todo o seu potencial.”
O bloco tem intensificado substancialmente o seu investimento em supercomputadores ao longo dos últimos cinco anos – aumentando o hardware para um cluster de oito máquinas localizadas em toda a região, que também planeia interligar, através de redes terabit, para criar um recurso de supercomputação federado que irá estar acessível na nuvem para que esteja disponível para utilizadores em toda a Europa.
Os primeiros supercomputadores em exaescala da UE também deverão entrar em funcionamento nos próximos anos – um na Alemanha (provavelmente no próximo ano) e uma segunda máquina em França (prevista para 2025). A Comissão também tem investimentos previstos em computação quântica, com planos de adquirir um conjunto de simuladores quânticos que serão co-localizados com supercomputadores para fornecer um recurso híbrido que combine os dois tipos de hardware para que os computadores quânticos possam atuar como “aceleradores” para os supercomputadores clássicos, como diz a Comissão.
As aplicações que estão a ser desenvolvidas com base no hardware de computação de alto desempenho da UE incluem um projeto para simular os ecossistemas da Terra para modelar melhor as alterações climáticas e os sistemas meteorológicos, denominado Destino Terrae outro para inventar um gêmeo digital do corpo humano – que se espera ajude a promover a ciência médica, apoiando o desenvolvimento de medicamentos e até permitindo a medicina personalizada. Usar seus recursos de supercomputação para impulsionar especificamente startups de IA emergiu como uma prioridade estratégica mais recente após o Anúncio do presidente da UE sobre o programa de treinamento de acesso computacional para modelos de IA esta queda.
Mês passado, o bloco também anunciou o que chamou de “grande desafio de IA”: uma competição voltada para startups europeias de IA “com experiência em modelos de IA em grande escala” que visa selecionar até quatro startups locais promissoras que receberão um total de 4 milhões de horas de acesso à supercomputação para apoiar o desenvolvimento de modelos fundamentais. Um prémio de 1 milhão de euros também está reservado para distribuição aos vencedores – que deverão lançar os seus modelos desenvolvidos sob uma licença de código aberto para uso não comercial, ou através da publicação dos seus resultados de investigação, de acordo com a Comissão.
A UE já tinha um programa para fornecer aos utilizadores da indústria acesso a horas essenciais de recursos de supercomputação, através de um processo de convocatória de projetos. Mas o bloco está a aumentar a atenção sobre a IA comercial com programas e recursos dedicados – espiando a oportunidade de transformar a sua crescente rede de supercomputação numa fonte de energia estratégica para escalar a IA de uso geral “Made in Europe”. Portanto, parece não ser por acaso que a Mistral da França – uma startup de IA que pretende competir com gigantes do modelo de fundação dos EUA como a OpenAI, e que afirma oferecer “ativos abertos” (se não for ela própria totalmente de código aberto) – seja uma das primeiras beneficiárias do programa de acesso a supercomputadores da Comissão. (Embora possa levantar algumas sobrancelhas que uma empresa de tecnologia que acaba de arrecadar 385 milhões de euros em financiamento da Série A, inclusive de investidores norte-americanos como Andreessen Horowitz, General Catalyst e Salesforce, está na frente da fila para um brinde de computação na UE. Mas, bem, é outro sinal das apostas estratégicas de alto nível que estão sendo feitas na “grande IA”.)
Ainda é cedo para o programa “supercomputação para IA” da UE, por isso não está claro se ainda há muitas vantagens no treinamento de modelos para relatar sobre o acesso dedicado. (Entramos em contato com a Mistral para comentar, mas no momento em que este artigo foi escrito ele não havia respondido.) Mas a esperança da Comissão, pelo menos, é que, ao canalizar o apoio às startups de IA para que elas possam aproveitar seu investimento em computação de alto desempenho, combinado com a construção de hardware de supercomputador que, segundo ele, será cada vez mais adquirido e configurado tendo em mente o treinamento do modelo de IA, isso se traduzirá em uma vantagem competitiva para um ecossistema local de IA que está começando com o pé atrás em comparação com hiperescalador próximo Gigantes da IA dos EUA.
“Como não temos os grandes hiperescaladores que os americanos têm no caso de treinar este tipo de modelos fundamentais, utilizamos os nossos supercomputadores e desenvolveremos uma nova geração de supercomputadores que serão cada vez mais compatíveis com a IA”, observou um funcionário da Comissão. “Não apenas os que temos agora, mas, a partir de 2024, o objetivo seria seguirmos nessa direção – e fazer com que ainda mais das nossas PME utilizem os supercomputadores para desenvolver estes modelos fundamentais.”
O plano de jogo incluirá a aquisição de “máquinas de supercomputação de IA mais dedicadas, que serão mais baseadas em aceleradores do que em CPUs padrão”, acrescentaram.
Quer a estratégia de apoio à IA da UE se encaixe ou divirja da ambição de certos Estados-Membros de promover defensores nacionais da IA - algo de que ouvimos muito falar durante o recente negociações tensas para definir o livro de regras de IA do blocono qual A França liderou um esforço para uma exclusão regulatória dos modelos fundamentais que recebeu críticas de PMEs – ainda está para ser visto. Mas a presença precoce do Mistral no programa de acesso à supercomputação da UE pode sugerir um alinhamento de pensamento.
Fonte: techcrunch.com
TECNOLOGIA
O modelo de raciocínio de IA da OpenAI às vezes 'pensa' em chinês e ninguém sabe realmente por quê
Pouco depois do lançamento do OpenAI o1seu primeiro modelo de IA de “raciocínio”, as pessoas começaram a notar um fenômeno curioso. O modelo às vezes começava a “pensar” em chinês, persa ou algum outro idioma – mesmo quando fazia uma pergunta em inglês.
Dado um problema para resolver — por exemplo, “Quantos R existem na palavra 'morango?'” — o1 iniciaria o seu processo de “pensamento”, chegando a uma resposta através da execução de uma série de passos de raciocínio. Se a pergunta fosse escrita em inglês, a resposta final de o1 seria em inglês. Mas o modelo executaria algumas etapas em outro idioma antes de chegar à sua conclusão.
“[O1] comecei a pensar aleatoriamente em chinês no meio do caminho”, um usuário do Reddit disse.
“Por que [o1] começar a pensar aleatoriamente em chinês?” um usuário diferente perguntou em um postar no X. “Nenhuma parte da conversa (mais de 5 mensagens) foi em chinês.”
Por que o1 pro começou a pensar aleatoriamente em chinês? Nenhuma parte da conversa (mais de 5 mensagens) foi em chinês… muito interessante… influência dos dados de treinamento pic.twitter.com/yZWCzoaiit
-Rishab Jain (@RishabJainK) 9 de janeiro de 2025
A OpenAI não forneceu uma explicação para o comportamento estranho do o1 – nem mesmo o reconheceu. Então, o que pode estar acontecendo?
Bem, os especialistas em IA não têm certeza. Mas eles têm algumas teorias.
Vários no X incluindo o CEO da Hugging Face Clément Delangue aludiu ao fato de que modelos de raciocínio como o1 são treinados em conjuntos de dados contendo muitos caracteres chineses. Ted Xiao, pesquisador do Google DeepMind, afirmou que empresas, incluindo a OpenAI, usam serviços de rotulagem de dados chineses de terceiros e que a mudança para o chinês é um exemplo de “influência linguística chinesa no raciocínio”.
“[Labs like] OpenAI e Antrópico utilizam [third-party] serviços de rotulagem de dados para dados de raciocínio em nível de doutorado para ciências, matemática e codificação”, escreveu Xiao em um postar no X. “[F]ou disponibilidade de mão de obra especializada e razões de custo, muitos desses fornecedores de dados estão baseados na China.”
Os rótulos, também conhecidos como tags ou anotações, ajudam os modelos a compreender e interpretar os dados durante o processo de treinamento. Por exemplo, rótulos para treinar um modelo de reconhecimento de imagem podem assumir a forma de marcações em torno de objetos ou legendas referentes a cada pessoa, lugar ou objeto representado em uma imagem.
Estudos demonstraram que rótulos tendenciosos podem produzir modelos tendenciosos. Por exemplo, o anotador médio é mais provável que rotule frases em inglês vernáculo afro-americano (AAVE), a gramática informal usada por alguns negros americanos, como tóxicas, levando os detectores de toxicidade de IA treinados nos rótulos a ver AAVE como desproporcionalmente tóxico.
Outros especialistas, no entanto, não aceitam a hipótese chinesa de rotulagem de dados. Eles apontam que o1 tem a mesma probabilidade de mudar para hindi, Tailandêsou um idioma diferente do chinês enquanto procura uma solução.
Em vez disso, esses especialistas dizem, o1 e outros modelos de raciocínio pode ser simplesmente usando idiomas consideram mais eficiente para alcançar um objetivo (ou alucinando).
“O modelo não sabe o que é a linguagem ou que as línguas são diferentes”, disse Matthew Guzdial, pesquisador de IA e professor assistente da Universidade de Alberta, ao TechCrunch. “É tudo apenas uma mensagem de texto.”
Na verdade, os modelos não processam palavras diretamente. Eles usam fichas em vez de. Fichas pode ser palavras como “fantástico”. Ou podem ser sílabas, como “fan”, “tas” e “tic”. Ou podem até ser caracteres individuais em palavras – por exemplo, “f”, “a”, “n”, “t”, “a”, “s”, “t”, “i”, “c”.
Assim como a rotulagem, os tokens podem introduzir preconceitos. Por exemplo, muitos tradutores de palavra para token assumem que um espaço em uma frase denota uma nova palavra, apesar do fato de que nem todos os idiomas usam espaços para separar palavras.
Tiezhen Wang, engenheiro de software da startup de IA Hugging Face, concorda com Guzdial que as inconsistências de linguagem dos modelos de raciocínio podem ser explicadas por associações feitas pelos modelos durante o treinamento.
“Ao abraçar todas as nuances linguísticas, expandimos a visão de mundo do modelo e permitimos que ele aprenda com todo o espectro do conhecimento humano”, Wang escreveu em uma postagem no X. “Por exemplo, prefiro fazer contas em chinês porque cada dígito tem apenas uma sílaba, o que torna os cálculos nítidos e eficientes. Mas quando se trata de temas como preconceito inconsciente, mudo automaticamente para o inglês, principalmente porque foi lá que aprendi e absorvi essas ideias pela primeira vez.”
A teoria de Wang é plausível. Afinal, os modelos são máquinas probabilísticas. Treinados em muitos exemplos, eles aprendem padrões para fazer previsões, como “para quem” em um e-mail normalmente precede “pode interessar”.
Mas Luca Soldaini, cientista pesquisador do Instituto Allen de IA, sem fins lucrativos, alertou que não podemos ter certeza. “É impossível fazer backup desse tipo de observação em um sistema de IA implantado devido à opacidade desses modelos”, disse ele ao TechCrunch. “É um dos muitos casos em que a transparência na forma como os sistemas de IA são construídos é fundamental.”
Sem uma resposta da OpenAI, ficamos pensando sobre por que o1 pensa em músicas em francês, mas biologia sintética em mandarim.
Fonte: techcrunch.com
TECNOLOGIA
AWS promete gastar US$ 5 bilhões no México e lança nova região de servidores no México
Em um anúncio Terça-feira, a Amazon Web Services (AWS), divisão de computação em nuvem da Amazon, disse que planeja investir US$ 5 bilhões no México nos próximos 15 anos como parte de um “compromisso de longo prazo” na região.
Uma parte desse investimento é uma nova região de servidores no México, lançada hoje, AWS México, que permitirá aos clientes da AWS executar aplicativos e atender usuários de data centers da AWS localizados no país. A AWS estima que a construção e a operação contínua da AWS México acrescentarão cerca de US$ 10 bilhões ao PIB do México e apoiarão cerca de 7.000 “empregos equivalentes em tempo integral”.
“Este lançamento marca um passo significativo à medida que continuamos a expandir nossa infraestrutura e oferecer inovação global em aprendizado de máquina, IA e outras tecnologias avançadas para nossos clientes”, disse o vice-presidente de serviços de infraestrutura da AWS, Prasad Kalyanaraman, em um comunicado. “Com acesso a uma infraestrutura segura e confiável, juntamente com um amplo conjunto de tecnologias da AWS, esta nova região da AWS ajudará as empresas em todo o México a se posicionarem no centro da inovação em IA e machine learning.”
O mercado de data centers no México está crescendo. De acordo com segundo uma fonte, espera-se que as empresas tecnológicas gastem mais de 7 mil milhões de dólares em infra-estruturas de centros de dados nos próximos cinco anos, e mais de uma dúzia de projectos estão actualmente em curso.
A cidade de Querétaro, onde está localizada a AWS México, tornou-se o epicentro dos investimentos. O Google lançou um data center em nuvem em Querétaro em dezembro, enquanto a Microsoft criou um conjunto de servidores na cidade em maio passado.
Espera-se que 73 data centers sejam construídos no México nos próximos cinco anos – um volume que os especialistas dizem que terá um impacto sério na rede elétrica do país. De acordo com Segundo a Associação Mexicana de Data Centers (MDCA), um grupo industrial, a nova infraestrutura poderá consumir até 1.492 MWh de energia até 2029, o suficiente para abastecer cerca de 150.000 residências.
Para satisfazer a procura de electricidade, o MDCA estima que o governo mexicano e as empresas terão de investir pelo menos 8,73 mil milhões de dólares para melhorar a rede e os fornecedores de energia do México.
Os defensores do ambiente também levantaram preocupações sobre o impacto a longo prazo dos centros de dados. Os data centers normalmente consomem muita água; eles exigem água não apenas para resfriar componentes como chips, mas para manter um umidade operacional segura. Querétaro sofre com a seca há dois anos, e a estação seca do México em 2025 está esperado durar pelo menos seis meses.
A AWS disse que seu data center AWS México será refrigerado a ar e “não exigirá o uso contínuo de água de resfriamento nas operações”. Microsoft disse que o seu data center na região usaria novas tecnologias para reduzir o uso de água para resfriamento, e o Google se comprometeu a fazer parceria com suprimentos “ambientalmente responsáveis” para reduzir o consumo.
Fonte: techcrunch.com
TECNOLOGIA
A Coreia do Norte roubou mais de US$ 659 milhões em roubos de criptografia durante 2024 e implantou falsos candidatos a emprego
Hackers apoiados pela Coreia do Norte roubaram pelo menos US$ 659 milhões por meio de vários roubos de criptomoedas em 2024, ao mesmo tempo em que empregaram trabalhadores de TI para se infiltrarem em empresas de blockchain como ameaças internas, de acordo com o Japão, a Coreia do Sul e os Estados Unidos em um declaração conjunta rara (PDF) na terça-feira.
O anúncio forneceu a primeira confirmação oficial de que a Coreia do Norte estava por trás da iniciativa de Julho. Hack de US$ 235 milhões do WazirXa maior bolsa de criptomoedas da Índia. A violação de julho de 2024 forçou o WazirX a suspender a negociação e mais tarde reestruturar a empresa.
Outros ataques importantes incluíram um roubo de US$ 308 milhões do DMM Bitcoin do Japão, US$ 50 milhões cada da Upbit e Radiant Capital e US$ 16,13 milhões da Rain Management, de acordo com o comunicado conjunto.
A declaração diz que o Grupo Lazarus, um conhecido grupo ameaçador de hackers norte-coreanos, conduziu ataques de engenharia social e implantou malware para roubo de criptomoedas, como TraderTraidor para violar trocas, ao mesmo tempo que se infiltram em empresas, fazendo com que trabalhadores de TI norte-coreanos se apresentem como candidatos a empregos, de acordo com o comunicado.
“Os Estados Unidos, o Japão e a República da Coreia aconselham as entidades do setor privado, particularmente nas indústrias de blockchain e de trabalho freelance, a rever minuciosamente estes avisos e anúncios para melhor informar as medidas de mitigação de ameaças cibernéticas e mitigar o risco de contratação inadvertida de trabalhadores de TI da RPDC, ”, disseram os governos.
Relatórios anteriores da ONU estimavam que a Coreia do Norte roubou US$ 3 bilhões em criptomoeda entre 2017 e 2023 para financiar os seus programas de armas nucleares sancionados. Dados recentes da Chainalysis mostraram que os hackers norte-coreanos foram responsáveis por 61% de todas as criptomoedas roubadas em 2024, totalizando US$ 1,34 bilhão.
Fonte: techcrunch.com
-
TECNOLOGIA2 semanas ago
Essas empresas fintech estão contratando em 2025, após um ano turbulento
-
TECNOLOGIA1 semana ago
Conferência de imprensa CES 2025 da Sony: como assistir
-
GAMES1 semana ago
Minecraft Creator confirma Minecraft 2 (mais ou menos)
-
SÉRIES6 dias ago
Star Wars acaba de confirmar quem interpretará o personagem mais misterioso de ‘Skeleton Crew’
-
TECNOLOGIA6 dias ago
CES 2025 estava cheio de lixo IRL AI
-
TECNOLOGIA2 semanas ago
Aplicativo VPN da Cloudflare entre meia dúzia retirado de lojas de aplicativos indianas
-
ANIMES2 semanas ago
Blue Lock Super Fan se casa com personagem de anime Yoichi Isagi em cerimônia de casamento revelada
-
FILMES2 semanas ago
'Wicked' é agora um dos filmes de ação ao vivo de maior bilheteria de todos os tempos no mercado interno