Conecte-se com a gente!

TECNOLOGIA

Google Gemini: tudo o que você precisa saber sobre a nova plataforma generativa de IA

O Google está tentando fazer sucesso com o Gemini, uma nova plataforma generativa de IA que recentemente fez sua grande estreia. Mas embora Gêmeos pareça promissor em alguns aspectos, fica aquém de outros. Então, o que é Gêmeos? Como você pode usá-lo? E como isso se compara à concorrência?

Para tornar mais fácil acompanhar os desenvolvimentos mais recentes do Gemini, elaboramos este guia prático, que manteremos atualizado à medida que novos modelos e recursos do Gemini forem lançados.

O que é Gêmeos?

Gêmeos é do Google há muito prometido, família de modelos de IA generativa de última geração, desenvolvida pelos laboratórios de pesquisa de IA do Google DeepMind e Google Research. Ele vem em três sabores:

  • Gêmeos Ultrao principal modelo Gemini
  • Gêmeos Profissionalum modelo Gemini “leve”
  • Gêmeos Nanoum modelo “destilado” menor que roda em dispositivos móveis como o Pixel 8 Pro

Todos os modelos Gemini foram treinados para serem “nativamente multimodais” – em outras palavras, capazes de trabalhar e usar mais do que apenas texto. Eles foram pré-treinados e ajustados em uma variedade de áudio, imagens e vídeos, um grande conjunto de bases de código e texto em diferentes idiomas.

Isso diferencia o Gemini de modelos como o grande modelo de linguagem do Google LaMDA, que foi treinado apenas em dados de texto. O LaMDA não consegue entender ou gerar nada além de texto (por exemplo, ensaios, rascunhos de e-mail e assim por diante) — mas esse não é o caso dos modelos Gemini. A sua capacidade de compreender imagens, áudio e outras modalidades ainda é limitada, mas é melhor que nada.

Qual é a diferença entre Bardo e Gêmeos?

Bardo do Google

Créditos da imagem: Google

Google, provando outra vez que lhe falta talento para branding, não deixou claro desde o início que Gêmeos é separado e distinto de Bard. Bard é simplesmente uma interface através da qual certos modelos Gemini podem ser acessados ​​– pense nele como um aplicativo ou cliente para Gemini e outros modelos de IA da geração. Gemini, por outro lado, é uma família de modelos – não um aplicativo ou frontend. Não existe uma experiência autônoma de Gêmeos, nem provavelmente nunca existirá. Se você comparar com os produtos da OpenAI, Bard corresponde a Bate-papoGPTo popular aplicativo de IA conversacional da OpenAI, e Gemini corresponde ao modelo de linguagem que o alimenta, que no caso do ChatGPT é GPT-3.5 ou 4.

Aliás, Gêmeos também é totalmente independente de Imagem-2, um modelo de texto para imagem que pode ou não se enquadrar na estratégia geral de IA da empresa. Não se preocupe, você não é o único confuso com isso!

O que Gêmeos pode fazer?

Como os modelos Gemini são multimodais, eles podem, em teoria, realizar uma série de tarefas, desde a transcrição de fala até a legenda de imagens e vídeos e a geração de obras de arte. Poucos desses recursos atingiram o estágio de produto ainda (mais sobre isso mais tarde), mas o Google promete todos eles – e mais – em algum momento em um futuro não muito distante.

Claro, é um pouco difícil acreditar na palavra da empresa.

Google seriamente sub-entregue com o lançamento original do Bard. E mais recentemente irritou as penas com um vídeo que pretende mostrar as capacidades do Gemini que acabou sendo fortemente manipulado e era mais ou menos aspiracional. Gêmeos épara crédito do gigante da tecnologia, disponível de alguma forma hoje – mas de forma bastante limitada.

Ainda assim, supondo que o Google esteja sendo mais ou menos verdadeiro em suas afirmações, eis o que os diferentes níveis de modelos Gemini serão capazes de fazer quando forem lançados:

Gêmeos Ultra

Poucas pessoas colocaram as mãos no Gemini Ultra, o modelo de “base” sobre o qual os outros são construídos, até agora – apenas um “conjunto seleto” de clientes em um punhado de aplicativos e serviços do Google. Isso não mudará até o final deste ano, quando o maior modelo do Google for lançado de forma mais ampla. A maioria das informações sobre o Ultra veio de demonstrações de produtos lideradas pelo Google, por isso é melhor considerá-las com cautela.

O Google diz que o Gemini Ultra pode ser usado para ajudar em coisas como trabalhos de física, resolver problemas passo a passo em uma planilha e apontar possíveis erros em respostas já preenchidas. O Gemini Ultra também pode ser aplicado a tarefas como identificar artigos científicos relevantes para um problema específico, diz o Google – extraindo informações desses artigos e “atualizando” um gráfico de um deles, gerando as fórmulas necessárias para recriar o gráfico com dados mais recentes.

Gemini Ultra suporta tecnicamente a geração de imagens, conforme mencionado anteriormente. Mas essa capacidade não chegará à versão produzida do modelo no lançamento, de acordo com o Google – talvez porque o mecanismo seja mais complexo do que a forma como aplicativos como Bate-papoGPT gerar imagens. Em vez de enviar prompts para um gerador de imagens (como DALL-E 3no caso do ChatGPT), o Gemini gera imagens “nativamente” sem uma etapa intermediária.

Gêmeos Profissional

Ao contrário do Gemini Ultra, o Gemini Pro está disponível publicamente hoje. Mas, confusamente, suas capacidades dependem de onde é usado.

O Google diz que em Bard, onde o Gemini Pro foi lançado pela primeira vez em formato somente texto, o modelo é uma melhoria em relação ao LaMDA em suas capacidades de raciocínio, planejamento e compreensão. Um independente estudar por pesquisadores da Carnegie Mellon e BerriAI descobriram que o Gemini Pro é realmente melhor que o OpenAI GPT-3.5 em lidar com cadeias de raciocínio mais longas e complexas.

Mas o estudo também descobriu que, como todos os grandes modelos de linguagem, o Gemini Pro enfrenta dificuldades particularmente com problemas matemáticos que envolvem vários dígitos, e os usuários encontraram muitos exemplos de maus raciocínios e erros. Cometeu muitos erros factuais em perguntas simples, como quem ganhou o último Oscar. O Google prometeu melhorias, mas não está claro quando elas chegarão.

O Gemini Pro também está disponível via API no Vertex AI, a plataforma de desenvolvimento de IA totalmente gerenciada do Google, que aceita texto como entrada e gera texto como saída. Um endpoint adicional, Gemini Pro Vision, pode processar texto e imagens – incluindo fotos e vídeos – e texto de saída nos moldes do OpenAI GPT-4 com Visão modelo.

Gêmeos

Usando Gemini Pro na Vertex AI.

Na Vertex AI, os desenvolvedores podem personalizar o Gemini Pro para contextos e casos de uso específicos usando um processo de ajuste fino ou “aterramento”. O Gemini Pro também pode ser conectado a APIs externas de terceiros para realizar ações específicas.

Em algum momento do “início de 2024”, os clientes da Vertex poderão usar o Gemini Pro para capacitar agentes de conversação e bate-papo personalizados (ou seja, chatbots). O Gemini Pro também se tornará uma opção para impulsionar recursos de resumo de pesquisa, recomendação e geração de respostas na Vertex AI, recorrendo a documentos de diversas modalidades (por exemplo, PDFs, imagens) de diferentes fontes (por exemplo, OneDrive, Salesforce) para satisfazer consultas.

Gêmeos

Créditos da imagem: Gêmeos

No AI Studio, a ferramenta baseada na web do Google para desenvolvedores de aplicativos e plataformas, há fluxos de trabalho para criar prompts de formato livre, estruturados e de bate-papo usando o Gemini Pro. Os desenvolvedores têm acesso aos endpoints Gemini Pro e Gemini Pro Vision e podem ajustar a temperatura do modelo para controlar a faixa criativa da saída e fornecer exemplos para fornecer instruções de tom e estilo – e também ajustar as configurações de segurança.

Gêmeos Nano

Gemini Nano é uma versão muito menor dos modelos Gemini Pro e Ultra e é eficiente o suficiente para ser executado diretamente em (alguns) telefones, em vez de enviar a tarefa para um servidor em algum lugar. Até agora, ele oferece dois recursos no Pixel 8 Pro: Resumir no Gravador e Resposta Inteligente no Gboard.

O aplicativo Recorder, que permite aos usuários apertar um botão para gravar e transcrever áudio, inclui um resumo desenvolvido pelo Gemini de suas conversas, entrevistas, apresentações e outros trechos gravados. Os usuários recebem esses resumos mesmo que não tenham sinal ou conexão Wi-Fi disponível – e em uma homenagem à privacidade, nenhum dado sai do telefone no processo.

O Gemini Nano também está no Gboard, aplicativo de teclado do Google, como um visualização do desenvolvedor. Lá, ele ativa um recurso chamado Resposta Inteligente, que ajuda a sugerir a próxima coisa que você deseja dizer ao conversar em um aplicativo de mensagens. O recurso inicialmente funciona apenas com o WhatsApp, mas chegará a mais aplicativos em 2024, afirma o Google.

O Gemini é melhor que o GPT-4 da OpenAI?

Não há como saber como a família Gemini realmente acumula até o Google lançar o Ultra ainda este ano, mas a empresa reivindicou melhorias no estado da arte – que geralmente é o GPT-4 da OpenAI.

O Google elogiou várias vezes a superioridade do Gemini em benchmarks, alegando que o Gemini Ultra excede os resultados atuais de última geração em “30 dos 32 benchmarks acadêmicos amplamente utilizados em pesquisa e desenvolvimento de grandes modelos de linguagem”. A empresa afirma que o Gemini Pro, por sua vez, é mais capaz em tarefas como resumir conteúdo, brainstorming e escrever do que o GPT-3.5.

Mas deixando de lado a questão de saber se os benchmarks realmente indicam um modelo melhor, as pontuações que o Google aponta parecem ser apenas marginalmente melhores do que os modelos correspondentes da OpenAI. E – como mencionado anteriormente – algumas impressões iniciais não foram boas, com Usuários e acadêmicos apontando que o Gemini Pro tende a errar os fatos básicos, tem dificuldades com traduções e dá sugestões de codificação ruins.

Quanto custará Gêmeos?

O Gemini Pro é gratuito para uso no Bard e, por enquanto, no AI Studio e no Vertex AI.

Assim que o Gemini Pro sair da visualização no Vertex, no entanto, o modelo custará US$ 0,0025 por caractere, enquanto a produção custará US$ 0,00005 por caractere. Os clientes da Vertex pagam por 1.000 caracteres (cerca de 140 a 250 palavras) e, no caso de modelos como Gemini Pro Vision, por imagem (US$ 0,0025).

Vamos supor que um artigo de 500 palavras contenha 2.000 caracteres. Resumir esse artigo com o Gemini Pro custaria US$ 5. Enquanto isso, gerando um artigo de comprimento semelhante custaria US$ 0,1.

Onde você pode experimentar o Gêmeos?

Gêmeos Profissional

O lugar mais fácil para experimentar o Gemini Pro é em Bardo. Uma versão aprimorada do Pro está respondendo a perguntas do Bard baseadas em texto em inglês nos EUA no momento, com idiomas adicionais e países com suporte definidos para chegar no futuro.

Gemini Pro também é acessível na visualização no Vertex AI por meio de uma API. A API é gratuita para uso “dentro dos limites” por enquanto e oferece suporte a 38 idiomas e regiões, incluindo a Europa, bem como recursos como funcionalidade de bate-papo e filtragem.

Em outros lugares, o Gemini Pro pode ser encontrado no AI Studio. Usando o serviço, os desenvolvedores podem iterar prompts e chatbots baseados em Gemini e, em seguida, obter chaves de API para usá-los em seus aplicativos – ou exportar o código para um IDE com mais recursos.

Duet AI para desenvolvedores, o conjunto de ferramentas de assistência baseadas em IA do Google para conclusão e geração de código, começará a usar um modelo Gemini nas próximas semanas. E o Google planeja trazer modelos Gemini para ferramentas de desenvolvimento para Chrome e sua plataforma de desenvolvimento móvel Firebase na mesma época, no início de 2024.

Gêmeos Nano

Gemini Nano está no Pixel 8 Pro – e chegará a outros dispositivos no futuro. Os desenvolvedores interessados ​​em incorporar o modelo em seus aplicativos Android podem inscrever-se para dar uma espiada.

Manteremos este post atualizado com os desenvolvimentos mais recentes.

Fonte: techcrunch.com

Continue lendo
Clique para comentar

Deixe sua resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

TECNOLOGIA

Float Financial, que pretende ser o Brex do Canadá, consegue US$ 48,5 milhões na Série B

Float Financial, uma startup de gestão de despesas e cartões corporativos focada no mercado canadense, levantou US$ 48,5 milhões em uma rodada de financiamento da Série B.

A fintech com sede em Toronto se compara aos gigantes da fintech com sede nos EUA Brex e Rampa mas diz que é diferente porque seu único foco está nas pequenas e médias empresas canadenses, que o CEO e cofundador Rob Khazzam disse serem “esquecidas devido ao monopólio bancário do Canadá e ao clima econômico difícil”.

A Goldman Sachs Growth Equity liderou o financiamento, que incluiu a participação da OMERS Ventures, FJ Labs, Teralys e do investidor existente Garage Capital. O aumento eleva o financiamento total de risco da Float Financial para US$ 92,6 milhões desde seu início em 2020. A empresa também levantou uma linha de crédito de US$ 36,9 milhões em fevereiro de 2024, que está usando para conceder crédito aos clientes.

A empresa recusou-se a revelar a avaliação, observando apenas que se tratava de uma “rodada ascendente” em relação ao seu US$ 30 milhões Série A aumento liderado pela Tiger Global em novembro de 2021.

Embora Khazzam tenha se recusado a revelar números concretos de receita, ele afirma que a Float viu sua receita aumentar em “50x” e o volume total de pagamentos em 45x desde o aumento da Série A. Afirma também que registou um aumento de 30 vezes nos activos sob gestão, acrescentou. A empresa ainda não é lucrativa.

A Float lançou seu primeiro produto em maio de 2021 e vem expandindo lentamente sua oferta de cartões corporativos e gerenciamento de despesas para incluir pagamento de contas, contas de alto rendimento, automação de contas a pagar e cartões físicos virtuais em dólares canadenses e americanos. Jane Software, LumiQ, Knix estão entre seus 4.000 clientes.

Khazzam rejeitou o que descreveu como “conversas ultimamente na mídia de que as empresas canadenses não são um bom lugar para investir no momento”.

“O cenário das pequenas e médias empresas canadenses é rico, diversificado e repleto de potencial”, disse ele ao TechCrunch. “Na Float, entendemos que atender às necessidades dessas empresas requer uma abordagem distintamente canadense… Nosso sistema financeiro precisa corresponder à velocidade e à ambição das empresas canadenses se quisermos prosperar localmente e competir globalmente.”

A Float planeja usar seu novo capital para expandir ainda mais sua oferta de produtos e presença regional no Canadá, bem como continuar contratando.

Laura Lenz, sócia da OMERS Ventures, acredita que a “capacidade da Float de trabalhar dentro da estrutura regulatória canadense e…compreender as nuances deste mercado” é fundamental para o seu sucesso.

“É preciso alguém intimamente familiarizado com essas nuances para ser capaz de criar um produto que funcione”, disse ela. “Como investidores com fortes raízes canadianas, sabemos que há uma necessidade urgente de infraestruturas bancárias que ajudem as empresas canadianas a acompanhar o ritmo dos seus homólogos dos EUA e a permanecerem competitivas no cenário global.”

Quer mais notícias sobre fintech na sua caixa de entrada? Inscreva-se no TechCrunch Fintech aqui.

Quer entrar em contato com uma dica? Envie-me um e-mail para maryann@techcrunch.com ou envie-me uma mensagem no Signal pelo telefone 408.204.3036. Você também pode enviar uma nota para toda a equipe do TechCrunch em dicas@techcrunch.com. Para comunicações mais seguras, clique aqui para entrar em contato conoscoque inclui SecureDrop e links para aplicativos de mensagens criptografadas.

Fonte: techcrunch.com

Continue lendo

TECNOLOGIA

CoreWeave, um provedor de computação de IA de US$ 19 bilhões, abre seus primeiros data centers internacionais no Reino Unido

Coreweavea empresa de computação em nuvem que fornece às empresas recursos de computação de IA, abriu formalmente seus dois primeiros data centers no Reino Unido – o primeiro fora do mercado doméstico dos EUA.

CoreWeave abriu a sua sede europeia em Londres em Maio passadologo depois de ganhar um Avaliação de US$ 19 bilhões por trás de $ 1,1. arrecadação de bilhões de dólares. Ao mesmo tempo, a empresa anunciou planos para abrir dois data centers como parte de um investimento de £ 1 bilhão (US$ 1,25 bilhão) no Reino Unido.

A notícia de hoje coincide com uma anúncio separado do governo do Reino Unidoque detalha um plano de investimento de cinco anos para reforçar a capacidade de computação de IA de propriedade do governo, bem como “zonas de crescimento de IA” geográficas, que incluem infraestrutura de IA do setor privado.

“Este investimento é um enorme voto de confiança no setor de tecnologia digital do Reino Unido e é exatamente o tipo que queremos ver à medida que crescemos a economia e usamos a IA para impulsionar a eficiência”, Raquel Reevesdisse o Chanceler do Tesouro do Reino Unido, em um comunicado.

O primeiro data center da CoreWeave no Reino Unido entrou silenciosamente em operação em Crawley em outubro, disse a empresa, e o segundo hub iniciou operações em dezembro nas Docklands de Londres. Ambos os locais usam GPUs Hopper da Nvidia (unidades de processamento gráfico), com base em seu atualizado Série de chips H200 projetado para cargas de trabalho de IA.

Da criptografia à computação de IA

Fundada em 2017, a CoreWeave começou com foco na mineração de criptografia, mas com o aumento na demanda por computação de IA – o poder de processamento e a infraestrutura necessários para realizar tarefas computacionais, como a execução de algoritmos e modelos de aprendizado de máquina – a empresa redirecionou sua infraestrutura de GPU. para essas cargas de trabalho.

CoreWeave é uma das várias startups de infraestrutura em nuvem que buscam capitalizar a onda de hype da IA, incluindo players nacionais europeus, como FlexAI da França; DataCrunch, que é baseado fora da Finlândia; e Nebius, com sede na Holanda, que emergiu das cinzas da gigante russa da internet Yandex.

CoreWeave disse que abriu 28 data centers até o final de 2024, incluindo os dois novos anunciados hoje. Também está planejando 10 novos data centers em 2025, três dos quais estarão na Europa, incluindo três locais anunciados anteriormente na Noruega, Suécia e Espanha.

Fonte: techcrunch.com

Continue lendo

TECNOLOGIA

Mastodon anuncia transição para estrutura sem fins lucrativos

Organização de rede social descentralizada Mastodonte disse na segunda-feira que está planejando criar uma nova organização sem fins lucrativos na Europa e entregar a propriedade de entidades responsáveis ​​pelos principais componentes do ecossistema e da plataforma Mastodon. Isso significa que uma pessoa não terá controle sobre todo o projeto. A organização tenta se diferenciar das redes sociais controladas por CEOs como Elon Musk e Mark Zuckerberg.

Embora os detalhes exatos ainda não tenham sido finalizados, isso significa que o atual CEO e criador da Mastodon, Eugen Rochko, entregará a gestão da organização à nova entidade e se concentrará na estratégia do produto.

A organização disse que continuará a sediar o mastodonte.social e mastodonte.online servidores, nos quais os usuários podem se inscrever e ingressar na rede baseada em ActivityPub.

“Quando o fundador Eugen Rochko começou a trabalhar no Mastodon, seu foco estava na criação do código e das condições para o tipo de mídia social que ele imaginava. A configuração legal era um meio para atingir um fim, uma solução rápida que lhe permitia continuar as operações. Desde o início, ele declarou que Mastodon não estaria à venda e estaria livre do controle de um único indivíduo rico, e ele poderia garantir isso porque era a pessoa no controle, o único tomador de decisão final”, disse Mastodon em uma postagem no blog.

No ano passado, a empresa formou uma organização sem fins lucrativos com sede nos EUA para obter mais fundos e subsídios com o cofundador do Twitter, Biz Stone, no conselho. Como efeito colateral, a organização perdeu ao mesmo tempo o seu estatuto de organização sem fins lucrativos na Alemanha.

A postagem do blog observou que a nova entidade sem fins lucrativos com sede na Europa será proprietária integral da entidade com fins lucrativos Mastodon GmbH. A organização está em fase de finalização do local onde será instalada a nova entidade.

“Estamos dedicando algum tempo para selecionar a jurisdição e a estrutura apropriadas na Europa. Em seguida, determinaremos quais outras estruturas jurídicas (subsidiárias) são necessárias para apoiar as operações e a sustentabilidade”, afirmou o post.

“Durante todo o processo, nos concentraremos em estabelecer estruturas apropriadas de governança e liderança que reflitam a natureza e o propósito do Mastodon como um todo e sirvam a comunidade de forma responsável.”

Nos últimos meses, a propriedade de projetos de código aberto tem sido assunto recorrente nas notícias. Por exemplo, as pessoas questionaram o controle de certos projetos da comunidade WordPress estando nas mãos do co-criador do WordPress Matt Mullenweg. Mastodon está tentando evitar situações em que apenas uma pessoa tenha poderes de tomada de decisão com a nova estrutura atual.

Fonte: techcrunch.com

Continue lendo

Top

Social Media Auto Publish Powered By : XYZScripts.com