Olá! Hoje quero te apresentar uma ferramenta obrigatória para quem está entrando, ou já faz parte, do mundo de Inteligência Artificial: O Hugging Face Hub , hf para os íntimos, ou apenas 🤗
O Hugging Face Hub é uma plataforma com diversos modelos de IA, datasets, demo de aplicações… Em outras palavras, é uma plataforma OPEN SOURCE de Inteligência Artificial.
Para ser mais simples, eu gosto de definir como um GIGANTESCO repositório de ferramentas voltadas exclusivamente para Inteligência Artificial… Sendo que a principal delas são os próprios modelos de IA disponíveis para você usar para estudos e até para montar um negócio!
O Hub pertence a empresa de mesmo nome, a Hugging Face, que fica nos EUA. Eles receberam investimentos gigantes de empresas nada mais, nada menos que Google, Amazon, Nvidia, Intel e IBM! Eles possuem serviços pagos como conta PRO, com mais recursos, hubs privados, etc. (Assim como GitHub também tem uma parte grátis, que é muito boa já, e uma parte paga).
E, falando em git, o Hugging Face organiza tudo em repositórios git. Isto é, os modelos de IA, os datasets para treinar estes modelos e as demonstrações de uso destes modelos são disponibilizados como se fosse um repositório git. Isso significa que você tem todos os benefícios do controle de versão que o git oferece e a facilidade de um time inteiro poder trabalhar em diferentes partes do seu projeto de IA. Isso é sensacional!
A estrutura que você vai encontrar no Hub se resume assim:
- Repositórios: Tudo é organizado como se fossem repositório git. Você vai encontrar os arquivos, suas versões, pode usar os comandos e git na sua máquina a partir da URL do repositório, pode criar Pull Request, participar de discussões.
Aqui, você vai encontrar um conceito novo. Uma espécie de “Tipo de Repositório”. Dependo do tipo, ele vai ter algumas particularidades e configurações diferentes de outros. Mas, no fim, são apenas repositórios git! - Models: No Hugging Face Hub, você tem um local exclusivo para guardar os arquivos de modelos de IA. É o model hub, que é um repositório git onde você pode armazenar e versionar os arquivos de um modelo de IA. Inclusive, você pode baixá-los usando um simples comando git clone, ou usando as bibliotecas python do Hugging Face. No vídeo sobre clonar a voz, neste trecho em que o model está sendo baixado, o que acontece é exatamente isso: Os arquivos do modelo estão sendo baixados do Hugging Face.
- Datasets: Os datasets são dados que você pode usar para treinar modelos de IA. O Hugging Face dedica um local específico para eles. São os repositórios exclusivos para guardar esses arquivos. Com isso, você tem um local centralizado com diversos tipos de datasets, contendo as mais variadas informações, com qualidade muito boa, para que você possa fazer o treinamento de um modelo de IA. E, obviamente, você pode criar o seu próprio repositório de datasets e compartilhá-lo com o resto do mundo!
- Spaces: Aqui é onde você criar interfaces e aplicações de demonstração que usam o modelos e datasets, muito rapidamente. Os spaces são repositórios git que, além do código da interface web, eles possuem hardware associado. Você pode configurar o uso de GPUs e CPU para seus modelos de IA e disponibilizar eles através de um interface web para testes usando frameworks como o Gradio. Existe um configuração mínima de hardware que você pode usar de graça, mas, caso queria mais poder de processamento, você pode comprar recursos mais poderosos, pagando por hora (os recursos são alocados na cloud da AWS)
Desde que descobri, eu tenho usado o Hugging Face direto nessa jornada e a quantidade de material disponível realmente é absurda.
Novidade no IaTalking: Destaques da Comunidade
O Hugging Face possui um server no Discord, que é um local onde podemos conversar real time com diversas pessoas, tanto aqueles que trabalham e mantém o Hugging Face, quanto outras pessoas da comunidade de AI do mundo inteiro!
Eu recomendo que você que está começando, assim como eu, ou mesmo que já trabalha, mas não conhece, entre no Discord do Hugging Face, pois eu achei incrível a quantidade de recursos, notícias, discussões, que tem lá… A maioria que eu encontrei foi tudo em Inglês, mas, quem sabe não fortalecemos a participação brasileira lá e em algum momento também ter uma galera gerando boas discussões e conteúdo 100% pt-Br, hein?
E, ainda falando do Discord do Hugging Face, eu encontrei uma coisa sensacional lá: Há um canal dedicado à anúncios e novidades. E um dos posts desse canal é o “Community Highlights”, que contém uma série de novidades desse mundo de IA, principalmente projetos open source, pesquisas e artigos de blogs. É uma mina de ouro que podemos usar a nosso favor para aprender o que tá rolando nesse mundo onde podemos aprender mais!
Eu falei com o autor, o Adam @lunarflu, e ele me autorizou a criar vídeos de resumo desse conteúdo e em português. Então, o IA Talking passará a trazer essas novidades também!!!
E eu irei tentar pesquisar cada uma delas, entender o que são e criar vídeos e posts em português tentando dar mais clareza para vocês! Isso vai me ajudar a estudar as novidades e também manter vocês atualizados sem que precisem ficar traduzindo e acessando o conteúdo diretamente! É so ficar ligado aqui no blog!
Então, fique ligado aqui o blog e no nosso canal, pois teremos muito mais informações. O primeiro vídeo já está no ar e você pode conferir aqui!
Apaixonado por tecnologia e veterano em bancos de dados SQL Server, este entusiasta agora se aventura no fascinante universo da Inteligência Artificial.
Atualmente é o Head de Inovação da Power Tuning, onde é o responsável por trazer novas ideias para produtos e serviços, que melhorem a produtividade do time ou a experiência do cliente! Com muita experiência em programação, hardware, sistemas operacionais, e mais, agora quer juntar tudo isso nesse novo mundo e trazer muitas ideias e conhecimento sobre Inteligência Artificial!
Neste blog, vai compartilhar sua jornada de aprendizado e uso da IA, focando em como transformar nossa maneira de resolver problemas e inovar.