Por: Aline Sordili
O mundo descobriu a DeepSeek AI. Estou usando essa ferramenta de IA generativa (GPT) há quase um mês e, desde o primeiro dia, impressionada com a velocidade e a qualidade dos resultados entregues pela startup sediada em Hangzhou.
Em dezembro de 2024, os pesquisadores da DeepSeek publicaram um artigo afirmando que o modelo DeepSeek-V3 usou chips H800 da NVIDIA AI para treinamento, gastando menos de US$ 6 milhões.
Fiquei matutando sobre o deslumbramento do mundo, principalmente dos brasileiros e norte-americanos, pela DeepSeek, que me foi apresentada pelo meu professor e sempre pioneiro Diogo Cortiz.
Na minha cabeça, a surpresa só pode ser o velho e conhecido estereótipo, ou preconceito, com produtos chineses. Aquela crença de que produtos que apresentem inovação tecnológica só possam vir dos Estados Unidos ou da Europa.
Parece que se esqueceram, ou não usam o Alibaba, a Shein, o WeChat (Tencent), a Huawei ou ainda a Xiaomi _essas duas últimas são fortíssimas em inteligência artificial. A Huawei está investindo especialmente em chipsets de IA e soluções de computação em nuvem. A Xiaomi desenvolveu o XiaoAI, um assistente virtual inteligente similar à Siri ou Alexa, que está integrado em seus dispositivos, como smartphones e alto-falantes inteligentes, por exemplo.
Mas qual o motivo de o mundo ter ficado de boca aberta para o DeepSeek?
Primeiramente, ao usar, você já pode observar a velocidade de processamento impressionantemente rápida. As IAs processam tokens, que são as unidades informativas. Cada frase, por exemplo, é composta por vários tokens.
O DeepSeek processa milhões de tokens muito mais rapidamente que o ChatGPT (OpenA), Claude (Anthropic) _quem me conhece sabe que eu sou praticamente uma evangelista do Claude. Nem vou falar das demais porque são piada perto dessas outras.
O DeepSeek tem soluções personalizadas para áreas como saúde, educação e finanças, além de ter suporte para várias línguas, como o português. O ChatGPT tem capacidade de entendimento contextual e de gerar respostas coerentes, apesar de alucinar bastante. O meu amado Claude tem foco em ética e alinhamento com valores humanos, evitando respostas tendenciosas ou prejudiciais. Eu gosto mais dele porque tem boa capacidade de lidar com textos longos e complexos, como documentos jurídicos ou técnicos.
Consequentemente, como o tempo gasto em processamento e o volume é imensamente maior, o custo desaba. Para processar 1 milhão de tokens, por exemplo, o custo do DeepSeek vai de US$ 1.000 a US$ 3.000, enquanto o ChatGPT custa em torno de US$ 2.000 e o Claude, de US$ 1.000 a US$ 3.000.
Para quem é usuário final, é só colocar US$ 10 em cada uma delas e testar para ver quanto tempo dura e qual a capacidade de processamento de cada uma delas. Só para você saber, 10 doletas nessas plataformas dura uma vida para nós, usuários domésticos.
Para rebater as evidências óbvias de performance, a turma vem com o xororô do viés político: “o DeepSeek não fala mal da China, não fala sobre o massacre da Praça da Paz Celestial”, e por ai vai. Com tudo, o brasileiro vira um especialista em tudo do dia para a noite. O problema é que só repete o que outros falam sem testar ou validar.
TODAS as IAs generativas têm viés. Digo isso sem medo porque uso todas, todos os dias. Faço comparações de entregas em todas elas diariamente. E todas têm seus vieses, suas bias. O que me importa é que a DeepSeek é tipicamente chinesa: ela faz mais, melhor e mais rápido. Espero que, para distinguir vieses tanto dela quanto de outros, todos usem seus conhecimentos e bom-senso.
E o que podemos esperar da DeepSeek? Do ou da DeepSeek? Tanto faz. Ela mesmo diz que seu nome é de gênero neutro.
A plataforma vai investir mais em personalização, assistentes virtuais, sistemas de recomendação hiper-personalizados e soluções de automação para o dia a dia, integração com dispositivos IoT (Internet das Coisas) para criar ecossistemas inteligentes em casas, escritórios e cidades, soluções de IA para diagnósticos médicos mais rápidos e precisos, plataformas educacionais adaptativas que personalizam o aprendizado de acordo com as necessidades de cada aluno (senão não seria uma ferramenta chinesa), ferramentas de criação de conteúdo (texto, áudio, vídeo), pode se destacar em setores como finanças (com soluções de análise de risco e investimentos automatizados), varejo (com sistemas de gestão de estoque e atendimento ao cliente) e logística (com otimização de rotas e cadeias de suprimentos).
E o que os brasileiros podem esperar do DeepSeek? A DeepSeek tem foco em processamento de linguagem natural (NLP), o que inclui suporte para o português. Está explorando oportunidades de parcerias com empresas e instituições brasileiras para expandir sua presença no país, como universidades, startups e grandes corporações para desenvolver soluções sob medida para o mercado local. Garantem acesso a documentação, tutoriais e fóruns em português.
CURIOSIDADE
Por que uma baleia e não um panda como símbolo do GPT chinês?
Eles informam que as baleias são criaturas que habitam as profundezas dos oceanos, simbolizando a capacidade de explorar lugares inacessíveis e desconhecidos, como a missão da DeepSeek de “mergulhar fundo” em dados e informações, buscando insights valiosos e soluções inovadoras.
As baleias são conhecidas por sua inteligência e comportamentos sociais complexos, como a comunicação por sons e a formação de grupos. Baleias são animais grandes e poderosos, capazes de enfrentar desafios no oceano, representando a força e a resiliência corporativa. As baleias são animais curiosos e adaptáveis, capazes de migrar por longas distâncias e se ajustar a diferentes ambientes.
Já o pandinha amado não foi escolhido por estar mais associado à superfície (vive em florestas) e não transmite a mesma ideia de exploração profunda. São frequentemente associados à simplicidade e à calma. A imagem lúdica do panda não está alinhada com a seriedade e a inovação que a DeepSeek deseja projetar.
Fonte: LinkedIn Aline Sordili