DeepSeek: Tudo o que você precisa saber sobre o aplicativo de chatbot de IA

O laboratório chinês de IA DeepSeek chamou a atenção mundial esta semana após seu aplicativo de chatbot alcançar o topo das paradas da Apple App Store e do Google Play. Os modelos de IA do DeepSeek, treinados com técnicas eficientes em termos de computação, levaram analistas de Wall Street e tecnólogos a questionar se os EUA conseguem manter sua liderança na corrida da IA e se a demanda por chips de IA será sustentada.
Mas de onde veio o DeepSeek e como ele alcançou a fama internacional tão rapidamente?
As Origens do DeepSeek
DeepSeek é respaldado pela High-Flyer Capital Management, um fundo de hedge quantitativo chinês que utiliza IA para informar suas decisões de negociação.
O entusiasta de IA Liang Wenfeng co-fundou a High-Flyer em 2015. Wenfeng, que começou a se envolver com negociações enquanto estudante na Universidade de Zhejiang, lançou a High-Flyer Capital Management em 2019, focada no desenvolvimento e implantação de algoritmos de IA.
Em 2023, a High-Flyer criou o DeepSeek como um laboratório dedicado à pesquisa de ferramentas de IA, separado de seus negócios financeiros. Com a High-Flyer como investidora, o laboratório se tornou uma empresa independente chamada DeepSeek.
Desde o início, o DeepSeek construiu seus próprios clusters de data centers para treinamento de modelos. Mas, como outras empresas de IA na China, o DeepSeek foi afetado pelas proibições de exportação de hardware dos EUA. Para treinar um de seus modelos mais recentes, a empresa foi forçada a usar chips Nvidia H800, uma versão menos potente do chip H100, disponível para empresas dos EUA.
A equipe técnica do DeepSeek é conhecida por ser jovem e, segundo fontes, a empresa recruta agressivamente pesquisadores de doutorado em IA das principais universidades chinesas. Além disso, o DeepSeek também contrata pessoas sem formação em ciência da computação para ajudar sua tecnologia a compreender uma ampla gama de assuntos.
Modelos Poderosos do DeepSeek
O DeepSeek apresentou seus primeiros modelos — DeepSeek Coder, DeepSeek LLM e DeepSeek Chat — em novembro de 2023. Mas foi só na primavera de 2024, quando a startup lançou sua próxima geração de modelos, a família DeepSeek-V2, que a indústria de IA começou a prestar atenção.
O DeepSeek-V2, um sistema geral de análise de texto e imagens, teve um bom desempenho em vários benchmarks de IA e foi muito mais barato para operar do que modelos semelhantes na época. Isso fez com que os concorrentes domésticos do DeepSeek, incluindo ByteDance e Alibaba, reduzissem os preços de uso de alguns de seus modelos e tornassem outros completamente gratuitos.
O DeepSeek-V3, lançado em dezembro de 2024, aumentou ainda mais a notoriedade da empresa.
De acordo com os testes internos de benchmark do DeepSeek, o DeepSeek V3 supera modelos abertos e disponíveis para download, como o Llama da Meta, e modelos "fechados" que só podem ser acessados via API, como o GPT-4o da OpenAI.
O modelo R1 “de raciocínio” do DeepSeek, lançado em janeiro, também se destacou. O DeepSeek afirma que o R1 tem desempenho semelhante ao modelo O1 da OpenAI em benchmarks-chave.
Sendo um modelo de raciocínio, o R1 se autocorrige, o que ajuda a evitar algumas armadilhas que normalmente afetam outros modelos. Modelos de raciocínio costumam demorar um pouco mais — geralmente de segundos a minutos — para chegar a soluções em comparação com modelos convencionais. A vantagem é que eles tendem a ser mais confiáveis em áreas como física, ciência e matemática.
Uma Abordagem Disruptiva
Se o DeepSeek tem um modelo de negócios claro, isso não é evidente. A empresa precifica seus produtos e serviços abaixo do valor de mercado — e oferece outros de graça. Além disso, não está aceitando dinheiro de investidores, apesar do grande interesse de capital de risco.
Segundo o DeepSeek, suas inovações em eficiência permitiram manter uma extrema competitividade de custos. No entanto, alguns especialistas questionam os números fornecidos pela empresa.
De qualquer forma, desenvolvedores têm adotado os modelos do DeepSeek, que não são open source no sentido convencional, mas estão disponíveis sob licenças permissivas que permitem uso comercial. De acordo com Clem Delangue, CEO da Hugging Face, uma das plataformas que hospeda os modelos do DeepSeek, desenvolvedores criaram mais de 500 modelos "derivativos" do R1, que já acumularam 2,5 milhões de downloads combinados.
O sucesso do DeepSeek contra rivais maiores e mais estabelecidos foi descrito como "revolucionário para a IA" e "superestimado". O sucesso da empresa foi, pelo menos em parte, responsável pela queda de 18% no preço das ações da Nvidia em janeiro e provocou uma resposta pública do CEO da OpenAI, Sam Altman. Em março, departamentos do governo dos EUA informaram que o DeepSeek será banido em dispositivos do governo, de acordo com o Reuters.
DeepSeek no Mercado Global
A Microsoft anunciou que o DeepSeek está disponível em seu serviço Azure AI Foundry, uma plataforma que reúne serviços de IA para empresas sob uma única bandeira. Quando questionado sobre o impacto do DeepSeek nos gastos da Meta com IA durante a sua teleconferência de lucros do primeiro trimestre, o CEO Mark Zuckerberg afirmou que o investimento em infraestrutura de IA continuará sendo uma "vantagem estratégica" para a Meta. Em março, a OpenAI chamou o DeepSeek de "subsidiado pelo estado" e "controlado pelo estado", recomendando que o governo dos EUA considere proibir os modelos do DeepSeek.
Durante a teleconferência de lucros do quarto trimestre da Nvidia, o CEO Jensen Huang enfatizou a "excelente inovação" do DeepSeek, dizendo que ele e outros modelos de raciocínio são ótimos para a Nvidia porque exigem muito mais poder computacional.
Ao mesmo tempo, algumas empresas estão banindo o DeepSeek, assim como vários países e governos, incluindo a Coreia do Sul. O estado de Nova York também proibiu o uso do DeepSeek em dispositivos do governo.
O Futuro do DeepSeek
O futuro do DeepSeek é incerto. Modelos aprimorados são uma certeza. Mas o governo dos EUA parece estar ficando cauteloso em relação ao que percebe como uma influência estrangeira prejudicial. Em março, o Wall Street Journal relatou que os EUA provavelmente banirão o DeepSeek em dispositivos do governo.
Conclusão: O DeepSeek não é apenas mais uma empresa de IA; é um fenômeno global que está forçando uma mudança no mercado. Seu impacto, tanto positivo quanto polêmico, promete moldar o futuro da IA e do comércio de tecnologia em nível g