Deepseek subiu ao topo da App Store da Apple no Reino Unido, EUA e China após seu lançamento no dia de inauguração de Trump, desafiando a coroa da América como indisputado Ai reis.


6

6
A popularidade empolgante abalou especialistas em tecnologia e defensores da fala livre, e foi marcado como “Moment do Sputnik da IA” pelo conselheiro de Donald Trump, Marc Andreessen.
O software é equipado com sinistro característicascomo sua recusa em responder a certas perguntas políticas sobre a China e seu líder Xi Jinping.
O Deepseek é um grande modelo de linguagem que pode gerar respostas semelhantes a humanos para prompts, assim como o famoso chatgpt.
O aplicativo é alimentado pelo software de IA chamado Deepseek-V3, que seus pesquisadores afirmam ter sido desenvolvido por menos de US $ 6 milhões.
Isso é muito menor do que os bilhões de concorrentes internacionais gastaram em seu próprio software, embora o número tenha sido contestado por outros do setor.
A empresa ostentou seu aplicativo “em pé de igualdade com” ChatGPT quando se trata de matemática, codificação e escrita de respostas.
Andreessen alertou: “Deepseek R1 é um dos avanços mais incríveis e impressionantes que eu já vi”.
Ai modelos são alimentados por chips avançados e, desde 2021, o governo dos EUA restringiu a venda delas à China, a fim de agarrar o progresso.
Para contornar o problema do fornecimento, os desenvolvedores chineses têm colaborado e experimentando novas abordagens.
Esse processo levou a modelos que exigem muito menos poder de computação do que antes e que podem ser produzidos muito mais baratos.
Alexandr Wang, CEO da IA de escala de São Francisco, disse que o avanço deve ser um “alerta para a América”.
Ele comprou um anúncio de página inteira no Washington Post na semana passada, implorando ao presidente para “vencer a guerra da IA”.
Trump já enfatizou sua ambição de proteger a América como a “capital mundial da inteligência artificial” durante seu discurso de inauguração e anunciou um investimento de IA de US $ 500 bilhões “Stargate” na semana passada.
O governo chinês anunciou muito menos investimentos em fundos de IA – apenas US $ 8,2 bilhões, de acordo com o South China Morning Post.

6

6
Os analistas dos EUA estão perturbados com o avanço dos chineses depois que as ações das empresas de IA americanas, como Nvidia, Microsoft e Meta, caíram na segunda-feira de manhã.
Vey-Sern, um consultor de tecnologia, disse à BBC que a Deepseek poderia “potencialmente inviabilizar o caso de investimento para toda a cadeia de suprimentos da IA, que é impulsionada por altos gastos de um pequeno punhado de hiper-escalas”.
O novo modelo foi desenvolvido por Liang Wenfeng, um gerente de fundos de hedge que se pensava ter um link próximo para o Partido Comunitário Chinês.
Ele fundou a empresa em 2023 em Hangzhou, sudeste da China, bem como o fundo de hedge que o apóia.
Pensa -se que ele estocou os chips da NVIDA A100 dos EUA antes que sua venda para a China fosse banida e combinou -os com alternativas mais baratas.
A Deepseek não é a única empresa de IA chinesa logo após os EUA.
A Alibaba lançou seu próprio modelo QWQ em novembro e está fazendo um progresso rápido.
Empresas como a Huawei estão trabalhando para produzir chips fabricados em chinês, para que o país não dependesse do fornecimento dos EUA.
O que são grandes modelos de idiomas?
Um grande modelo de linguagem é um tipo de inteligência artificial que usa o aprendizado de máquina para analisar o texto.
Muitas quantidades de dados baseados em texto, como livros e artigos, são alimentados no software para ensinar como funciona a linguagem.
Quando está em funcionamento, os modelos podem gerar respostas textuais relevantes para prompts.
Eles também podem resumir e traduzir passagens de palavras.
O padrão-ouro é que um LLM produza respostas “naturais” e humanas a qualquer que seja a entrada.
Os problemas podem surgir com os LLMs se forem alimentados com informações incorretas, que podem causar respostas imprecisas.
Os LLMs mais avançados são chamados Transformers generativos pré -criados – que é o que o acrônimo do ChatGPT representa.
Os LLMs modernos surgiram em 2017 e usam modelos de transformadores com um número muito grande de parâmetros – a variável presente no modelo que afeta sua saída.
A Openai lançou seu ChatGPT-4 em 2023, que foi amplamente elogiado e aumentou massivamente o perfil do LLMS.

6