市值
24小时
20437
Cryptocurrencies
59.89%
Bitcoin 分享

Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель

Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель


Forklog
2024-12-27 14:06:35

Китайский ИИ-стартап DeepSeek представил собственную большую языковую модель, которая превзошла по тестам конкурентов от Meta и OpenAI. 🚀 Introducing DeepSeek-V3!Biggest leap forward yet:⚡ 60 tokens/second (3x faster than V2!)💪 Enhanced capabilities🛠 API compatibility intact🌍 Fully open-source models & papers🐋 1/n pic.twitter.com/p1dV9gJ2Sd— DeepSeek (@deepseek_ai) December 26, 2024 DeepSeek V3 имеет 671 млрд параметров. Для сравнения, у Llama 3.1 405B показатель 405 млрд. Число отражает способность ИИ адаптироваться к более сложным вариантам применения и давать ответы точнее.   Сравнение DeepSeek V3 с конкурентами. Данные: DeepSeek. Компания из Ханчжоу обучила нейросеть за два месяца и $5,58 млн, используя значительно меньше вычислительных ресурсов (2048 графических процессоров) по сравнению с более крупными технологическими компаниями. Она обещает предоставление лучшего соотношения цена/качество на рынке. 💰 API Pricing Update🎉 Until Feb 8: same as V2!🤯 From Feb 8 onwards:Input: $0.27/million tokens ($0.07/million tokens with cache hits)Output: $1.10/million tokens🔥 Still the best value in the market!🐋 3/n pic.twitter.com/OjZaB81Yrh— DeepSeek (@deepseek_ai) December 26, 2024 В будущем запланировано добавление мультимодальности и «других передовых функций». Член команды OpenAI Андрей Карпати отметил, что DeepSeek продемонстрировала весьма впечатляющие исследования и разработки в условиях ограниченных ресурсов. DeepSeek (Chinese AI co) making it look easy today with an open weights release of a frontier-grade LLM trained on a joke of a budget (2048 GPUs for 2 months, $6M).For reference, this level of capability is supposed to require clusters of closer to 16K GPUs, the ones being… https://t.co/EW7q2pQ94B— Andrej Karpathy (@karpathy) December 26, 2024 «Означает ли это, что вам не нужны большие кластеры GPU для пограничных LLM? Нет, но вы должны быть уверены, что не растрачиваете то, что у вас есть. Это выглядит как хорошая демонстрация того, что еще многое предстоит сделать как с данными, так и с алгоритмами», — добавил он. Ранее DeepSeek представила «конкурента o1 от OpenAI» — думающую «сверхмощную» ИИ-модель DeepSeek-R1-Lite-Preview. Напомним, в июле китайская компания Kuaishou открыла ИИ-модель для генерации видео Kling для всех желающих.


阅读免责声明 : 此处提供的所有内容我们的网站,超链接网站,相关应用程序,论坛,博客,社交媒体帐户和其他平台(“网站”)仅供您提供一般信息,从第三方采购。 我们不对与我们的内容有任何形式的保证,包括但不限于准确性和更新性。 我们提供的内容中没有任何内容构成财务建议,法律建议或任何其他形式的建议,以满足您对任何目的的特定依赖。 任何使用或依赖我们的内容完全由您自行承担风险和自由裁量权。 在依赖它们之前,您应该进行自己的研究,审查,分析和验证我们的内容。 交易是一项高风险的活动,可能导致重大损失,因此请在做出任何决定之前咨询您的财务顾问。 我们网站上的任何内容均不构成招揽或要约