DeepSeek: почему все говорят про китайскую нейросеть
Наталья Хайду
Главный редактор
Профессионально увлекаю через контент. С командой Журнала практически с самого основания. Знаю толк в продукте и заражаю читателей интересом к нему с помощью наших статей.

DeepSeek: почему все говорят про китайскую нейросеть

6 мин
14
Нейросети

deep_seek_preview

В январе 2025 года стартап DeepSeek выпустил новую языковую модель R1 и сразу стал главной темой мировых новостей.

Китайская нейросеть обвалила акции западных лидеров в сфере ИИ. Nvidia, Microsoft, Oracle и другие компании вместе потеряли почти триллион долларов. DeepSeek обогнала ChatGPT по числу скачиваний в App Store. Соцсети заполонили шутки про «красный день для бигтеха».

Шумиха поднялась, потому что DeepSeek‑V3 в ряде тестов обошла модель от OpenAI. Только на обучение GPT‑4 потратили больше 100 миллионов долларов, а на тренировку версии от DeepSeek, по словам разработчиков, ушло всего 5,6 миллиона.

Почему получилось так дешево, что умеет чат-бот из Китая и как пользоваться нейросетью в России, читайте в обзоре на DeepSeek.

Классификация по типам личности DISC

Реакция от аккаунта DD_Geopolitics в соцсети X

Что такое DeepSeek

DeepSeek — это бесплатный чат-бот с нейросетью от китайского стартапа DeepSeek. Работает на двух моделях: обычной генеративной V3 и «рассуждающей» R1.

Компанию DeepSeek основал глава китайского хедж-фонда Организация, которая управляет деньгами инвесторов и использует сложные стратегии, чтобы получить максимальную доходность. High-Flyer Лян Вэньфэн. Как пишут СМИ, в 2021 году Вэньфэн начал покупать мощные чипы H100, на которых тренируют нейросети.

Через год администрация Джо Байдена запретила Nvidia и AMD продавать инновации в Китай. Но Вэньфэн успел накопить достаточное количество чипов.

В ноябре 2024 года DeepSeek открыл доступ к большой языковой модели DeepSeek‑V3. В некоторых тестах V3 обошла GPT‑4o от OpenAI и Claude 3.5 Sonnet от Anthropic. По словам разработчиков, на результаты повлияли методы обучения и особенности архитектуры нейросети. Создатели использовали:

  • Архитектуру Multi-Token Prediction (MTP). Это помогает нейросети предсказывать сразу несколько элементов за раз. Допустим, модель должна продолжить фразу: «Сегодня на улице». Обычные версии выбирают слово за словом: сначала «очень», затем «тепло», потом «и солнечно». V3 может составить сразу всю фразу целиком: «очень тепло и солнечно».
  • Технологию Mixture of Experts (MoE). Она позволяет модели использовать только часть ресурсов для обработки данных, а не всю сеть сразу. V3 выбирает подходящие «экспертные» блоки для каждой задачи. В результате нейросеть работает быстрее.
  • Принцип Multi-Head Latent Attention (MLA). Технология позволяет модели изучать текст сразу с нескольких точек зрения. «Головы внимания» обрабатывают разные части данных, поэтому V3 лучше понимает связи в предложениях и не упускает ключевые детали.

В январе 2025 года стартап DeepSeek представил модель DeepSeek‑R1. Она умеет «рассуждать» и выстраивать логические цепочки. Создатели утверждают, что модель R1 превосходит конкурентов в тестах по математике и программированию.

Сравнение моделей

Команда DeepSeek утверждает, что модель R1 лучше конкурентов справляется с задачами по математике и генерирует код

Почему стартап DeepSeek обвалил рынок. Потому что несколько лет все были уверены: разработка нейросетей — это всегда очень дорого и требует передовых технологий. В январе появились модели DeepSeek и перевернули это представление.

Аналитики японского банка Mizuho сравнили ресурсы OpenAI и DeepSeek. У американской компании есть доступ ко всем технологиям. При этом команда Сэма Альтмана тратит больше пяти миллиардов долларов в год на ChatGPT. Тренировка GPT‑4 обошлась в 100 миллионов долларов.

У китайского стартапа был запас из 10 000 мощных чипов и доступ к «разрешенным» технологиям послабее. DeepSeek понадобилось меньше шести миллионов долларов на разработку модели R1.

Кроме того, OpenAI берет деньги за доступ к «рассуждающей» GPT‑o1. DeepSeek‑R1 можно использовать бесплатно.

Успех чата DeepSeek заставил инвесторов задуматься, действительно ли на разработку нейросетей нужны многомиллиардные затраты. Акции технологических корпораций резко упали.

Критика. Превосходство новой модели строится на словах самих разработчиков. Эксперты Bernstein утверждают, что сумма «пять с половиной миллионов долларов» появилась как предположение о цене аренды вычислительных мощностей. Эта цифра может не включать другие расходы DeepSeek. Например, стоимость экспериментов с алгоритмами.

DeepSeek нейронка не решает проблему галлюцинаций ― когда ИИ просто выдумывают ответы. У моделей нет настоящего понимания смысла, они просто выдают наиболее математически вероятный ответ. Функция памяти, которая позволяет добавлять контекст, у DeepSeek отсутствует. В этом китайская нейросеть уступает ChatGPT.

29 января OpenAI обвинила DeepSeek в том, что стартап использовал ее модели для обучения своей. Компания нашла доказательства, что китайские разработчики применили метод «дистилляции» — когда одну нейросеть тренируют на другой, более мощной.

Компания не раскрывает деталей расследования. Однако политика OpenAI запрещает копировать сервисы и применять их, чтобы создавать конкурирующие решения.

Что умеет DeepSeek AI

Отвечать на вопросы и писать тексты. Работает так: пользователь задает вопрос, модель выдает результат. Человек может задать структуру ответа или использовать предложение нейросети.

DeepSeek может писать длинные тексты: создавать статьи, эссе. Поддерживает разные жанры и стили.

Что умеет DeepSeek AI: отвечать на вопросы и писать тексты

Искать информацию в интернете. DeepSeek нейросеть V3 может находить данные, анализировать источники и выдавать результаты. Журналисты «РБК» попросили модель найти англоязычные статьи на тему развития нейросетей. В ответ V3 предложила 41 ресурс: научные работы с превью и ссылками.

Что умеет DeepSeek AI: искать информацию в интернете

Переводить тексты. DeepSeek ИИ поддерживает несколько языков, в том числе русский, китайский и английский.

Что умеет DeepSeek AI: переводить тексты

Изучать данные и рассуждать. Это навык модели R1: чтобы перейти, нужно нажать DeepThink в левом нижнем углу поля для ввода текста.

R1 расшифровывает диаграммы, объясняет изображения и структурирует большие объемы информации. Пользователь может проверить рассуждения ИИ.

Что умеет DeepSeek AI: изучать данные и рассуждать

Как использовать DeepSeek в работе

DeepSeek нейросеть пригодится в маркетинге, продажах, HR, финансах и управлении. ИИ может взять на себя создание текстов, подготовку отчетов, аналитику. Собрали четыре конкретные задачи, с которыми справится нейросеть.

Заполнит карточку товара для маркетплейса. Для этого надо рассказать модели про продукт, описать его характеристики и целевую аудиторию. Модель предложит связный текст и выделит ключевые моменты.

Заполнение карточки товара для маркетплейса

Напишет ответ на отзыв пользователя. Поделитесь обратной связью с нейросетью и попросите ответить на комментарий. Важно рассказать модели, как вы общаетесь с клиентами.

Написание ответа на отзыв пользователя

Подготовит текст для вакансии. Достаточно указать, какую позицию вы хотите закрыть, и своими словами описать идеального кандидата. Дополнительно можно уточнить стиль текста и объяснить, на какие навыки вы будете обращать внимание при выборе сотрудника.

Подготовка текста для вакансии

Напишет email-рассылку. Попросите нейросеть подготовить текст письма. DeepSeek V3 предложит структуру рассылки, продумает содержание. Не забудьте указать целевую аудиторию и действие, которое ждете от получателей письма.

Подготовка email-рассылки

Как пользоваться DeepSeek в России

  1. Перейдите на сайт DeepSeek. Нажмите Start Now.
  2. Авторизуйтесь через Google-аккаунт или зарегистрируйтесь с помощью анкеты. В последнем случае сервис попросит указать e-mail и придумать пароль. Можно использовать почту Google и «Яндекса».
  3. Нажмите Send code. Введите шесть цифр, которые придут на почту.
  4. Готово.

Общаться с DeepSeek можно и в смартфоне. Для этого скачайте приложение из App Store или Google Play.

DeepSeek работает в России без ограничений. Однако из-за большого количества новых пользователей разработчики могут временно закрывать регистрацию. Если у вас не получилось войти с первого раза, подождите и попробуйте еще раз.

Что в итоге

  • DeepSeek AI — это нейросеть с открытым исходным кодом китайского стартапа DeepSeek.
  • По сути это большая языковая модель, которая понимает человеческую речь и способна генерировать результаты по запросу.
  • Модель DeepSeek нейросеть на русском можно использовать как аналог ChatGPT: создавать контент, программировать, изучать иностранные языки.
  • Использовать DeepSeek AI нейросеть можно в браузере или мобильном приложении. Для этого достаточно зарегистрироваться.

Поставьте искусственный интеллект на службу бизнеса с Битрикс24
Попробовать бесплатно
Наталья Хайду
Главный редактор
Рекомендуем
Показать еще