- Регистрация
- 24.06.19
- Сообщения
- 62,235
- Реакции
- 349,561
Последние темы автора:
- [Константин Михайлов] XIX век. С другой точки зрения. Лекция 5. Драка за Африку (2025)
- [Валерий Подрубаев] Как жара вызывает отёки, срывы и дефициты, которых не видно в анализах (2025)
- [omniclub] Создай своего цифрового двойника за 3 дня (2025)
- [Алия Хабибуллина] [Happy_sweets_aliya] ПП на каждый день (2025)
- [Аяз Шабутдинов] Последняя лекция. Лидерство. Месяц 6 (2025)
- #1
Голосов: 0
[ДМК] DeepSeek в действии (2025)
DeepSeek – это генеративная модель искусственного интеллекта с открытым исходным кодом, основанная на архитектуре Transformer и объединяющая передовые технологии, такие как архитектура MoE, обучение с переменной разрядностью и распределенная оптимизация. Она хорошо зарекомендовала себя в области генерации текста, мультимодальной обработки и адаптации под конкретные прикладные задачи. В книге описаны особенности глубоко оптимизированной архитектуры DeepSeek-V3 и способы применения модели на практике.
Рассматриваемые темы:
Издание подготовлено «Лабораторией искусственного интеллекта будущего» (Китай). Коллектив лаборатории состоит из докторов и магистров ведущих китайских университетов, специализирующихся на разработке и инновациях в области обработки естественного языка, глубокого обучения, компьютерного зрения и мультимодальных моделей.
Формат: PDF.
Подробнее:
[ДМК] DeepSeek в действии (2025) - Описание курса
DeepSeek – это генеративная модель искусственного интеллекта с открытым исходным кодом, основанная на архитектуре Transformer и объединяющая передовые технологии, такие как архитектура MoE, обучение с переменной разрядностью и распределенная оптимизация. Она хорошо зарекомендовала себя в области генерации текста, мультимодальной обработки и адаптации под конкретные прикладные задачи. В книге описаны особенности глубоко оптимизированной архитектуры DeepSeek-V3 и способы применения модели на практике.
Рассматриваемые темы:
- Теоретические основы – базовая архитектура и технологии обучения моделей типа Transformer, механизм внимания DeepSeek, законы масштабирования и их применение в оптимизации моделей.
- Основные приемы работы – начало работы с моделью, знакомство с API, реализация диалога, функции обратного вывода, кеширование на диске и оптимизация кеша.
- Расширенное применение – реализация чат-клиентов, интеллектуальных помощников, плагинов VS Code и т. д.
Издание подготовлено «Лабораторией искусственного интеллекта будущего» (Китай). Коллектив лаборатории состоит из докторов и магистров ведущих китайских университетов, специализирующихся на разработке и инновациях в области обработки естественного языка, глубокого обучения, компьютерного зрения и мультимодальных моделей.
Формат: PDF.
Подробнее:
Для просмотра ссылок пройдите регистрацию
Скачать курс - [ДМК] DeepSeek в действии (2025)
Вы должны Войти на форум чтобы увидеть контент.