DeepSeek

本节目录 Contents

DeepSeek#

解读幻方量化最新的技术,幻方以基础模型研究为核心,LLM 、多模态模型全部开源,旨在推动 AI 技术的普惠和生态发展,而不是单纯以商业盈利为首要目标。从 2023 年建立以来发布了 DeepSeek V1/V2/V3/R1 基础大模型,还有 Janus/Janus-Flow/Janus-Pro 多模态大模型等。

内容大纲#

建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~

大纲

小节

链接

基础模型

DeepSeek-V3 深度解读

PPT, 视频

基础模型

DeepSeek-R1 深度解读

PPT, 视频

基础模型

DeepSeek-Janus Pro 深度解读

PPT, 视频

开源 Week

day1 FlashMLA

PPT, 视频

开源 Week

day2 DeepEP 原理

PPT, 视频

开源 Week

day3 DeepEP 代码

PPT, 视频

备注#

文字课程开源在 AIInfra,系列视频托管B 站油管,PPT 开源在github,欢迎引用!

非常希望您也参与到这个开源课程中,B 站给 ZOMI 留言哦!

欢迎发现 bug 或者勘误直接提交代码 PR 到社区哦!

希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!