本文在 草梅友仁的博客 发布和更新,并在多个平台同步发布。如有更新,以博客上的版本为准。您也可以通过文末的
原文链接
查看最新版本。
前言
欢迎来到草梅周报!这是一个由草梅友仁基于 AI 整理的周报,旨在为您提供最新的博客更新、GitHub 动态、个人动态和其他周刊文章推荐等内容。
DeepSeek 开源动态
近期 DeepSeek 官方在 GitHub 启动了为期 6 天的开源计划,透明分享其 AGI 基础设施的核心技术成果。
主要内容包括:
-
- 面向 Hopper GPU 的高效 MLA 解码内核
- 支持 BF16 格式与分页 KV 缓存
- H800 实测:3000GB/s 内存带宽 / 580TFLOPS 算力
-
首个开源 MoE 模型通信库
全连接通信优化,支持 NVLink/RDMA 跨节点
集成 FP8 调度与计算-通信重叠控制
-
FP8 通用矩阵计算库
Hopper GPU 实现 1350+ TFLOPS
精简架构(核心代码 300 行),支持密集/MoE 布局
并行策略:
- DualPipe:双向流水线并行算法
- EPLB:专家并行负载均衡器
- profile-data:提供 V3/R1 训练的计算-通信重叠分析工具
-
- 分布式并行文件系统
- 180 节点集群 6.6TiB/s 吞吐
- 支持训练数据全流程管理与 KVCache 查询
-
- H800 单节点 73.7k/14.8k tokens 输入输出性能
- 实现 545%成本收益率(理论上)
- 采用跨节点 EP 扩展与负载均衡技术
更多内容请前往官方代码库查看:deepseek-ai/open-infra-index
当然,除了面向研究者开源代码之外,在用户端,也对 API 现实行错峰优惠定价。
现在,北京时间 00:30-08:30 时,DeepSeek-V3 打 5 折,DeepSeek-R1 打 2.5 折!
因此,对于实时性要求不高的服务,可以异步处理请求,将调用 DeepSeek-R1 API 的请求放到低谷时间,进一步节约成本。
我在上一篇周报中推荐过 火山引擎,但目前火山引擎的 DeepSeek-R1 接口已经没有优惠,查看其他家的接口时,也普遍过了优惠期。
因此,我认为使用 DeepSeek 官方的 API 会更节约成本。
当然了,考虑到可用性,第三方的 DeepSeek-R1 API 也还是可以作为备用,以免业务受影响。
AI 二次元女友
最近发现了个有趣的项目——SillyTavern,一个 AI 驱动的角色扮演聊天室,通俗的讲,就是一个可以实现二次元纸片人在线聊天的工具。
我试了一下,效果相当不错。
部署相关的内容可以参考这篇文章:《基于 DeepSeek 实现与二次元美少女在线谈恋爱》
除了直接使用 SillyTavern 外,还可以使用 easychen 写的 SillyTavern 酒馆多实例管理系统,让一台服务器可以支持多个 SillyTavern 实例。
GitHub Release
rss-impact-server
- v1.15.1 - 2025-03-01 20:40:56
摘要:
版本 1.15.1 更新摘要
- Bug 修复:
- 更新 push-all-in-one 依赖至 4.3.0,并优化推送类型映射。
- 添加响应格式配置到 AIConfig 和任务服务。
最新 GitHub 加星仓库
- CaoMeiYouRen starred open-infra-index - 2025-03-02 20:01:45
摘要:
本文介绍了一套经过生产测试的人工智能基础设施工具,旨在高效推动人工通用智能(AGI)的发展和社区驱动的创新。这些工具已经获 得了 61 71 个星标,显示出其在开发者社区中的受欢迎程度和认可度。 - CaoMeiYouRen starred newsnow - 2025-02-28 15:35:19
实时和热门新闻的优雅阅读
主要语言:TypeScript
星标数:3420 - CaoMeiYouRen starred moepush - 2025-02-28 14:39:45
这是一个基于 NextJS 和 Cloudflare 技术栈构建的可爱消息推送服务,支持多种消息推送渠道。项目主要使用 TypeScript 语言开发,目前在 GitHub 上获得了 476 个星标。 - CaoMeiYouRen starred CST - 2025-02-27 23:00:27
该项目名为“多实例 SillyTavern 云酒馆管理工具”,主要使用 HTML 语言开发。它是一个用于管理多个 SillyTavern 服务器实例的工具,目前获得了 8 个星标(Stargazers)。 - CaoMeiYouRen starred uptime-kuma - 2025-02-24 19:54:46
一个高级的自托管监控工具,主要使用 JavaScript 编写,拥有 65255 个星标。
其他博客或周刊推荐
阮一峰的网络日志
科技爱好者周刊(第 339 期):代币是什么 - 2025-02-28 08:21:57
HelloGitHub 热点速览
DeepSeek “源神”启动!「GitHub 热点速览」 - 2025-02-25 08:59:59
HelloGitHub 月刊
《HelloGitHub》第 107 期 - 2025-02-28 08:00:24
老胡的周刊
02-24~03-02.老胡的周刊(第 179 期).md - 2025-03-01 23:54:00
阿猫的博客
猫鱼周刊 vol. 057 什么是推理语言大模型? - 2025-02-23 23:16:48
总结
本周的更新和动态如上所示。感谢您的阅读!
您可以通过以下方式订阅草梅周报的更新:
往期回顾
- DeepSeek-R1 接口对比与推荐:火山引擎 vs 其他云服务平台 | 2025 年第 8 周草梅周报 - 2025-02-23 17:05:35
- AI 笔记软件 NoteGen 与 GitHub 动态更新 | 2025 年第 7 周草梅周报 - 2025-02-16 20:39:16
- DeepSeek 加速 AGI 时代来临 | 2025 年第 6 周草梅周报 - 2025-02-09 17:45:33
本文作者:草梅友仁
本文地址: https://blog.cmyr.ltd/archives/2025-09-caomei-weekly-deepseek-open-source-ai-girlfriend.html
版权声明:本文采用 CC BY-NC-SA 4.0 协议 进行分发,转载请注明出处!