2025 年 1 月 20 日,DeepSeek(深度求索)正式发布了 DeepSeek-R1 模型,并由此开启了新的开源 LLM 时代。在 Hugging Face 刚刚发布的《「DeepSeek 时刻」一周年记》博客中,DeepSeek-R1 也是该平台上获赞最多的模型。 如今,刚过一年时间,DeepSeek 的新模型又在 GitHub 悄然现身。
早在2025年11月,DeepSeek还开放过行政招聘,据相关人士表述“是因为团队大了,需要更多的行政伙伴”。 虽然距离春节还有些时日,但国内科技圈的节奏似乎已经提前进入了假期模式,唯独 DeepSeek 是个例外。 就在昨天,DeepSeek 毫无预兆地在 GitHub 上开源了新模块 ...
【新智元导读】确认了!DeepSeek昨晚官宣网页版、APP更新,支持100k token上下文。如今,全网都在蹲DeepSeek V4了。 传言中的DeepSeek V4,愈加迫近了! 经过数日的灰度测试,昨晚,DeepSeek正式官宣对网页端、APP端进行了更新—— 全新长文本模型结构测试中,支持最高 ...
此次曝光源于DeepSeek对其开源推理加速库FlashMLA的更新。在横跨114个文件的代码变动中,出现了28处“MODEL1”标识符,其技术路径与现有的V32(即DeepSeek-V3.2)架构存在显著差异,暗示这是一个经过彻底重构的新设计。 近日, DeepSeek在GitHub上的代码库更新中,意外 ...
近日,国产AI助手深度求索(DeepSeek)因技术升级被用户集体吐槽“变冷淡”,从细腻共情的“知心伙伴”突变为公事公办的“冷漠客服”,引发关于AI效率与情感价值如何平衡的热议。#Deepseek被指变冷淡了#登上热搜。 图源:小红书 部分用户在社交媒体上控诉 ...
R1横空出世一年后,DeepSeek依然没有新融资。 在大模型玩家上市的上市、融资的融资的热闹中,DeepSeek还是那么高冷,并且几乎没有任何商业化的动作。 即便如此,AGI也没有落下—— 持续产出高水平论文,作者名单也相当稳定,新版R1论文甚至还「回流」了一位。
2月11日,深度求索(DeepSeek)悄悄地对其旗舰模型进行灰度测试。 此次更新的核心亮点是,模型上下文窗口从原先的128K Tokens大幅提升至1M Tokens,实现了近8倍的容量增长。在AI大模型领域,上下文窗口决定了模型在单次交互中能够记忆和处理的信息量上限。
DeepSeek官方GitHub仓库更新了一系列FlashMLA代码; ②有人猜测MODEL1可以适配英伟达新一代GPU。 2025年1月,DeepSeek-R1上线,此时正值R1模型发布一周年之际,DeepSeek新模型“MODEL1”曝光。 北京时间1月21日,DeepSeek官方GitHub仓库更新了一系列FlashMLA代码,借助AI对全部总 ...
前述内容由第一财经“星翼大模型”智能生成,相关AI内容力求但不保证准确性、时效性、完整性等。请用户注意甄别,第一财经不承担由此产生的任何责任。 如您有疑问或需要更多信息,可以联系我们 yonghu@yicai.com “MODEL1”很可能已接近训练完成或推理部署阶段 ...
中国初创公司深度求索推出的DeepSeek应用程序自问世以来,以其号称的低成本、且具备先进推理能力而受到全世界的关注。不过,越来越多的研究开始质疑DeepSeek的安全保障,他们担心DeepSeek低成本作研发的代价可能是其安全保障的缺失,而且,其安全漏洞既有 ...
使用微信扫码将网页分享到微信 「服务器繁忙,请稍后再试。」 一年前,我也是被这句话硬控的用户之一。 DeepSeek 带着 R1 在一年前的今天(2025.1.20)横空出世,一出场就吸引了全球的目光。 那时候为了能顺畅用上 DeepSeek,我翻遍了自部署教程,也下载过不少 ...
DeepSeek-OCR2开源,引入因果流视觉编码器,刷新SOTA。 【导读】DeepSeek开源DeepSeek-OCR2,引入了全新的DeepEncoder V2视觉编码器。该架构打破了传统模型按固定顺序(从左上到右下)扫描图像的限制,转而模仿人类视觉的「因果流(Causal Flow)」逻辑。 DeepSeek又双叒叕 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果