今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。 相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。 一共两个模型,分别是 V3.1 和 V3.1 base。两个模型结构完全一致,V3.1 的 Base 模型在 V3 的基础上 ...
郭达雅于2023年博士毕业后加入DeepSeek,专注代码智能和大语言模型推理。 促使他加入DeepSeek的原因很简单:有一位师姐在DeepSeek工作,和他聊起公司追求AGI的愿景,这与他的价值观比较吻合。
DeepSeek官网近日挂出一批新岗位招聘信息,工作地点覆盖杭州与北京,涉及Agent深度学习算法研究员、数据评测专家及基础设施工程师等职位。这一动作被业界视为其即将发布的新一代大模型DeepSeek V4的重要布局,该模型预计于4月面世,其战略方向正引发广泛关注。 招聘信息中,对候选人技术能力的要求尤为引人注目。除常规掌握的Python外,Rust语言能力被列为重要条件。同时,应聘者需熟悉Cla ...
智东西3月19日消息,今日凌晨,小米MiMo大模型系列重磅三连更:旗舰基座大模型MiMo-V2-Pro、全模态Agent模型MiMo-V2-Omni、MiMo-V2-TTS,其最新发布的这三大模型都是为优化智能体能力打造。
随着 DeepSeek V4 预计于 4 月发布,DeepSeek 官网近日上线的一系列新职位揭示了该大模型的战略重心。招聘信息显示,DeepSeek 正在大规模招募 Agent 深度学习算法研究员、数据评测专家及基础设施工程师,工作地点分布于杭州和北京。
有这样一则消息在AI圈悄然流传:DeepSeek研究员郭达雅已经离职。 大家第一时间的反应普遍是“谁?谁是郭达雅?” 这不难理解,因为郭达雅的知名度远不如创始人梁文锋以及“天才AI少女”罗福莉。
最近的 AI 编程圈,实在是太卷了。 感觉我就是睡了一觉,起来天就变了: 前脚Anthropic刚把Claude Code 升级到 2.0、发布Claude sonnet 4.5,后脚 DeepSeek 就密集更新到了 v3.2-exp。 还没等我缓过神,昨晚刷 X,智谱的 GLM-4.6 已经悄悄干到了开源第一,把 DeepSeek 给超了。
只要99美元,DeepSeek教程带回家。 “DeepSeek是目前最强大的AI工具,但 99% 的人都用错了!” 海外社交平台“X(推特)”上,一位海外博主信誓旦旦表示,绝大多数人并不会使用DeepSeek,而自己将免费提供使用教程。 老道的语气,一度让人直接幻视中国各个社交平台上的“AI大师”们。他们一边喊着打工人“学不会AI迟早被淘汰”,一边在自己的博文或者评论区里表示可以教学——通过收取学 ...
快科技3月18日消息,万众期待的DeepSeek V4让大家等得心急,最新说法是4月发布,显然还要再打磨一番,现在DeepSeek官网发了新的工作招聘信息,暴露了DeepSeek大模型的重点方向。
在硅谷,造神和毁神的速度一样快。但像 Cursor 这样,在 24 小时内完成从「拳打 OpenAI、脚踢 Anthropic」到「连夜滑跪」的流程,确实十分令人感慨。 事情是这样的。 3 月 20 日,知名 AI 代码编辑器 Cursor ...
从这个角度看,选择中国开源模型微调几乎是一个必然的逻辑,既够强,又不会变成自己的竞争对手。但这同时也是Cursor不愿公开讲的原因,2025年它是AI编程赛道最炙手可热的明星,估值冲到293亿美元,3月12日Bloomberg报道新一轮融资目标估值约 ...
随着 DeepSeek V4 预计于 4 月发布,DeepSeek 官网近日上线的一系列新职位揭示了该大模型的战略重心。招聘信息显示,DeepSeek 正在大规模招募 Agent 深度学习算法研究员、数据评测专家及基础设施工程师,工作地点分布于杭州和北京。 核心信号:对标 Claude,发力 AI 编程 此次招聘最引人关注的是对候选人工具掌握能力的要求: ...