大家好,我是冷逸。最近,不少朋友跟我抱怨:“OpenClaw这玩意儿,好用是真好用,但也是真的费钱啊!”在每一轮对话中,OpenClaw都会像搬家一样,拖家带口地携带大量背景信息(System Prompt和长期Memory)。这就导致,它的Token消耗高得离谱。基本上是Claude ...
今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。 相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。 一共两个模型,分别是 V3.1 和 V3.1 base。两个模型结构完全一致,V3.1 的 Base 模型在 V3 的基础上 ...
只要99美元,DeepSeek教程带回家。 “DeepSeek是目前最强大的AI工具,但 99% 的人都用错了!” 海外社交平台“X(推特)”上,一位海外博主信誓旦旦表示,绝大多数人并不会使用DeepSeek,而自己将免费提供使用教程。 老道的语气,一度让人直接幻视中国各个社交平台上的“AI大师”们。他们一边喊着打工人“学不会AI迟早被淘汰”,一边在自己的博文或者评论区里表示可以教学——通过收取学 ...
最近的 AI 编程圈,实在是太卷了。 感觉我就是睡了一觉,起来天就变了: 前脚Anthropic刚把Claude Code 升级到 2.0、发布Claude sonnet 4.5,后脚 DeepSeek 就密集更新到了 v3.2-exp。 还没等我缓过神,昨晚刷 X,智谱的 GLM-4.6 已经悄悄干到了开源第一,把 DeepSeek 给超了。
本文来源:时代财经 作者:庞宇 图片来源:图虫 继字节跳动视频生成模型Seedance2.0火爆出圈后,国产大模型在春节前迎来一波罕见的“集体突袭”。2月12日,智谱AI正式上线并开源其新一代旗舰模型GLM-5。智谱官方确认,这个新模型正是此前在全球模型服务平台OpenRouter登顶热度榜首、引发圈内疯狂猜测的神秘模型“Pony ...
在目前流行的预填充-解码分离系统中,命中token的KV缓存完全由预填充引擎直接从远程存储加载。这种设计将所有存储I/O压力集中在预填充端的网卡上,而解码引擎端的网卡则基本处于空闲状态。
嘿!刚刚,DeepSeek 又更新了! 这次是更新了十月份推出的 DeepSeek-OCR 模型。 当时 DeepSeek-OCR 的出世,引起了大家对视觉压缩的关注与讨论,而这一次,DeepSeek 对视觉编码下手了。 可以说,刚刚发布的 DeepSeek-OCR 2 通过引入 DeepEncoder V2 架构,实现了视觉编码从「 ...
近日,国内通用大模型DeepSeek以燎原之势在全球各个领域迅猛发展,也为教育行业的高质量发展带来了新的巨大机遇。 目前,清华大学、浙江大学、上海交通大学、华中科技大学、武汉大学、北京航空航天大学等国内多所高校纷纷宣布,已经完成DeepSeek系列大 ...
DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注,其日活用户数在短时间内突破2000万,成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业,外部算力(主要是GPU)限制逐渐成为制约其进一步发展的瓶颈,如今他们正致力于通过优化 ...
我在AI圈的朋友对DeepSeek V4仍然抱有很大希望,原因有二。
当地时间2月23日,美国大模型公司Anthropic发布官方声明,称旗下大模型Claude遭到了中国模型企业DeepSeek(深度求索)、Moonshot(月之暗面)、MiniMax(稀宇科技)的“非法提取(illicitly extract)”。 2026开年不到3个月,这已是国产模型第二次陷入此类争议。2月上旬流出的一份OpenAI备忘录曾写道,DeepSeek正借助ChatGPT及其他美国领 ...
随着DeepSeek的大火,其背后的联网搜索支持方也受到关注。2025年世界移动通信大会期间,博查CTO翁柔莹接受每经记者专访时表示,DeepSeek爆火前已接入其搜索API。目前,博查Search API的日调用量已达3000万次,承接着国内AI应用60%的联网搜索请求。 每经记者|宋欣悦 ...