语义分割(Semantic Segmentation) 是计算机视觉对现实世界理解的基础,大到自动驾驶,小到个人应用只要细心观察都可以发现语义分割的应用场所无处不在,其实语义分割相当于是图像分割和对分割区域的理解。 本文使用了飞桨提供的PaddleSeg图像分类套件训练分类模型 ...
目标检测(Obiect Detection)近年来一直是深度学习视觉领域理论和应用的研究热点,目标检测即是在给定的图像中找到期望的物体,同时确定物体的标签和位置。 YOLOv3(You Only Look Once,Version 3)是一种实时目标检测算法。本文在YOLOv3算法的基础上,介绍了目标检测模型的 ...
随着 DeepSeek、 GPT 和 Llama 等大语言模型(LLMs)不断推动人工智能的边界,它们在高效部署方面也带来了重大挑战。这些模型在生成类似人类的文本方面具有革命性,但每生成一个 token 都需要耗费巨大的计算资源。这不仅导致成本上升、能耗增加,还使响应速度 ...
近期阿里通义实验室在 Hugging Face 和 ModelScope 上开源了 Qwen2.5-VL 的 Base 和 Instruct 模型,包含 3B、7B 和 72B 在内的 3 个模型尺寸。其中,Qwen2.5-VL-7B-Instruct 在多个任务中超越了 GPT-4o-mini,而 Qwen2.5-VL-3B 作为端侧 AI 的潜力股,甚至超越了之前版本 的Qwen2-VL 7B ...