北外考研网

北外考研培训辅导班有哪些



比GPT还猛!FaceBook发布CV大模型后,研讨生直呼要集体赋闲了图像处置…

比gpt还猛!facebook发布cv大模型后,研讨生直呼要集体赋闲了
不久前,meta公司也就是之前的facebook,发布了一款可以切割悉数的第一个图像切割基础模型–segment anything model(sa
比GPT还猛!FaceBook发布CV大模型后,研讨生直呼要集体赋闲了图像处置…插图
m)。

消息传开今后,cv作业炸锅了。
网友直呼:cv不存在了,快跑!

cv也就是核算机视觉(computer vision)是一种人工智能领域的技能,旨在让核算机具有类似于人类视觉感知和了解的才能。
它使用数字图像处置、方法辨认、机器学习等办法,从图像或视频中获取出有用的信息,例如目标检测、辨认、跟踪、姿势估量、三维重建等。
具体来说,核算机视觉可以使用于许多领域,例如医学印象分析、主动驾御、平安监控、无人机航拍、人脸辨认、游戏开发、虚拟实际和增强实际等。

在cv大模型呈现之前,核算机视觉领域的图像切割使命一般运用传统的图像处置和机器学习办法来处置。这些办法首要包括以下两种:
根据边缘检测的切割办法:该办法根据边缘检测技能来获取图像中的边缘信息,并使用切割算法将边缘联接变成无缺的区域。这种办法依靠于图像中的部分特征,如纹路、灰度等,简略遭到噪声、光照等要素的影响。
根据区域生长的切割办法:该办法从图像中选择一个或多个开始种子点,在此基础上经过必定规则不断拓宽相邻区域,究竟结束整幅图像的切割。
这种办法可以使用区域间的全局信息,但关于开始种子点的选择和规则的方案需要人工经历和调试。
这两种办法都非常耗费人力和时刻,需要由领域内的专家进行高度专业化的作业,而且不能供给通用的全主动切割办法。
meta发布的切割大模型处置了以上难题,作为第一个cv领域的通用大模型,sam承受了许多多样化数据练习的可提示模型。可以结束各种使命,操作起来也非常简略独便。
sam现已掌控了“啥是目标”这一概念,意味着就算是没有经过练习的图像或许视频,它也可以生成相对应的掩码。
那么sam究竟是怎么操作的?
官网演示中可以经过点提示、画框提示、全选、语音输入等方法来完成图像切割。
首要选择或许上载一张相片,如下图,选择了这张沙发的相片。

点击进入今后就是这个界面,左面的菜单栏可以选择不一样的提示方法。

第一种方法,点提示,将鼠标移到画面中任何一个物体上就可以选中,还可以多次点选,添加更多的物品。

选择box,也就是画框的方法,关于图像中任意物体画框就能选中直接进行切割。

选择everything,全选画面,就会将整张图进行切割!

最终一种方法,文本输入,类似如今的chatgpt输入方法,只需要用文字输入你的需求,就能主动辨认。
这种方法在演示中没有,可是在官方实例中呈现了,比方输入cat,就能主动辨认出图里的一切猫。
cv领域的切割大模型,是一种用于像素等级的图像切割使命的深度学习模型。简略来说,它可以将输入的图像分红若干个区域或像素,每个区域或像素代表一个不一样的品种或目标。
经过切割大模型,咱们可以在许多使用中完成愈加精确和高效的图像分析和了解。例如,在医疗领域,切割模型可以协助医生主动分析ct、mri等印象数据,辨认并定位肿瘤、血管、器官等重要规划。
在主动驾御领域,切割模型可以协助车辆辨认行人、车辆、路途标志、车道线等要害信息,前进行进平安性。
在遥感图像分析领域,切割模型可以协助农业、林业等领域对土地、作物、森林等本钱进行精密化打点和监测。
当前meta现已开源了sam大模型,而且同享了数据集。meta公司期望可以让sam被使用到更广泛的领域,变成ar、vr、内容创建和愈加通用的ai体系组件,推定有关领域的科技打开。
毫无疑问,cv大模型的年代现已到来,将来cv领域将会引发怎样的浪潮,时刻会给咱们答案。

LEAVE A RESPONSE

您的电子邮箱地址不会被公开。 必填项已用 * 标注

Related Posts

|京ICP备18012533号-326