数据标注的类型有哪些?

如题所述

数据标注的类型有分类标注、标框标注、区域标注、描点标注、其他标注。

数据标注是通过数据加工人员借助类似于BasicFinder这样的标记工具,对人工智能学习数据进行加工的一种行为。也许这么说仍然会有很多人不理解什么是数据标注,举个简单的例子,我们在聊天软件中,通常会有一个语音转文本的功能,这种功能的实现大多数人可能都会知道是由智能算法实现的。

但是很少有人会想,算法为什么能够识别这些语音呢,算法是如何变得如此智能的。其实智能算法就像人的大脑一样,它需要进行学习,通过学习后它才能够对特定数据进行处理、反馈。

正如语音的识别,模型算法最初是无法直接识别语音内容的,而是经过人工对语音内容进行文本转录,将算法无法理解的语音内容转化成容易识别的文本内容,然后算法模型通过被转录后的文本内容进行识别并与相应的音频进行逻辑关联。

也许会有人问,那么不同的语速、音色模型算法怎么能够分辨呢。这就是为什么模型算法在学习时需要海量数据的原因,这些数据必须覆盖常用语言场景、语速、音色等,全面的数据才能训练出出色的模型算法,下面我就给大家具体介绍一下标注类型。

1、分类标注:分类标注,就是我们常见的打标签。一般是从既定的标签中选择数据对应的标签,是封闭集合。一张图就可以有很多分类/标签:成人、女、黄种人、长发等。对于文字,可以标注主语、谓语、宾语,名词动词等。

适用:文本、图像、语音、视频。

应用:脸龄识别、情绪识别、性别识别。

2、标框标注:机器视觉中的标框标注,很容易理解,就是框选要检测的对象。如人脸识别,首先要先把人脸的位置确定下来。

适用:图像。

应用:人脸识别、物品识别。

3、区域标注:相比于标框标注,区域标注要求更加精确。边缘可以是柔性的,如自动驾驶中的道路识别。

适用:图像。

应用:自动驾驶。

4、描点标注:一些对于特征要求细致的应用中常常需要描点标注。人脸识别、骨骼识别等。

适用:图像。

应用:人脸识别、骨骼识别。

5、其他标注:标注的类型除了上面几种常见,还有很多个性化的。根据不同的需求则需要不同的标注。如自动摘要,就需要标注文章的主要观点,这时候的标注严格上就不属于上面的任何一种了。(或则你把它归为分类也是可以的,只是标注主要观点就没有这么客观的标准,如果是标注苹果估计大多数人标注的结果都差不多。)

综上所述,大家是不是对数据标注有了更深入的了解呢,随着AI智能时代的到来,数据标注越来越被需要,很多数据标注岗位薪资待遇都很高。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2023-11-07

数据标注的类型主要是图像标注、语音标注、3D点云标注和文本标注。

l 图像标注

图像标注是对未经处理的图片数据进行加工处理,转换为机器可识别信息,然后输送到人工智能算法和模型里完成调用。

常见的图像标注方法有语义分割、矩形框标注、多边形标注、关键点标注、点云标注、3D立方体标注、2D/3D融合标注、目标追踪等。

l 语音标注

语音标注是标注员把语音中包含的文字信息、各种声音先“提取”出来,再进行转写或者合成,标注后的数据主要被用于人工智能机器学习,使计算机可以拥有语音识别能力。

常见的语音标注类型有ASA语音转写、语音切割、语音清洗、情绪判断、声纹识别、音素标注、韵律标注、发音校对等。

l 3D点云标注

点云数据一般由激光雷达等3D扫描设备获取空间若干点的信息,包括XYZ位置信息、RGB颜色信息和强度信息等,是一种多维度的复杂数据集合。

3D点云数据可以提供丰富的几何、形状和尺度信息,并且不容易受到光照强度变化和其它物体遮挡等影响,可以很好地了解机器的周围环境。

常见的3D点云标注类型有3D点云目标检测标注、3D点云语义分割标注、2D3D融合标注、点云连续帧标注等。

l 文本标注

文本标注是对文本进行特征标记的过程,对其打上具体的语义、构成、语境、目的、情感等数据标签,通过标注好的训练数据,我们可以教会机器如何来识别文本中所隐含的意图或者情感,使机器可以更好地理解语言。

常见的文本标注有ocr转写、词性标注、命名实体标注、语句泛化、情感分析、句子编写、槽位提取、意图匹配、文本判断、文本匹配、文本信息抽取、文本清洗、机器翻译等。

景联文科技是AI基础行业的头部数据供应商,可协助人工智能企业解决整个人工智能链条中数据标注环节的相对应问题。

有兴趣可以看看我们官网哦~网页链接

相似回答