数据怎么标注,才能方便人工读懂?

如题所述

分类标注。 

分类标注通俗来讲就是打标签。一张图能够有很多分类或标签,比如成人、长发等;对于文字,可以标注主谓宾语、名词动词等。除此之外,数据标注还包含描点标注、标框标注等方式,而描述标注并非标注方式之一。

分类标注是最基本的一种标注手段,其表现形式一般就是一张图对应一个数字标签,比如 Dogs vs. Cats数据集,该数据集共可分为dog和cat两类,因此标签设计时可以用0代表dog,1代表cat。

数据标注的其他方式

1、标框标注

机器视觉中的标框标注,很容易理解,就是框选要检测的对象。如人脸识别,首先要先把人脸的位置确定下来。

2、区域标注

相比于标框标注,区域标注要求更加精确。边缘可以是柔性的。如自动驾驶中的道路识别。

3、描点标注

描点标注:一些对于特征要求细致的应用中常常需要描点标注。比如人脸识别、骨骼识别等。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2024-02-26

数据标注是大部分人工智能算法得以有效运行的关键环节。简单来说,数据标注是对未经处理过的语音、图片、文本、视频等数据进行加工处理,从而转变成机器可识别信息的过程。

数据标注的主要类型

数据标注的类型主要是图像标注、语音标注、3D点云标注和文本标注。

l 图像标注

图像标注是对未经处理的图片数据进行加工处理,转换为机器可识别信息,然后输送到人工智能算法和模型里完成调用。

常见的图像标注方法有语义分割、矩形框标注、多边形标注、关键点标注、点云标注、3D立方体标注、2D/3D融合标注、目标追踪等。

l 语音标注

语音标注是标注员把语音中包含的文字信息、各种声音先“提取”出来,再进行转写或者合成,标注后的数据主要被用于人工智能机器学习,使计算机可以拥有语音识别能力。

常见的语音标注类型有ASA语音转写、语音切割、语音清洗、情绪判断、声纹识别、音素标注、韵律标注、发音校对等。

l 3D点云标注

点云数据一般由激光雷达等3D扫描设备获取空间若干点的信息,包括XYZ位置信息、RGB颜色信息和强度信息等,是一种多维度的复杂数据集合。

3D点云数据可以提供丰富的几何、形状和尺度信息,并且不容易受到光照强度变化和其它物体遮挡等影响,可以很好地了解机器的周围环境。

常见的3D点云标注类型有3D点云目标检测标注、3D点云语义分割标注、2D3D融合标注、点云连续帧标注等。

l 文本标注

文本标注是对文本进行特征标记的过程,对其打上具体的语义、构成、语境、目的、情感等数据标签,通过标注好的训练数据,我们可以教会机器如何来识别文本中所隐含的意图或者情感,使机器可以更好地理解语言。

常见的文本标注有ocr转写、词性标注、命名实体标注、语句泛化、情感分析、句子编写、槽位提取、意图匹配、文本判断、文本匹配、文本信息抽取、文本清洗、机器翻译等。

景联文科技|数据采集|数据标注

助力人工智能技术,赋能传统产业智能化转型升级

相似回答