以下是 Deep Lake 中支持的完整张量类型(htype
)列表,这些类型用于定义数据集中的每个字段(如图像、标签、文本等),并决定了 Deep Lake 如何处理和优化存储与加载。
htype
类型一览htype 名称 |
描述 |
---|---|
image |
图像数据(如 JPEG/PNG 编码的 RGB 图像) |
video |
视频帧序列 |
audio |
音频波形数据(如 WAV 格式) |
text |
文本字符串 |
json |
JSON 格式的数据对象 |
bbox |
边界框坐标(格式为 [x_min, y_min, x_max, y_max] ) |
bbox_3d |
三维边界框坐标 |
class_label |
分类标签(整数或字符串映射) |
binary_mask |
二值掩码(如分割任务中使用) |
segment_mask |
多类别语义分割掩码 |
point |
点坐标(如关键点检测) |
point_3d |
三维空间中的点 |
polygon |
多边形坐标列表(用于实例分割) |
pose |
姿态信息(如人体关键点姿态) |
embedding |
向量嵌入(如神经网络输出的特征向量) |
generic |
通用数据(默认类型,适用于任意结构化/非结构化数据) |
optical_flow |
光流数据(视频中的运动矢量场) |
depth |
深度图(如 RGB-D 相机获取的深度图像) |
interval |
时间间隔(用于视频标注) |
sequence |
序列数据(如文本、音频、动作序列) |
sequence[label] |
序列标签(如词级分类) |
time_series |
时间序列数据(如传感器数据) |
link |
外部资源链接(URL 或文件路径) |
import deeplake
ds = deeplake.dataset('./my_dataset')
with ds:
ds.create_tensor('images', htype='image', sample_compression='jpeg')
ds.create_tensor('labels', htype='class_label')
ds.create_tensor('bboxes', htype='bbox')
ds.create_tensor('masks', htype='segment_mask')
ds.create_tensor('texts', htype='text')
ds.create_tensor('embeddings', htype='embedding')