DeepLake 支持的 `htype` 类型一览

以下是 Deep Lake 中支持的完整张量类型(htype)列表,这些类型用于定义数据集中的每个字段(如图像、标签、文本等),并决定了 Deep Lake 如何处理和优化存储与加载。


Deep Lake 支持的 htype 类型一览

htype 名称 描述
image 图像数据(如 JPEG/PNG 编码的 RGB 图像)
video 视频帧序列
audio 音频波形数据(如 WAV 格式)
text 文本字符串
json JSON 格式的数据对象
bbox 边界框坐标(格式为 [x_min, y_min, x_max, y_max]
bbox_3d 三维边界框坐标
class_label 分类标签(整数或字符串映射)
binary_mask 二值掩码(如分割任务中使用)
segment_mask 多类别语义分割掩码
point 点坐标(如关键点检测)
point_3d 三维空间中的点
polygon 多边形坐标列表(用于实例分割)
pose 姿态信息(如人体关键点姿态)
embedding 向量嵌入(如神经网络输出的特征向量)
generic 通用数据(默认类型,适用于任意结构化/非结构化数据)
optical_flow 光流数据(视频中的运动矢量场)
depth 深度图(如 RGB-D 相机获取的深度图像)
interval 时间间隔(用于视频标注)
sequence 序列数据(如文本、音频、动作序列)
sequence[label] 序列标签(如词级分类)
time_series 时间序列数据(如传感器数据)
link 外部资源链接(URL 或文件路径)

使用示例

import deeplake

ds = deeplake.dataset('./my_dataset')

with ds:
    ds.create_tensor('images', htype='image', sample_compression='jpeg')
    ds.create_tensor('labels', htype='class_label')
    ds.create_tensor('bboxes', htype='bbox')
    ds.create_tensor('masks', htype='segment_mask')
    ds.create_tensor('texts', htype='text')
    ds.create_tensor('embeddings', htype='embedding')

你可能感兴趣的:(DeepLake,人工智能,pytorch,神经网络,深度学习,机器学习)