首页
智算服务
AI 生态大厅
算力商情政策资讯合作与生态场景方案关于我们
为您找到符合条件的筛选结果 29
手语手势识别数据
180,717张手语手势识别数据多样性包括多种场景、41种静态手势、95种动态手势、多种拍摄角度和多种光照条件 。在标注方面,标注21关键点、手势类别标注、手势属性标注。180,717张手语手势识别数据可用于手势识别,手语翻译等任务。
人脸识别数据
2,937人面部遮挡多姿态人脸识别数据 可应用于遮挡人脸检测及识别等计算机视觉任务。
学术数据集训练集
用于“Aishell-1学术数据集的中文语音识别模型”的Aishell-1训练集。希尔贝壳中文普通话开源语音数据库AISHELL-ASR0009-OS1录音时长178小时,是希尔贝壳中文普通话语音数据库AISHELL-ASR0009的一部分。AISHELL-ASR0009录音文本涉及智能家居、无人驾驶、工业生产等11个领域。录制过程在安静室内环境中, 同时使用3种不同设备: 高保真麦克风(44.1kHz,16-bit);Android系统手机(16kHz,16-bit);iOS系统手机(16kHz,16-bit)。高保真麦克风录制的音频降采样为16kHz,用于制作AISHELL-ASR0009-OS1。400名来自中国不同口音区域的发言人参与录制。经过专业语音校对人员转写标注,并通过严格质量
车牌识别数据集
车牌图,用于车牌识别模型的训练与验证,训练集370k,验证集40k
手写数据集
该数据集包含3432张手写中文文本图像,适用于手写识别模型的评估与测试。
中文诗词数据集
中文诗词生成数据集,由中国古代各朝代诗词组成,可用于训练诗词续写模型
金融推理思维链数据集
金融领域复杂问题思维链数据集项目。通过 Chain of Thought (CoT) 蒸馏方法从大规模语料中提取金融领域知识。
密集描述数据集
本数据集包含来自sa-1b数据集中8631528幅图像的详尽、高品质、长文本描述。每张图片的描述细分为全局描述与细节元素,其中细节描述聚焦于图像内的关键元素,而全局描述整合了这些细节并提供更全面的信息。
图像数据集
这是一个使用 Qwen-Image 模型生成的图像数据集,共有 160,000 张 1024 x 1024 的图像,包括通用数据子集(diffusion_db 子集)、英文文本渲染数据子集(en_text_anywordlaion 子集)和中文文本渲染数据子集(zhtext_anywordlaion 子集)。
监控人体属性数据
208,914框监控人体属性数据包含室内(商场)和室外(街道、商场门口、广场)场景。数据涵盖男性女性,年龄分布为儿童至老人。在标注方面,标注人体矩形框和19种属性。208,914框监控人体属性数据可用于人体属性识别等任务。