【Neptune:Google DeepMind发布的长视频理解数据集,包含超过2400个长视频和3200个问答对,专注于测试AI模型的长视频理解能力,涵盖视频
2024-12-05浏览详情
【TemporalBench:视频理解基准测试工具,专门评估多模态视频模型对细节时间动态和动作的理解能力,包含约10K视频问答对,源自2K高质量的
2024-11-13浏览详情
【Video-XL:面向小时级视频理解的超长视觉语言模型,首个小时级视频理解模型】'Video-XL: Extra-Long Vision Language Model for Ho
2024-10-28浏览详情
【SlowFast-LLaVA:无需训练的视频大型语言模型的强基线,适用于视频理解和推理任务,无需任何数据微调即可与最先进的视频LLMs相媲美或
2024-08-28浏览详情
正在拼命加载中
我是有底线的
没有更多的页面可以加载啦!