本公开的实施例公开了基于视频图像的轨迹生成方法、装置、电子设备和介质。该方法的一具体实施方式包括:对预获取的视频中的每一帧图像进行物品实体检测,以生成物品检测信息,得到物品检测信息集合;基于该物品检测信息集合中的物品检测信息,生成候选轨迹集;从该候选轨迹集中筛选出满足轨迹筛选条件的候选轨迹作为预处理轨迹,得到预处理轨迹序列;对该预处理轨迹序列中的预处理轨迹进行轨迹融合处理,得到融合轨迹集;基于该融合轨迹集,生成物品拿取信息组集;将该物品拿取信息组集发送至目标终端以供显示。该实施方式提高了无人货柜的空间利用率。