Data Fusion for Audiovisual Speaker Localization: Extending Dynamic Stream Weights to the Spatial Domain

This repository contains the codebase accompanying the paper:

Julio Wissing, Benedikt Bönninghoff, Dorothea Kolossa, Tsubasa Ochiai, Marc Delcroix, Keisuke Kinoshita, Tomohiro Nakatani, Shoko Araki, Christopher Schymura, "Data Fusion for Audiovisual Speaker Localization: Extending Dynamic Stream Weights to the Spatial Domain", accepted for ICASSP 2021

The face tracking used to generate the input features utilizes the YOLOv3 algorithm. You can find the used yoloface repository here. Please install it before trying to generate input features for the spatial stream weighting.

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
spatial_stream_weights		spatial_stream_weights
.gitignore		.gitignore
README.md		README.md
calculate_features.py		calculate_features.py
fusion_methods.py		fusion_methods.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Data Fusion for Audiovisual Speaker Localization: Extending Dynamic Stream Weights to the Spatial Domain

About

Releases

Packages

Contributors 2

Languages

rub-ksv/spatial-stream-weights

Folders and files

Latest commit

History

Repository files navigation

Data Fusion for Audiovisual Speaker Localization: Extending Dynamic Stream Weights to the Spatial Domain

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages