multimodal-dialogue

Here are 11 public repositories matching this topic...

friedrichor / Awesome-Multimodal-Papers

A curated list of awesome Multimodal studies.

deep-learning multimodal-learning multimodal multimodal-deep-learning multimodal-data multimodal-dialogue multimodal-large-language-models large-multimodal-models

Updated Mar 11, 2026

zjr2000 / Awesome-Multimodal-Chatbot

Star

Awesome Multimodal Assistant is a curated list of multimodal chatbots/conversational assistants that utilize various modes of interaction, such as text, speech, images, and videos, to provide a seamless and versatile user experience.

awesome chatbot papers chat-application multimodal general-ai vision-language instruction-following multimodal-dialogue instruction-tuning multimodal-assistant

Updated Jun 18, 2023

hee-suk-yoon / BI-MDRG

Star

[ECCV'24] Official code for "BI-MDRG: Bridging Image History in Multimodal Dialogue Response Generation"

multimodal-dialogue

Updated Nov 19, 2024
Python

Yuco-Z / Awesome-Multi-Modal-Dialog

Star

[Paperlist] Awesome paper list of multimodal dialog, including methods, datasets and metrics

dialogue awesome-list multimodal-learning multimodal multimodal-deep-learning multimodal-datasets paperlist dialogue-system multimodal-dialogue

Updated Jan 22, 2025

phellonchen / awesome-visual-dialog

Star

Recent Advances in Visual Dialog

visual-dialog multimodal-deep-learning guesswhat multimodal-dialogue

Updated Aug 19, 2022

Aman-4-Real / awesome-multimodal-dialogue

Star

Paper, dataset and code list for multimodal dialogue.

dialogue dialog visual-dialog multimodal-dialogue visual-dialogue

Updated Jan 2, 2025

ImKeTT / ReSee

Star

[EMNLP'23 Oral] ReSee: Responding through Seeing Fine-grained Visual Knowledge in Open-domain Dialogue PyTorch Implementation

transformers dataset dialogue-systems pretrained-language-model multimodal-dialogue visual-dialogue emnlp2023

Updated Dec 4, 2023
Python

giubots / vision-enabled-dialogue

Star

Code for a vision-enabled dialogue system, combining dialogue and visual inputs to enhance contextual awareness. Utilizing GPT-4, the system summarizes prompt images for brevity and can be employed as a standalone application with a webcam or integrated into a Furhat robot.

multimodal-dialogue conversation-manager