Reunion video déclenchée par la parole

Bonjour,
Je sais que ce n’est pas vraiment du Growth, mais les growths sont les meilleurs en veille techno, alors …
Voici ce que je veux mettre en place:

1- dans chacun de nos Resort, un ordinateur de type Apple, qui peut-etre piloté par la voix.
2- Sur chaque ordinateur, un défilé constant de photo et de vidéo, qui montre notre savoir faire,
3- Un bandeau en haut de l’écran, avec un message du style «Je suis votre e-concierge, dites « e-concierge » et j’apparais ! »
4- Une liaison vidéo de type Team, Zoom ou autre apparait avec une personne réelle de notre société qui rentre en communication – a distance.
5- Une fois l’échange terminé avec le client, le slideshow repart.

Quelqu’un a une idée, si cela existe ?
Tres cordialement,

Hello @Ceneri,
Je ne connais pas de solution toute faite.

Je ne suis absolument certain de rien, ce serait les pistes que j’aurais exploité :

Pour faire simple et bidouille :
Power Automate + déclenchement du mot via Cortona
Ou
Power Automate + écran tactile

Puis ça déclenche Teams et switch à nouveau sur PowerPoint (en mettant le bandeau en haut)

Des apps pour le faire plus proprement (?) :

Des prestataires qui ont plus l’habitude (ceux qui font des bornes tactiles)

  • Digilor par exemple (société FR) qui a peut-être déjà cela (ils ont différents software, comme le bandit manchot, etc), ou d’autres prestataires.
  • Ou même sur Fiverr avec « touch kiosk » ou « kiosk app », celui-ci par exemple, ou encore regarder en quel language ça se fait le plus, et aller directement sourcer les dev
1 « J'aime »

Sinon petite application électron avec le sdk zoom. Pour le micro je crois que tu trouveras des libs de speech to text.

1 « J'aime »

Pas evident,
Merci pour ta réponse,
Si je trouve un peu de budget, je mettrais un pro dessus.

J’aurai tendance à utiliser whisper pour récupérer le flux audio et le décoder. Pour savoir ce qu’il contient, en plus ça élimine pas mal les bruits parasites.
Plutôt que de lancer un appel Zoom pour ne pas evnoyer un notification au call center et si une personne du call center qui lance le meet ?

Ça peut être une bonne idée de faire ça dans l’autre sens. Ça pourrait enlever certaine problématique.

Pour de la reco d’audio via API comme Whisper, je m’étais posé la question et je ne l’ai pas évoqué pour des raisons de coût (je ne sais pas combien c’est)

Car je me dis qu’au final il serait en écoute toute la journée avec les bruits et conversations environnantes.
Tu en penses quoi ?

Je suis d’accord, c’est mieux si c’est la personne du call center qui lance le meet a distance. Peut etre demander a la personne de dire une phrase du type "Concierge, es-tu la "

1 « J'aime »

Pour avoir tester pendant plusieurs jours toutes les solutions pour un client @Kevin-Zimmermann :
whipser
fireflies etc…

Je recommande de passer par Assembly AI qui est pour moi le plus quali surtout si on automatise avec du make ou autre.

Whisper c’est pas très chère, maus surtout le résultats et pas top si on envois des gros audio. Souvent des répétitions de mots etc…

1 « J'aime »

Merci pour le tips.
L’idée serait que l’on suscite sur l’écran de l’Imac l’envie de se connecter a quelqu’un de reel, en prononcant un mot ou une phrase.
Mais ensuite la communication ne serait plus virtuelle, mais réelle, comme un zoom ou un team.
Bonne journée

Merci je ne connaissais pas.
J’ai testé la version Opensource de whisper donc niveau prix c’était le coup du VPS.
Après pas testé non plus sur des longues périodes, j’imagine qu’il faut découper par petit morceau pour avoir un truc viable.