Page d’accueil de VentureBeatcls-1 {fill: # ed2025;}SiteLogo__v {fill: #ffffff;}

In 2017, Mozilla a lancé DeepSpeech, une initiative incubée au sein de l’équipe d’apprentissage automatique de Mozilla Research axée sur l’open sourcing d’un modèle de reconnaissance vocale automatique Au cours des quatre années suivantes, l’équipe DeepSpeech a publié des versions plus récentes du modèle capable de transcrire des conférences, des conversations téléphoniques, des programmes télévisés, des émissions de radio et d’autres flux en direct avec «une précision humaine«Mais dans les mois à venir, Mozilla prévoit de cesser le développement et la maintenance de DeepSpeech alors que la société passe à un rôle de conseil, qui comprendra le lancement d’un programme de subventions pour financer un certain nombre d’initiatives démontrant des applications pour DeepSpeech

DeepSpeech n’est pas le seul projet open source de ce type, mais il est parmi les plus matures Inspiré de documents de recherche publiés par Baidu, le modèle est une architecture de bout en bout, au niveau des caractères, capable de transcrire l’audio dans une gamme de langues. L’un des principaux objectifs de Mozilla était d’atteindre un taux d’erreur de transcription de mots inférieur à 10%, et les dernières versions du modèle de langue anglaise pré-entraîné atteignent cet objectif, avec une moyenne d’environ 7Taux d’erreur de 5% sur les mots

Mozilla est convaincu que DeepSpeech a atteint le point où l’étape suivante consiste à travailler sur la création d’applications À cette fin, la société prévoit de faire passer le projet à des «personnes et organisations» intéressées à poursuivre des «explorations basées sur des cas d’utilisationMozilla affirme avoir rationalisé les processus d’intégration continue pour que DeepSpeech soit opérationnel avec un minimum de dépendances Et alors que la société nettoie la documentation et se prépare à arrêter la maintenance de la base de code par le personnel de Mozilla, Mozilla annonce qu’elle publiera une boîte à outils pour aider les personnes, Researchers, les entreprises et toute autre partie intéressée à utiliser DeepSpeech pour créer des solutions vocales.

Le travail de Mozilla sur DeepSpeech a commencé à la fin de 2017, dans le but de développer un modèle qui obtient des fonctionnalités audiola paroleen tant qu’entrée et sortie de caractères directement L’équipe espérait concevoir un système qui pourrait être formé à l’aide du cadre TensorFlow de Google via un apprentissage supervisé, dans lequel le modèle apprend à déduire des modèles à partir d’ensembles de données de discours étiquetés.

Le dernier modèle DeepSpeech contient des dizaines de millions de paramètres, ou les parties du modèle apprises à partir des données d’entraînement historiques L’équipe de recherche Mozilla a commencé à l’entraîner avec un seul ordinateur exécutant quatre GPU Titan X Pascal, mais l’a finalement migré vers deux serveurs avec 8 Titan XP chacun. Au début du projet, la formation d’un modèle très performant prenait environ une semaine

In the years that followed, Mozilla s’est efforcé de réduire le modèle DeepSpeech tout en améliorant ses performances et en restant en dessous de l’objectif de taux d’erreur de 10%. Le modèle de langue anglaise est passé de 188 Mo à 47 Mo et la consommation de mémoire a chuté de 22 fois En décembre 2019, l’équipe a réussi à faire fonctionner DeepSpeech «plus vite que le temps réel» sur un seul cœur d’un Raspberry Pi 4

Mozilla a initialement formé DeepSpeech en utilisant des ensembles de données disponibles gratuitement comme TED-LIUM et LibriSpeech ainsi que des corpus payants comme Fisher et Switchboard, mais ceux-ci se sont avérés insuffisants L’équipe a donc contacté les chaînes de télévision et de radio publiques, les départements d’études linguistiques des universités et d’autres personnes qui, according to her, auraient pu étiqueter les données vocales à partager Grâce à cet effort, ils ont pu plus que doubler la quantité de données d’entraînement pour le modèle DeepSpeech en anglais.

Inspirée par ces efforts de collecte de données, l’équipe de recherche de Mozilla a collaboré avec l’équipe Open Innovation de Mozilla pour lancer le projet Common Voice, qui vise à collecter et valider les contributions vocales de bénévoles. Common Voice se compose non seulement d’extraits de voix, mais également de métadonnées fournies volontairement, utiles pour entraîner les moteurs vocaux, comme l’âge, le sexe et les accents des locuteurs. Il a également été développé pour inclure des segments cibles de l’ensemble de données à des fins et des cas d’utilisation spécifiques, tels que les chiffres «zéro» at «neuf» et les mots «Yes», «non,» «hey» and «Firefox.

Today, Common Voice est l’un des plus grands corpus vocaux multilingues du domaine public au monde, with over 9 000 heures de données vocales dans 60 langues différentes, y compris les langues largement parlées et les moins utilisées, comme le gallois et le kinyarwanda. More than 164 000 personnes ont contribué à l’ensemble de données à ce jour

Pour soutenir la croissance du projet, Nvidia a annoncé aujourd’hui qu’elle investirait 1 $5 millions dans Common Voice pour engager plus de communautés et de bénévoles et soutenir l’embauche de nouveau personnel Common Voice fonctionnera désormais sous l’égide de la Fondation Mozilla dans le cadre de ses initiatives visant à rendre l’IA plus digne de confiance.

À la fin du développement de DeepSpeech, Mozilla a déclaré que son prochain programme de subventions accordera la priorité aux projets qui contribuent à la technologie de base tout en présentant son potentiel pour «autonomiser et enrichir» des domaines qui, other, n’auraient pas de voie viable vers la parole. interaction basée Plus de détails seront annoncés en mai, lorsque Mozilla publiera un playbook pour guider les gens sur la façon d’utiliser la base de code de DeepSpeech comme point de départ pour les applications vocales

Nous voyons émerger des moteurs vocaux open source matures Cependant, il y a encore une lacune importante dans l’écosystème: les moteurs vocauxouverts et fermésne fonctionnent pas pour de vastes pans des langues, des accents et des modèles de discours du monde », a déclaré Mark Surman, directeur exécutif de la Fondation Mozilla, à VentureBeat par email «Pour des milliards d’internautes, les technologies vocales ne sont tout simplement pas utilisables Mozilla a décidé de concentrer ses efforts de ce côté de l’équation, en rendant la technologie vocale inclusive et accessible Cela signifie investir dans des ensembles de données vocales plutôt que dans notre propre moteur vocal Nous doublons sur Common Voice, un ensemble de données open source qui se concentre sur les langues et les accents qui ne sont pas actuellement représentés dans l’écosystème de la technologie vocale Les données Common Voice peuvent être utilisées pour alimenter des cadres [discours ouvert]… et à leur tour pour permettre à plus de personnes dans plus d’endroits d’accéder à la technologie vocale Nous travaillons [also] en étroite collaboration avec Nvidia pour faire correspondre ces deux aspects de l’équation de la technologie vocale inclusive

Rejoignez-nous pour le principal événement mondial sur l’accélération de la transformation de l’entreprise grâce à l’IA et aux données, pour les décideurs en technologie d’entreprise, présenté par l’éditeur n ° 1 de l’IA et des données

Nvidia, artificial intelligence, fondation Mozilla, computer

News – United States – Mozilla Ends DeepSpeech Development and Announces Grants Program
Associated title :
Mozilla Completes DeepSpeech Development, Announces Grants Program
NVIDIA Announces Availability of Jarvis Interactive Conversational AI Framework
Mozilla s’associe à NVIDIA pour démocratiser et diversifier la technologie vocale

Source: https://venturebeat.com/2021/04/12/mozilla-winds-down-deepspeech-development-announces-grant-program/

Building on its expertise in the areas of digital, technologies and processes , CSS Engineering you in your most ambitious transformation projects and helps you bring out new ideas, new offers, new modes of collaboration, new ways of producing and selling.

CSS Engineering is involved in projects each customer as if it were his own. We believe a consulting company should be more than an advisor. We put ourselves in the place of our customers, to align we incentives to their goals, and collaborate to unlock the full potential their business. This establishes deep relationships and enjoyable.

Our services:

  1. Create professional websites
  2. Hosting high performance and unlimited
  3. Sale and video surveillance cameras installation
  4. Sale and Installation of security system and alarm
  5. E-Marketing

All our achievements here https://www.css-engineering.com/en/works/