Visual Bank élargit son « Qlean Dataset » pour soutenir les modèles de base (Foundation Models) de parole japonaise à grande échelle

3 Apr 2026
TOKYO

Visual Bank Inc. (CEO : Saneyuki Nagai), par l'intermédiaire de sa filiale amanaimages Inc., l'un des plus importants fournisseurs d'actifs numériques du secteur du marketing et de la publicité au Japon, riche de plus de 40 ans d'histoire, a annoncé aujourd'hui l'expansion de son Dataset Qlean, une solution premium de données d'entraînement IA conçue pour les développeurs qui créent des modèles de base de parole japonaise haute performance.

Ce communiqué de presse contient des éléments multimédias. Voir le communiqué complet ici : https://www.businesswire.com/news/home/20260401408476/fr/

S’appuyant sur plus de 40 ans d’expertise via amanaimages inc., Visual Bank Group enrichit son « Qlean Dataset » en proposant des corpus de langue japonaise de haute qualité et droits sécurisés, incluant plus de 100 000 heures d’audio exploitables commercialement.

S’appuyant sur plus de 40 ans d’expertise via amanaimages inc., Visual Bank Group enrichit son « Qlean Dataset » en proposant des corpus de langue japonaise de haute qualité et droits sécurisés, incluant plus de 100 000 heures d’audio exploitables commercialement.

Un nouveau développement au sein de la division Dataset Qlean, orienté vers la fourniture aux institutions dédiées à la R&D de datasets droits sécurisés pour l'entraînement de l'IA et l'applications de données à grande échelle, a positionné l'entreprise comme fournisseur de premier plan d'infrastructures de données en langue japonaise, en particulier pour les corpus de parole japonais structurés organisés par configuration de locuteurs et domaine thématique.

Principales fonctionnalités pour les développeurs d'IA

  • Données droits sécurisés pour une utilisation commerciale
    Toutes les données sont entièrement droits sécurisés pour une utilisation commerciale et conformes aux normes internationales telles que le RGPD et le CCPA.
  • Ressources audio haute fidélité
    Les enregistrements à 48 kHz/16 bits ou plus capturent à la fois la parole de qualité studio et les environnements acoustiques.
  • Annotation humaine experte
    Les transcriptions de niveau natif et les métadonnées structurées fournissent des datasets prêts à l'emploi pour le développement de l'IA.
  • Datasets de sécurité et de modération
    Les datasets prennent en charge la détection de propos nuisibles, notamment les discours de haine et les invites abusives.
  • Datasets d'évaluation japonais
    Les datasets d'évaluation sont alignés sur des référentiels internationaux tels que MMSU afin de mesurer le raisonnement et les nuances linguistiques en japonais.
  • Environnements acoustiques spécifiques au Japon
    Les contenus audio spécifiques au Japon, notamment pour les instruments traditionnels, les temples et les environnements urbains, prennent en charge l'IA multimodale et spatiale.

Ces datasets sont disponibles via « AI Data Recipe », une offre flexible proposant à la fois des datasets prêts à l'emploi et une production de données sur mesure, notamment la diffusion, l'enregistrement et l'annotation des locuteurs adaptés aux architectures de modèles et aux besoins de développement spécifiques.

« Face à la demande croissante de modèles de base contextualisés au niveau culturel, les données d'entraînement japonaises de haute qualité et conformes à la législation sont de plus en plus critiques », a déclaré Saneyuki Nagai, CEO de Visual Bank Inc. « Visual Bank s'engage à combler l'écart entre le contenu brut et les systèmes d'IA prêts pour la production grâce à une préparation et une ingénierie rigoureuses des données. »

AI Data Recipe
https://qleandataset.visual-bank.co.jp/en/lineup

Corpus de langue japonaise
https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora

Le texte du communiqué issu d’une traduction ne doit d’aucune manière être considéré comme officiel. La seule version du communiqué qui fasse foi est celle du communiqué dans sa langue d’origine. La traduction devra toujours être confrontée au texte source, qui fera jurisprudence.

 

© Business Wire, Inc.

Haftungsausschluss :
Diese Pressemitteilung ist kein von AFP erstelltes Dokument. AFP übernimmt keine Verantwortung für ihren Inhalt. Bei Fragen wenden Sie sich bitte an die im Text der Pressemitteilung genannten Kontaktpersonen/Stellen.