Seite wählen

VNClagoon-Recherche zur KI-Effizienz: Wie Intel mit Meteor Lake beste Voraussetzungen für den Einsatz von Whisper für die Spracherkennung der nächsten Generation schafft

Im Rahmen unserer VNClagoon-KI-Projekte testen wir momentan „Whisper“, um dessen fortschrittliche Spracherkennungsfunktionen in unserer Suite von Unternehmensanwendungen unterstützend einzusetzen. Die Integration von Whisper in VNClagoon hat das Ziel, die Kommunikation, Zusammenarbeit und Produktivität der Nutzer zu verbessern, insbesondere durch präzise mehrsprachige Transkriptions- und Übersetzungsdienste, die Unternehmen dabei helfen, Aufgaben mit KI-gesteuerten Tools effizienter zu erledigen.

Die Intel Meteor Lake CPUs, die Ende 2023 gelauncht wurden, stellen einen bedeutenden Fortschritt in der Prozessortechnologie dar und bieten eine deutlich verbesserte Rechenleistung und überlegene Multitasking-Fähigkeiten.

Whisper von OpenAI ist ein quelloffenes automatisches Spracherkennungssystem (automatic speech recognition – ASR), das auf einem Encoder-Decoder-Modell basiert, welches auch als Sequenz-zu-Sequenz-Modell bezeichnet wird. Das Modell wird auf der CPU, GPU oder NPU (jeweils nur einem davon) ausgeführt, um Audiospuren mit hoher Genauigkeit zu transkribieren, also Audiodateien in Text umzuwandeln, einschliesslich der Unterstützung mehrerer Sprachen.

Intel optimiert Whisper für seine Meteor Lake-Prozessoren, indem es die Effizienz des Systems bei der Bewältigung von KI-Workloads verbessert und sich dabei insbesondere auf die Maximierung der Leistung bei gleichzeitiger Minimierung des Stromverbrauchs konzentriert. Dies beinhaltet die genaue Konfiguration von Whisper, um die Vorteile der architektonischen Fortschritte von Meteor Lake zu nutzen, wie z. B. verbesserte Rechenkerne und spezielle Hardware-Beschleuniger und somit schnellere und energieeffizientere Transkriptions- und Übersetzungsaufgaben auf CPUs, GPUs oder NPUs zu ermöglichen.

VNClagoon ist eine integrierte Suite von Unternehmensanwendungen für Kommunikation und Zusammenarbeit, die eine sichere Alternative zu etablierten Software-Giganten darstellt. VNClagoon bietet eine Reihe von Lösungen, die Unternehmen und Nutzern dabei helfen, ihre Arbeitsabläufe zu optimieren, Kommunikation und Zusammenarbeit zu verbessern und die Produktivität zu steigern. VNC konzentriert sich auf die Nutzung von KI (Künstliche Intelligenz) innerhalb der VNClagoon-Umgebung, um die Verwaltung von Aufgaben, Projekten und anderen arbeitsbezogenen Aktivitäten effizient und sicher zu ermöglichen.

Der Einsatz von Confidential AI innerhalb einer VNClagoon-Instanz kann Unternehmen dabei helfen, Datenschutzbestimmungen und Branchenstandards einzuhalten, indem eine sichere Umgebung für die Verarbeitung sensibler Daten bereitgestellt wird.

VNC verwendet Whisper large-v3 mit 1550 M Parametern. Dieses mehrsprachige Modell wurde gleichzeitig auf mehrsprachige Spracherkennung und Sprachübersetzung trainiert.
Für die Spracherkennung erstellt das Modell Transkriptionen in der gleichen Sprache wie das Audiomaterial (speech-to-text).
Für die Sprachübersetzung werden vom Modell Transkriptionen in einer anderen Sprache als die Audioaufnahmen erstellt (gleichzeitige Übersetzung bei speech-to-text).

Unsere Evaluation der Leistung von Whisper für verschiedene Sprachen (EN, DE) beinhaltet die Analyse der Transkription von Sprache über verschiedene linguistische, phonetische und grammatikalische Merkmale.

Die Ergebnisse unserer umfangreichen Tests zeigen, dass Whisper eine Vielzahl von Sprachen unterstützt, darunter auch wichtige Sprachen wie Englisch und Deutsch. Whisper ist sehr stark im semantischen Verständnis, auch bei Sprachen mit komplexen grammatikalischen Strukturen (Deutsch). Wir haben gute Ergebnisse beim Umgang mit unterschiedlicher Audioqualität erzielt: Transkription von Sprache aus Audiodateien mit Hintergrundgeräuschen oder Aufnahmen von geringer Qualität.

Whisper bietet eine hohe Transkriptionsgenauigkeit:
Unsere Testergebnisse bei der Überprüfung des WER sind: Deutsch 0,15 oder 15%, Englisch 0,02 (2%).
Im Englischen hat die Transkription eine ausgezeichnete Genauigkeit und im Deutschen hat die Transkription einige kleinere Fehler, ist aber im Allgemeinen sehr genau.

Hintergrundinformationen:
Die Wort-Fehler-Rate (Word Error Rate, WER) ist eine gängige Kennzahl zur Bewertung der Genauigkeit von automatischen Spracherkennungssystemen (ASR) wie Whisper. Sie misst, wie gut die Transkription des Systems mit der Referenztranskription (oder Grundwahrheit) übereinstimmt. Ein niedriger WER-Wert deutet auf eine höhere Genauigkeit und bessere Leistung hin, während höhere Werte auf mehr Transkriptionsfehler hindeuten.

Interpretation von WER:
WER < 10%: Ausgezeichnete Genauigkeit, nahe an der menschlichen Leistung.
10% ≤ WER < 30%: Gute Genauigkeit, aber mit einigen wahrnehmbaren Fehlern.
30% ≤ WER < 50%: Angemessene Genauigkeit, mit erheblichem Spielraum für Verbesserungen.
WER ≥ 50%: Schlechte Genauigkeit, wahrscheinlich zu viele Fehler, um nützlich zu sein.

Speech to text mit Agent Vincent in unserer VNCtalk Test-Umgebung


AI Komponenten in VNClagoon

Wir haben bereits mehrere KI-Komponenten in VNClagoon integriert.

Verschaffen Sie sich einen ersten Eindruck von den KI-Komponenten in VNClagoon in unserem kurzen Video (EN):

 

Confidential AI in VNClagoon:

Verschiedene KI-Komponenten wie LLM und Vector Store befinden sich bereits auf dem lokalen Intel Core Ultra (Meteor Lake) System, was Confidential AI ermöglicht.
Die Daten selbst werden dann sicher innerhalb der VNClagoon-Umgebung gehostet, wobei ausschliesslich die unternehmenseigenen Daten abgefragt werden und der Zugriff auf externe Quellen nur auf ausdrückliche Anfrage erfolgt.
Erfahren Sie mehr über VNClagoon AI in unseren Blogposts, Videos und Pressemeldungen:

Die fünf wichtigsten Elemente von Confidential AI (16. Juli 2024)
New VNClagoon AI Demo Video (EN, 26. Juni 2024)
VNClagoon at Intel Vision EMEA 2024: AI everywhere! (EN, 16. Mai 2024)
VNC zeigt KI-gestützte Secure Collaboration auf der Intel Vision EMEA 2024 (07. Mai 2024)

Ausserdem haben wir eine Reihe von Mini-Demo-Videos und Anwendungsbeispielen auf unserem VNClagoon youtube Channel veröffentlicht.

Ausführliche Informationen über die VNClagoon Kommunications & Kollaborations Suite finden Sie auf VNClagoon.com.

Möchten Sie die VNClagoon Suite live in Aktion sehen?

Registrieren Sie sich einfach auf VNClagoon LIVE, der Referenzimplementierung unseres VNClagoon Kommunikations- und Kollaborationsstacks!

Sie haben Feedback für uns?
Feedback und Verbesserungsvorschläge sind immer willkommen. Bitte schreiben Sie uns eine Nachricht in das untenstehende Kommentarfeld oder senden Sie eine E-Mail an sales@vnc.biz. Oder vereinbaren Sie hier einen Termin für Ihre ganz persönliche Demo:

Bei all unseren Produkten steht die Sicherheit Ihrer Daten an erster Stelle. Behalten Sie wichtige Informationen dort, wo sie hingehören – unter der Kontrolle Ihres Unternehmens!

Über VNClagoon
Sichere, erstklassige, nahtlose Kommunikation und Zusammenarbeit, niedrigster TCO
Die VNClagoon Enterprise Software Suite bietet eine umfassende Palette an integrierten Kommunikations- und Kollaborationsprodukten für Messaging, Echtzeit-Konferenzen, Community Building, Channels, E-Mail, Groupware, Aufgaben- und Projektmanagement, Dateiverwaltung und vieles mehr für grosse Organisationen. Basierend auf modernster Open-Source-Technologie, die von Tausenden von Entwicklern auf der ganzen Welt entwickelt wurde, ist VNClagoon eine führende Alternative zu Closed-Source- und reinen SaaS-Anwendungen wie Microsoft Teams, Zoom, WhatsApp, Dropbox und vielen anderen. Jetzt ist es für VNClagoon-Kunden möglich, eine grössere Kontrolle über ihre digitale Souveränität zu erlangen, indem sie mit einer vollständig integrierten Suite von Anwendungen sicherer kommunizieren und zusammenarbeiten. Mehr Informationen unter
https://vnclagoon.com

Testen Sie unsere Produkte

Beginnen Sie noch heute mit der Verbesserung Ihrer Kommunikation und Zusammenarbeit.

Right Menu Icon