Guangzhou DSPPA Audio Co., Ltd.

D7601-AI sistema de conferencia de transcripción de voz

D7601-AI sistema de conferencia de transcripción de voz


I. Descripción de la solución
Con la creciente demanda de registros de reuniones y las necesidades de seguridad de los clientes, es necesario registrar, transmitir y garantizar la seguridad de los contenidos de las reuniones en las escenas importantes de reuniones, como capacitación en reuniones, entrevistas y discursos. Principalmente enfrentando los siguientes problemas importantes:
Dificultad para publicar registros de reuniones
1. Publicación prematura: requisitos elevados para la puntualidad de la reunión; las conclusiones de la reunión no se pueden comunicar a tiempo.
2. registros incompletos: carga de trabajo pesada, fácil de fatiga, fácil de cometer errores, toma más de 4 horas para organizar 1 hora de grabación;
3. Fuga de datos sensible: los documentos de los registros de reunión no se pueden almacenar, modificar y gestionar de manera unificada.
Baja Eficiencia de recepción de información
1.No hay Visualización de subtítulos en tiempo real: los oyentes se ven fácilmente afectados por el acento y el sonido, y no pueden obtener información precisa durante poco tiempo, por lo que se necesitan subtítulos en tiempo real para ayudar.
2. Sin retrospectiva de comparación de voz y texto: una reunión a gran escala lleva mucho tiempo y la audiencia obtiene información dispersa, por lo que es necesario comparar la voz y el texto retrospectivamente después de la reunión;
Como uno de los principales canales para que las personas intercambien información, la voz transmite una gran cantidad de contenido de datos significativo. Con la investigación y el desarrollo de la tecnología de voz inteligente, las máquinas pueden reemplazar a los seres humanos por el trabajo relacionado, resolviendo los problemas de los registros de reuniones de alto nivel en escenarios de reuniones importantes y la incapacidad de la eficiencia del registro de la mano de obra.



El sistema de conferencia de transcripción de voz AI desarrollado por DSPPA es un producto de sistema inteligente fuera de línea puro especialmente diseñado para resolver los problemas de dificultad en el registro de registros de conferencias importantes, baja eficiencia y no trazabilidad. Sus funciones centrales incluyen los siguientes aspectos.
● Liberar en gran medida los recursos humanos y reducir el costo de la empresa y la Organización.
● El contenido de la Conferencia se puede editar y revisar de manera portátil, y la velocidad de redacción es rápida.
● La grabación de audio de la reunión tiene comparación de texto, lo que es conveniente para la corrección de pruebas.
● Visualización en tiempo real de los subtítulos de la Conferencia para construir la transmisión de información multidireccional.
● Los datos de la reunión son fáciles de administrar, y las actas de la reunión se pueden rastrear mediante comparación de audio y texto.
● La implementación fuera de línea garantiza la seguridad de los datos y los datos se aíslan de Internet.

II. Funciones de resaltado de la solución




III. Diagrama de conexión del sistema



La sala de reuniones es de planta XX cuadrados, X metros de largo y X metros de ancho, principalmente utilizada para diversas formas de reuniones, intercambios académicos y técnicos, capacitación interna. Para mejorar la eficiencia del trabajo y garantizar un control unificado y un recuerdo preciso de los contenidos de la reunión, se establece un conjunto de sistemas de transcripción de voz con equipos avanzados y tecnología perfecta, Que se puede unificar y utilizar en cooperación con el sistema de sonido de la conferencia de la sala de reuniones para realizar la adquisición de audio o grabación en tiempo real en diferentes escenas y la conversión en tiempo real en texto a través de la tecnología de reconocimiento de voz. Para conocer escenarios que necesitan mostrar contenido de voz, el sistema proporciona una visualización en tiempo real del contenido de voz en la pantalla a través de la tecnología de software. (Se puede editar según la situación real del proyecto.)

IV. Funciones del sistema
● Alta precisión: dependiendo de la tecnología de voz central, la tasa de precisión del Mandarín Estándar es de hasta 98%.
● Reunión eficiente: toda la grabación se transcribe automáticamente por máquina y el audio de 1 hora se lanza en 10 minutos al tiempo más rápido.
● Seguridad de la Conferencia: el uso de un servidor profesional independiente sin red puede evitar efectivamente la fuga de contenido e información de la Conferencia.
● Identificación personalizada: Apoye los nombres coloquiales personalizados de personas y lugares, dirija la formación de acentos especiales y personalice los idiomas locales.
● Separación de roles: en el proceso de reunión, el iniciador, participante, Presidente, Anfitrión, secretario, etc. de la reunión se pueden separar de los roles de cada uno y reconocer automáticamente como texto en tiempo real, lo que puede aumentar la eficiencia de la reunión doblemente. Reducirá en gran medida la intensidad de trabajo y la presión de la grabadora de la reunión.
● DiVisión de párrafo y oraciones: Al extraer características semánticas relacionadas con el contexto y combinar características del habla como pausas, información de frecuencia fundamental, se lleva a cabo la División de cláusulas y párrafos; uso integral de características semánticas relacionadas con el contexto y características fonéticas para resolver problemas de oraciones y segmentación.
● Texto suave: al usar características generalizadas y combinar características semánticas relacionadas contextuales y características fonológicas, el sistema elimina las palabras de parada, las palabras de tono y las palabras repetitivas de los resultados de la transcripción, haciendo que el texto suavizado sea más fácil de leer.
● Recuperación inteligente: Asociación automática de grabación y texto, reproducción de comparación de palabras y sonidos. Apoyar la investigación de texto completo y fácilmente rastrear datos históricos.
● Gestión de información de conferencias: apoyo a la creación de reuniones locales, gestión de reuniones, Exportación de registros de reuniones, construcción de bases de conocimientos.
● Aplicable a una variedad de escenarios: aplicables a reuniones de oficina, informes de trabajo, conferencias académicas, capacitación, entrevistas y otros escenarios.

V. Introducción de los dispositivos principales
Interfaz de software del servidor de transcripción de voz D7601ES
El sistema de transcripción de voz inteligente proporciona capacidades de reconocimiento de voz y reconocimiento de archivos de grabación en tiempo real para satisfacer una serie de necesidades de transcripción de texto en tiempo real, como reuniones diarias, informes y discursos, mando y despacho, y arreglos de grabación, que realizan una colección de audio o grabación en tiempo real en escenarios de conferencias, Y conversión en tiempo real en texto a través de la tecnología de reconocimiento de voz.



Software de terminal de transcripción de voz D7601CS
El sistema tiene una función básica como gestión de audio de conferencias, corrección y edición en tiempo real y transcripción de texto en tiempo real. Además, proporciona marcas clave, optimización de palabras clave y otras funciones para facilitar y organizar rápidamente los materiales de la Conferencia; proporciona segmentación automática, palabras de pausa, palabras de tono, repita la eliminación de palabras y otras funciones para optimizar automáticamente los resultados del texto; y proporciona la función de búsqueda de texto completo para una fácil recuperación del audio histórico.



Software de transcripción de voz para pantalla grande
De acuerdo con las necesidades de diferentes conferencias, el sistema no solo puede editar el primer borrador de los resultados de la transcripción en tiempo real, pero también mostrar los resultados de la transcripción de voz en tiempo real a través de la pantalla de la placa de visualización, y el color de la fuente y el color de fondo de la placa de visualización se pueden ajustar de acuerdo con la situación real.


Servidor de transcripción de voz D7601DS AI


Como el equipo central del sistema de transcripción de voz de conferencia inteligente, el servidor de transcripción de voz AI proporciona principalmente Procesamiento de servicios de grabación, transferencia de datos y otras capacidades; el ordenador portátil del control principal se utiliza principalmente para desplegar el software del cliente, controlar el inicio y el final de la Conferencia, y proporcionar la operación diversa de la función.
El Servidor de transcripción de voz recoge directamente el audio del anfitrión de la Conferencia a través del codificador de audio, completa la colección de voz en tiempo real en la Conferencia, transcribe automáticamente la voz para la separación de roles, y envía el resultado de la transcripción al software del cliente en tiempo real. Con la interacción manual simple, el contenido transcrito de la máquina se puede editar, modificar y escribir. Después de la reunión, se forma un registro de información de la reunión que es fiel al texto original, y las actas clave de la reunión también se pueden extraer de acuerdo con el registro de la reunión.
Para escenas de conferencias a gran escala, además de la reunión regular, también se puede mostrar en la pantalla en tiempo real, que se puede mostrar en el lugar.

VI. Aplicaciones


  • Tel:86 020 37166520
  • Email:Export@dsppa.com
  • Dirección:Ciudad de Jianggao, distrito de Baiyun, Guangzhou, China